Network Users' Group ``wheel'' / Dai ISHIJIMA's Page / 多言語データベース

PostgreSQLによる多言語(多国語)単語データベース

解説

フリーのデータベースソフトとして有名なPostgreSQLには、 という特徴があります。 この特徴を十分に活用して、 英語、日本語、中国語、ドイツ語、 ヒンディ語、モンゴル語、タイ語、ベトナム語の 8ヶ国語の 単語および音声・文字を扱える マルチメディアデータベースを構築しました。

また、このデータベースを使ったアプリケーションとして、 PHP3を使ったデータベース検索ソフトを開発しました。 さらに、多言語対応でないパソコン(ブラウザ)や、 iモード携帯電話(Compact HTML)からもアクセスできる ソフトもあわせて作成しました。

自動翻訳や自動通訳といった コンピュータによる多言語処理を実現するためには、 その基盤となる多言語のデータベースの整備が必要になります。 現在、日本語や西欧諸国の言語データの整備は比較的進んでいますが、 アジア系言語では進んでいるとは言えない状況です。 ここに上げたテスト版がこの状況を改善するささやかなきっかけとなれば と思います。

PostgreSQLは、Mule内部コードやUTF-8という形で多言語情報を扱えますが、 実際に多くの国の言葉を同時に扱ったアプリケーションは そうそう多くはないのではないかと思います。 せっかくいろんな言語が扱えるようになったんですから、 じゃんじゃん活用しましょう :-)

テスト版

若干、データにおかしなところがありますが、 ご容赦ください。 なお、ここでのプログラムは、「実用的なもの」というよりは、 PostgreSQLやフリーソフトが多言語処理の基盤となりうるかを 「検証するためのもの」です。

お知らせ

関連情報


本ページ、あるいは本データベースアプリケーションに関して、 ご意見、ご感想、ご要望などありましたらお気軽にお問い合わせください。