![]() 清木 約8万の英単語を2115の基本語で定義している「ロングマン」という英語の辞書があります。つまり2115語を使えばかなり多くの概念や感情が説明できるわけです。これを利用してベクトルを使ったある空間を作ります。これは言葉と言葉の、あるいは言葉とメディア情報の間の意味を解釈するための意味空間で、画像や言葉のデータをこの空間の中に点として散りばめます。ちょうど宇宙空間の中に太陽とか銀河系などが散りばめられているイメージですね。そこに距離が近い星を探しなさいとか、または色が近い、大きさが近いなどのキーワードを与えれば、それらのいろんな近さを短時間で計算して出すことができます。 BBB 日本語ではだめなんですか。 清木 どうも日本語ではうまい辞書がないので、今のところ、英語に置き換えています。 BBB 夢のデータベースですね。実用化はいつですか。 清木 実用実験を行っているのでかなり近い将来に実用化できます。 BBB 他に今のデータベースの最先端の研究を紹介して下さい。 清木 最近、よく行われている研究はマルチメディア・データベースで、これももう一つのプロジェクトです。ネットワークで多種多様のデータが流通すると今までのデータベースシステムは対応できませんよね。今は音や画像のデータベースはリンクして検索できませんが、こうした異種のデータベースをダイナミックに結合して、新しい価値生成を実現するものです。具体的には、すべてのローカルデータベースに対して、一段抽象度の高いレベルですべてのデータベース操作を行えるメタデータベースを作り、それを利用して異種のデータベースを結合します。 また、時間情報や空間情報によるデータの検索する時空間データベースも話題になっています。時間情報、空間情報をいかに扱うかが重要な課題になっている。たとえばGIS(地理的情報システム)のような空間のデータベースを介して、位置的な関連をダイナミックに求めたりするものです。 また、データマイニング、またはノレッジマイニング、データウエアハウスというトピックスもあります。実際に現実に起こった大量の事実情報をさまざまなツールで用いて解析して、その中に潜んでいるルールや知識をダイナミックに引き出す分野の研究も活発になっています。直感的に人間が気が付かないような知識とかルールとかがときどき、あるいは頻繁に現れる。それによって新しいビジネスチャンスなどを作り出すことができます。アメリカでは企業が意思決定する道具として使いはじめています。 BBB これがあれば、山一証券の破綻も防げた? 清木 それはわかりませんねえ(笑い)
|
トップ | 前ページ | 次ページ |