コンセプトで探索できる科学情報スペース

    現在、医学を含む科学論文はアブストラクトだけでなく、オリジナルの論文全体がWebに掲載され、インターネットで読めるようになってきた。Journal of Clinical Investigationのように無料ですべて公開している雑誌もあるが、購読料を支払わないとFull Textは見れないものの方が現時点では多い。しかし、科学論文がWeb上に掲載されているということはいわゆる”Digital Libray"が全世界規模で作られつつあるということである。今後、科学論文の検索はAbstractだけでなく、Full TextさらにはMultimediaのファイルも対象にした、世界規模で行われるようになると予想される。

    一方で、MEDLINEは現在まで語句の一致を探して、その語句を含む論文のリストを作成して、提供するというデータベースシステムであった。特に、Medical Subject Headings (MeSH)という検索用の語句を平均14個それぞれの文献に割り振ってあり、それをインデックスとして、高速に検索が出来るようにしてある。通常データベースはその語句を全文検索で検索すると時間がかかるので、検索用のインデックスファイルを作成しておいて、その中で一致する語句を探し、そこにラベルされている元の文献ファイルへのポインターを介して手繰り寄せるような構造をとっている。現在のMEDLINE検索は語句の一致するものを含む文献のリストが作成されて表示されるので、自分が意図しない文献も含まれてくるし、逆に絞り込みを強くしすぎると、目的とする文献が除外されてしまう可能性が出てくる。

    そこで、2年前にアリゾナ大学のSchatzとChenはDigital Libraries Initiativeの活動の一つとして、Semantic Indexing Techniqueの応用を検討し始めた。Semanticというのは言語学のことである。そして、かれらは現在1千万あるMEDLINEの文献検索にこの技術を応用し、NCSAのスーパーコンピュータを使って、試験的な運用を始めている。1千万の文献をMeSHを使って、1万のコミュニティーに分割し、つまり、分野に分け、コンセプトでMEDLINEの文献を検索できるようにした。これは世界中に文献が散らばって、サーバーに格納されている場合の応用も考慮したシステムである。実際に試用したドクターの感想は”It's wonderful. I'm getting far more useful information out of MEDLINE, and I'm getting it in a time frame that I was actually able to get informaiton I needed while the patient was in my office."ということだそうである。

    (Community Architectures for Network Information Systems (CANIS) (http://www.canis.uiuc.edu/)のMEDSPACE (http://www.canis.uiuc.edu/medspace/)を参照のこと)

    ということで、今、医学論文の検索と利用法は新しいパラダイムに入りつつある。しかし、検索した論文を読んで、理解して、妥当性を判断し、医療や研究に応用するのはわれわれであることを忘れないようにしよう。

    文献:
    Schatz BR: Information retrieval in digital libraries: Bringing search to the net. Science 1997: 275:327-34.
    Alper J: Digital libraries: Taming MEDLINE with concept spaces. Science 1998: 281: 1785.



    [Return to What's New About This Home Page!] [Return to Techniques in Hepatology] [Return to Home Page]