




例えば、ある病気に効く新しい医薬品を開発する場合、製薬会社ではこれまでの実験データから集積した莫大な数の化合物ライブラリーから、どのような化合物がその病気の治療に役立つのかを調べます。すると、少し効果のあるものは数百の単位で見つかりますが、それらの化合物をそのまま薬にしても、病気に対する効果が小さ過ぎます。

実は、化学者がたくさんの化合物の構造を見ても、どのような特徴をもつ化合物が薬となり、逆にどのようなものが薬にならないか、分かりません。そこでデータマイニングの技術を使って、薬となるような特徴を取り出すのです。

私たちが実際に新薬を合成するわけではありませんが、当研究室の知識ベースが新薬の設計に役立ったと聞くと、うれしいものです。こうした研究の醍醐味を知ってほしいので、2年次に開講する「分子生命情報学」の授業では、分子や生命の課題に取り組むための基礎知識を講義するとともに、製薬会社や医療情報処理の会社などの外部講師のお話を聞く機会も設けています。

このデータマイニングの方法は他の分野にも適用できることが多く、当研究室ではプロ野球データからの作戦解析にも取り組んでいます。この研究はなかなか難しいですが、いずれ私たちが作ったシステムがテレビのプロ野球解説に活かされ、興味深い放送になることを期待しています。
毒性のある化学物質をラットに投与したときの白血球や赤血球のデータを解析しています。この研究の目的は、化学物質をいくつかのグループに分けることです。先行研究がないので、「目的を実現するためにはどういったものが必要か」「何を行えば良いのか」などを自分で一から考え、研究を進めています。自分なりに考えて行動した結果が、目に見える形として研究成果に現れたときには、非常に達成感を感じますね。

統計学やパターン認識、人工知能といったデータ解析の技法を用いて大量のデータを解析し、その中に潜む項目間の相関関係やパターンなどを取り出す技術。マイニングは「採掘(mining)」を意味する英語。膨大に収集したデータの山から貴重な情報を採掘することから名づけられた。
データマイニングの技術は、1990年代からの情報技術・コンピュータ技術の急速な発展にともない、発展・普及してきた。
構造活性相関とは、化合物の分子構造と医薬活性や副作用、毒性とのあいだの因果関係を研究する領域です。結果は数式で表す場合もありますし、特徴的な化学構造を並べて百科事典のような知識ベースに示す場合もあります。
新薬開発の効率化や副作用の低減、犠牲となる実験動物数の減少に有効です。