タンパク質の構造データを学習・検証して創薬プロセスの迅速化を支援
三井情報は、創薬において「病気の原因となるタンパク質が低分子医薬品と結合する位置を予測するソフトウェア「DeepSeeker(ディープシーカー)」に新たな機能を追加し、4月1日より提供を開始する。
今回の機能追加では企業や研究所が独自に、タンパク質の構造データをDeepSeekerに学習させ、予測したいタンパク質に合った独自の学習モデルを作成できるようになった。三井情報はDeepSeekerの提供を通じて、創薬プロセスの効率化を後押しし、低分子医薬開発を支援していく。
低分子化合物を有効成分とする低分子医薬品は、標的タンパク質に対してその医薬品が結合することで効果を発揮する。そのため、低分子医薬における創薬プロセスでは、標的タンパク質にある医薬品が結合し得る部位を特定し、その部位に結合できそうな化合物(ヒット化合物)を見つける探索プロセスがある。ヒット化合物になり得る候補化合物は数千万種類以上あり、それらを手作業で評価していくには大変な労力が必要である。
こうした中、三井情報は、画像認識技術を利用してタンパク質の構造データを学習させたAIの活用で、医薬品が結合し得る部位を予測するDeepSeekerの提供を昨年4月に開始した。従前のバージョンは予測機能のみでしたが、独自の学習モデルを作成したいとユーザーから要望を受け、学習機能を追加した。
これによって、ユーザー自身が予測したいタンパク質に合った独自の学習モデルを作成できるようになり、創薬プロセスの迅速化が期待できる。
「DeepSeeker」の追加機能は、次の通り。
①タンパク質の構造データの学習
タンパク質の構造データをAIに学習させ、独自の学習モデルを作成できる。これにより、標的タンパク質の結合部位の予測精度が向上する。
②学習モデルの検証
タンパク質の構造データを学習させた後、標的タンパク質の結合部位が正しく予測されるか検証できる。検証では結合部位が既知のタンパク質のデータを用いて学習モデルの精度を確認する。
③デ ータの作成機能
AIに学習させるための入力データへ変換する機能を搭載。PDB形式のデータに対応し、公共データベースにある多くのタンパク質構造データが学習可能になった。
三井情報は1970年代よりバイオサイエンス事業に携わっており、製薬企業・アカデミアとの共同研究等を通して創薬およびヘルスケア分野におけるIT技術の活用に力を入れてきた。
これまで培ったナレッジをもとに開発した「DeepSeeker」の提供を通じて日本の創薬進展への貢献を目指す。