AIサービスの実用化を支え、日本のDXを推進する。
株式会社言語理解研究所
代表取締役社長 樫地 真確
1978年生まれ。1997年、徳島大学工学部(現・理工学部)に入学。4年次に青江順一教授の研究室を選択し、自然言語処理の研究に携わる。2001年、大学院に進学した頃に青江教授より「大学発ベンチャーを立ち上げるので一緒にやろう」と声をかけられ、大学院在籍のまま青江氏と共に2002年に株式会社言語理解研究所を設立。修士・博士まで進みながら同社の業務を継続し、修了後も自然言語処理領域の研究を深める。2020年、青江氏の代表取締役会長就任とともに、代表取締役社長に就任。
※所属や役職、記事内の内容は取材時点のものです。
大規模言語モデルの抱える欠点を補完する技術。
OpenAI社のリリースしたChatGPTが大きな注目を集めています。ChatGPTは、膨大なテキストデータをディープラーニングによって解析する「大規模言語モデル(LLM:Large Language Models)」と呼ばれる技術をベースに、対話型に特化した生成AIの一種です。このChatGPTを活用したサービスが次々に登場しており、社内文書作成などビジネスで活用されている方も少なくないでしょう。
しかし、これらのLLMは、まだいくつかの問題を抱えています。よく指摘されるのが、あたかも本当であるかのように誤った情報を集めてくる「ハルシネーション」です。もう一つ、同じ質問を繰り返しても、その度に回答が異なる「冪等性(べきとうせい)」という問題もあります。
これは、LLMをはじめとする生成AIの大半は確率論によって回答を作っているのが要因の一つに挙げられます。「この言葉が来たら次はこうなる確率が高い」という手法のため、毎回同じ答えになりにくいのです。
自身のレポートをまとめる、社内文書を作るといった目的なら、ハルシネーションや冪等性をそれほど重く捉える必要はないでしょう。ですが、カスタマー向けサービスや厳密な正確性が要求される分野で現在のLLMを用いるには、なお高いハードルが存在するといえます。
隆盛の時代を迎えながら、なお課題を抱えるLLMがこういった状況にある今、私たち言語理解研究所(ILU:Institute of Language Understanding)が積み重ねてきた自然言語処理に関するデータベースや言語処理エンジンといった技術は大きく発展する可能性を秘めています。
人間の知識をベースとしたシステム。
ILUの創業は2002年。創業者・青江順一は徳島大学の現名誉教授で、1980年代から自然言語理解の研究を続けていました。約20年にわたる青江の研究成果を土台に、当時珍しかった「大学発ベンチャー」として出発。それから20年以上が経過しましたが、今も自然言語処理に関する各種の技術とノウハウが事業のコアとなっており、様々な実用システムの開発を支えています。
当社は文章処理のために必要な「知識」を人間がコンピュータなどの機械に教え込み、それに基づいて処理させる「知識駆動システム」について研究、開発してきました。人間の知識そのものが基盤となるため複雑な処理もこなせますし、誤りが発生した場合のフィードバック・修正も可能です。
「知識駆動システム」と「生成AI」を組み合わせた「クラフトAI」という独自の手法により、ILUはハルシネーションや冪等性といった課題を克服した高精度処理を実現しています。
信頼性の高い処理を行うための膨大な知識は、独自のデータベースに格納しています。この大規模言語知識データベースは、国語辞典のハイパーバージョンのようなもので内容は常時更新されています。そして、このデータベースを使って実際の処理を行うのが200種類に及ぶ言語理解エンジンです。
お客様のご要望をお聞きし、「その目的であればデータベースのこの部分を使い、こういったエンジンを仕立てましょう」という具合に、最適の形にカスタマイズするわけです。
ILUのシステムは膨大なテキストデータから求める情報だけを抽出する「データマイニング」や、多様な情報からある論点の記事を定められた文字数で作成する「文章生成・要約」、人間とコンピュータ・AIの自然な対話を実現する「対話理解」、ある言語の文章を別の言語に翻訳する「機械翻訳」といった分野などで活用されています。
お客様として、大手新聞社や放送局、情報出版会社といった情報の正確性を重視する会社が名を連ねていることからも、当社システムの精度に寄せられる信頼の厚さが理解いただけるのではないでしょうか。
生成AIの隆盛が、追い風になる。
「自然言語処理」は一般に馴染みの薄い分野ですが、ChatGPTに代表されるLLMの活性化により、以前と比べ身近になりました。これは、当社にとっても追い風になります。
ChatGPTなどを利用して手軽にサービスを開発し、事業に活かそうという会社もたくさん出てきています。競合が増えているという意味ではある種の危機感もありますが、私たちはそもそも生成AIブーム以降に出てきた会社と同じフィールドで競おうとは考えていません。
創業前の青江研究室で約20年、創業から約20年、合計約40年にわたって積み重ねてきた大規模言語知識データベースと言語理解エンジンが生み出す高精度の自然言語処理は他社が容易に真似のできるものではありません。
OpenAI社やマイクロソフト社、Google社など超大手の参入により、LLMの活性化・普及がますます促進されるのは間違いありません。ChatGPTなどの登場によって「当社でもLLMを使って何かできるのではないか?」と期待する企業もどんどん増えています。
しかし、専門的な知識を必要とされる分野や先行事例が乏しい分野については、LLMがどれだけ膨大なデータを機械学習によって習得しても、完全にカバーするのは難しいでしょう。ハルシネーションや、冪等性という課題も依然として残ります。これらの課題が壁となり、思うようなサービスの開発に結びつかない企業も多いと思われます。
当社はこういったLLMの弱点を補う技術を持っています。専門的な分野や先行事例の乏しい分野において当社の知識データベースを活用すれば、LLMにイチから勉強させるより効率的にサービスを構築できます。
LLMの精度を高めるための「AIが理解しやすい命令や質問」といったノウハウも蓄積しています。おかげさまで「こういったことができないか」というお客様の相談は、これまで以上に増加しています。
Sansanグループの一員となり、シナジーを発揮。
2023年、ILUはSansan株式会社の連結子会社となりました。同社は法人・個人向けの名刺管理サービスに代表される「働き方を変えるDXサービス」を企画・開発し、提供する会社です。
グループの一員となって感じるのが、成長志向の強さです。今までのILUは研究色が強めで、PR活動などを積極的に行っていたわけではありません。一方、Sansan社は、新しいことにチャレンジする意欲が高く、スピード感も違う。最先端分野で事業を行う会社の凄みに大きな刺激を受けます。
Sansanグループの一員となり、様々な影響を受けることで私たちは良い方向に変わっていけるのではないかと期待が膨らんでいます。同社のR&Dチームとは既に交流しており、関係は今後さらに深まっていくでしょう。
また、Sansan社は徳島県にラボを開設するなど、徳島にもしっかりとした基盤があります。ILUとSansan社の技術者が徳島のラボで共同研究したり、互いに出向し合って課題に取り組む、といったケースも今後は増えるかもしれません。
もちろん、20年積み重ねてきたやり方を、急に180度変えるつもりはありません。お客様の要望に合わせ、ニーズに対応した技術を提供する、というスタンスは変わりません。良い刺激を徐々に取り入れ、力を合わせて一つの目的に向かっていきたいと思います。そうすれば、互いの事業にシナジーが生まれるでしょう。
お客様に寄り添う姿勢を大事にしたい。
汎用的なプロダクトやサービスをあまり持たず、オンリーワンの受託開発案件が多いILUにとって、最大の財産は人です。お客様の要望に耳を傾け、どのようなニーズにも合わせたシステムを構築する人がいてこそ、当社の発展があります。
LLMの活性化という追い風の中、事業を拡大させるには、さらなる人材が不可欠です。これまではいわゆるリファラル採用が中心で、大学発ベンチャーということもあり、研究室出身者をそのまま社員として迎えるケースも多い状況でした。
しかし、Sansanグループの一員となり、スピード感をもって成長するためには、これまでと違ったカラーやバックボーンを持つ人材を迎え入れたいと考えています。新たに加わっていただく方は、スキルや経験年数に応じてエンジニアやチームリーダーとして、場合によってはプロジェクトマネジャーとして活躍してほしいと考えています。
新たな人材を採用するうえで最も重視するのは、私たちと同じ目線で仕事に取り組んでいただけるかどうかです。当社は常にお客様に寄り添い、要望に応えることを大事にしてきました。この先もこれを変えるつもりはありません。新しいチャレンジやスピード感を持った動きは、あくまでお客様に寄り添った上でのことです。
お客様に寄り添い、地道でも着実にその思いに応えていきたい。そんな姿勢を持った人と共に、未来に向かって独自の価値を作り上げていきたいと考えています。