創業者の理念をAIで継承、ファウンダーAI開発


奥田耕己の思想をリアルタイム対話で再現
トランスコスモスグループのAIコンサルティング会社、マシンラーニング・ソリューションズは、トランスコスモスの創業者である故奥田耕己の理念継承を目的とした人物再現AI「ファウンダーAI」を開発しました。写真1枚と講演録をもとに応答内容・声・姿を再現し、外部AIサービスに依存しない完全ローカル環境においてリアルタイム対話を実現しています。
創業者の思想伝承の必要性と開発背景
トランスコスモスの創業者である奥田耕己から直接薫陶を受けた人物が年々少なくなる中で、その思想・経営観をリアルに伝承するための新たな手段が求められていました。マシンラーニング・ソリューションズは、創業者の理念を次世代に継承していくことを目的に、トランスコスモスの協力のもと、最新の生成AI技術を活用した人物再現AIの開発に取り組みました。
リアルタイム対話を実現する技術的工夫
開発したファウンダーAIは、ユーザーの質問に対し、奥田耕己本人がその場で答えているような体験を提供します。タブレットや入力画面から受け取った質問に対して、本人の考え方を反映した応答を生成し、本人の声で読み上げ、3Dアバターが音声に合わせて口・表情を動かしながら回答するという仕組みです。通常、応答文がすべて生成されてから音声合成・映像生成へ進む構成のところを、生成された文字列から順次後続の工程に流す構成としました。処理手順を最適化することで応答時間を大幅に短縮し、奥田耕己がその場で応じているような対話体験を実現しています。
完全ローカル環境での安全な運用
応答生成・音声合成・アバター生成のAIモデルはMac mini上で動作する構成であり、外部AIサービスやインターネット接続に依存せずに利用できます。応答モデルはオープンソースの言語モデルに対し、講演録から構築した質問・回答データを用いて奥田耕己らしい応答スタイルを実現するよう追加学習を実施。さらに、対応範囲外の話題には応答しないようにする学習を行うことで、安全性と応答品質を両立させました。音声合成モデルではローカル環境でのリアルタイム推論に適した軽量・高品質な音声合成方式を採用し、クリアな講演音声を厳選して学習させることで、声質・口調・テンポの再現性と聞き取りやすさを両立しています。アバター合成では写真1枚から立体的なアバターを生成する技術を活用し、アバターを応答音声に合わせて動かすことで計算負荷を抑え、ローカル環境でのリアルタイム応答を実現しました。
人材育成や文化財保存など幅広い応用を展開
今後は講演録以外の資料を学習データに加えて回答できる範囲を広げるとともに、奥田耕己をよく知る人物による評価フィードバックを取り込み、応答品質を継続的に向上させていきます。また、本プロジェクトで構築したリアルタイムアバター対話AIの構築技術は、理念の継承にとどまらず、人材育成、教育、文化財・記録保存など、幅広い領域への応用が期待されます。トランスコスモスグループ全体でAIの活用を強力に推し進め、グループ各社におけるAI活用の取り組みへ展開し、お客様企業への価値提供およびDXの加速に貢献していきます。
出典: https://prtimes.jp/main/html/rd/p/000002098.000000183.html