レブコムの音声AI論文がICASSP2026に採択、音質判定技術を提案


ICASSP2026で音声AI技術の論文が採択
株式会社RevComm(レブコム)の研究開発組織RevComm Research(レブコム・リサーチ、RCR)による論文が、2026年5月4日から8日に開催された音声・音響信号処理における世界最大規模の国際学会「ICASSP 2026」(バルセロナ、スペイン)に採択されました。採択された論文は「Automatic Estimation Of Speaker Diarization Error Rate Based On Features Of Audio Quality And Speaker Discriminability」であり、AIが音声を正しく聞き分けられるかを事前に予測する技術に関するものです。
音声の解析しやすさを自動判定する技術
近年、音声認識や会議の自動文字起こし、話者ごとの発言整理など、音声AIの活用が広がっています。しかし、これらのAI技術の精度は「録音された音声の状態」に大きく左右されます。雑音が多い、複数人の声が重なっている、話者ごとの声の違いがわかりにくいといった状況では、AIが正しく解析できないことがあります。
本研究では、録音された音声がAIにとって「解析しやすい音声かどうか」を自動的に判定する技術を提案しました。音声そのものの品質(雑音の少なさや明瞭さ)と、話している人同士の声の違いのわかりやすさという2つの観点から特徴を分析し、AIが話者をどの程度正確に分離できるか(エラー率)を事前に予測します。
AIモデルと録音環境の問題を切り分け可能に
実験の結果、この予測値と実際のエラー率には高い相関があることが確認され、本手法の有効性が示されました。この研究成果により、音声AIの解析結果がうまくいかなかった場合に、AIモデルそのものに原因があるのか、それとも録音環境に原因があるのかを切り分けやすくなることが期待されます。今後は、より高品質な音声AIサービスの提供や、録音環境改善の指標としての活用を目指していきます。
ICASSPについて
「ICASSP」(International Conference on Acoustics, Speech, and Signal Processing)は、米国電気電子学会の中で最も長い歴史を持つ信号処理学会である「IEEE Signal Processing Society」が主催する国際学会です。
出典: https://prtimes.jp/main/html/rd/p/000000362.000037840.html