ニュース

NTT、「人のように音を聞く」人工ニューラルネットワーク

NTTは、自然な音を聴き分ける人工ニューラルネットワーク(NN)が、音の振幅の変化に対して人間のような反応を示すことを発見した。これにより、人間の耳が音をどのように認識するかをより深く理解することができるようになり、将来的に、医療、福祉分野で、より人間の耳の仕組みに近いデバイスの開発など、応用が期待される。

人間は、音に含まれる様々な手がかりをもとに音を認識するが、音認識に重要な手がかりのひとつに、音の振幅の緩やかな時間変化のパターン(振幅変調:AM)がある。

研究では、自然音認識で訓練した人工NNに対し、知覚実験と神経活動記録実験をシミュレーションした。その結果、NNの構築の際に人間や動物の聴覚の性質を考慮していなかったにもかかわらず、人間のようなAM検出閾値の特性を示すことがわかった。これは、人間のAM検出閾値も動物と同様、進化や発達の過程で聴覚系が音認識に適応してきた結果得られた性質である可能性を示しているという。

また、その特性を得るためには自然な音に含まれるAMが重要であることもわかった。さらに、人間のようなAM検出閾値の特性を示すモデル内の領域が脳の下丘・内側膝状体・聴覚皮質と対応していることもわかった。これらの知見は脳の発達・可塑性や「聞こえ」の困難のメカニズムの理解にもつながる可能性がある。

例えば聴覚末梢に何らかの障害が発生すると、脳に届く信号の特徴も変化する。このような状態をモデル化できれば、難聴またはその補償によって生じうる脳の情報処理への影響について分析可能となり、医療、福祉等で人間の耳の仕組みに近いデバイスの開発につながる可能性がある。

AM処理以外の聴覚機能や、より一般の感覚機能へ拡張することも可能。例えば、両耳からの音の情報の統合処理は、AM処理と同じくらい深く研究されているが、人間の両耳音処理に関する心理学的な知見と神経科学的な知見の統一的な理解はあまり進んでいない。本研究のパラダイムを用いることで、これらの性質の起源やメカニズムを探ることを目指す。