未来の人工知能!NXPの音声認識技術が活躍!

NXPの音声認識技術

“Ok! Google! 音楽を再生して!”って日本の家庭でも聞こえてくる日は近いですね。Googleは2017年夏にも日本市場にグーグルホームを投入すると明らかにしました。 ボイスコマンドでスマホなどの音楽を再生したり、メールを送ったり、交通状況を調べさせたり、各部屋のグーグルホーム機器と連動して離れた部屋の照明を制御したりできるようです。

先日、NXPは音声認識技術でアマゾンと協業とのニュースが報じられています。

NXPは音声認識技術に力を入れていますね。

” NXP Semiconductorsは2017年4月、Amazonが提供するクラウドベースの音声認識サービス「Amazon Alexa」対応の機器開発に向けた「NXPリファレンスプラットフォーム」を発表した。Alexaに対応する音声制御機器の開発を簡素化することができる。NXPリファレンスプラットフォームは、Amazonがアシスタント端末「Amazon Echo」向けに開発したファーフィールド音声認識技術や、デバイス側の制御プログラムを作成するための開発ツール「Alexa Voice Service(AVS)」などを統合した製品。”

引用 ITmedia inc. 『NXP、音声認識技術でAmazonと協業』EETimes Japan, 2017年4月17日

このニュースは、i.MXをベースにしていますが、NXPはi.MXプロセッサのみならず、マイコンにおいても音声認識技術に力を入れています。

LPC5411xシリーズで音声認識をサポートしています。 今回は、このLPC541xxシリーズについて見ていきましょう。 では、要点から

要点

  1. デュアルコアプロセッサアーキテクチャを採用している
  2. DMIC(デジタルマイクサブシステム)により音声認識をサポート
  3. 高電力効率

では、行って見ましょう。

ブロック図

LPC541xxブロック図 出典 NXP LPC5411x製品ページ

いきなりブロック図ですが、デバイスの特徴を知る上で最も重要なものですね。

デュアルコア

LPC541xxシリーズの最大の特徴的は、ARM Cortex-M0+/Cortex-M4Fのデュアルコアでありながら超低消費電力で駆動することが可能で、Cortex-M4Fは80uA/MHz、Cortex-M0+は60uA/MHzを達成し驚異的な低消費電力であるとのことです。

数年前までは、200uA/MHz程度だったことを考えると、半分以下まで効率が改善されています。

デジタルマイクサブシステム

また、DMIC(デジタルマイクサブシステム)を搭載(LPC5411xで対応)しており、デジタルマイクで音声をキャプチャし、音声認識を行うことが可能なデバイスになっています。

音声認識エンジンはソフトウェアで処理するが、3rdパーティ製(Sensory社)により提供されるとのことです。

センサーアプリケーションに最適なアーキテクチャ

ヘテロジニアスとも言える非対称デュアルコアアーキテクチャ(Cortex-M4F/Cortex-M0+)により、Cortex-M0+ではセンサー等の定期的なモニタリング動作、一方でCortex-M4Fでは取り込んだセンサーデータのアルゴリズム処理を行うことで、いわば適材適所的な使用が可能です。

これにより、各コアで適切な処理を行い、役割を分担することで超低消費電力が実現できるわけです。特に、モバイルやウェアラブル、フィットネス、ヘルスケアなどの小型センサーアプリケーションに特に向いているデバイスと言えます。

音声認識技術

もう一つの特徴である音声認識技術は、コアを駆動させることなく第一音声の検出が可能であることが特徴です。

つまり、コアはスリープのままで音声を検出できるということです。

音声検出には、HWVAD(ハードウェア・ボイスアクティビティ・ディテクション)や各種フィルタがハードウェアとして内蔵されており、音声の包絡線やノイズフロアなど利用して音声を検出する技術です。

第一音声として検出されると、割り込みが上がりコアが起動されます。続いて、アルゴリズムエンジンによる音声認識やボイストリガー制御を行うというフローになります。

現在、NXPではSensory社のTrulyHandsFreeのボイストリガーエンジンを使用してプロモーションしています。

OM13090というLPCXpressoボードでは、この音声認識技術を評価できるようになっています。 別の記事では、このOM13090を実際に動作させて、ご紹介していきたいと思います。

まとめ

NXPは音声認識技術にとりわけ力を入れており、Amazonとの協業というニュースも出回っています。マイコン領域でもLPC5411xでも音声認識技術に力を入れているようです。

今後、この音声認識技術を実際に動かして見たいと思います。

最後までお読みいただきありがとうございます。 もし、良かった!と思われたら、シェアして頂ければ幸いです。