メインコンテンツまでスキップ

音声イベント検出

音声イベント検出(SED)は、単純な「ウェイクワード」認識を超えて、音響環境のより広い理解へと進化します。Syntiant® NDPを使用することで、デバイスは音声起動と同じ電力効率で、ガラスの破損、アラーム、赤ちゃんの泣き声などの非音声シグネチャを認識するように訓練できます。これにより、完全な暗闇でも機能する能動的なセキュリティおよび監視態勢が実現します。

  • 高度な音声検出(ガラス破損とアラーム): 従来のガラス破損センサーは単純な衝撃や周波数閾値に依存していることが多く、キッチンの騒音による高い誤検知率につながります。NDPはディープラーニングを使用して、ガラス破損の特定の時間的・スペクトル的シーケンスを識別します:衝撃による最初の「ドスン」という音に続く、破損した高周波の「きらめき」。

  • 安全監視(赤ちゃんの泣き声とアラーム検出): スマートナーサリーや高齢者ケアアプリケーションでは、NDPは煙警報から一般的なテレビノイズや家庭の会話を区別できます。このローカル処理により、アラートが瞬時であり、機能するためにアクティブなインターネット接続を必要としないことが確保されます。

  • 音響シグネチャマッピング: 環境干渉に対してモデルが堅牢であることを確保するために、マイクとハウジングの周波数応答 (H(f)) を測定して、構造的な減衰を補正します。

数式:システム周波数応答(H(f)H(f)

H(f)=Y(f)X(f)H(f) = \frac{Y(f)}{X(f)}

(ここでX(f)は入力音声信号であり、Y(f)はデバイスエンクロージャーを通過した後にNDPがキャプチャした信号です。)

  • 動物の音と家庭的なパターン認識: NDP120シリーズは犬の吠え声や水漏れの音などの専門的なクラスで訓練できます。スペクトル重心 (SC) を計算することで、システムが高音のアラームと低周波のハムを区別できます。

数式:スペクトル重心(SCSC

SC=n=0N1f(n)x(n)n=0N1x(n)SC = \frac{\sum_{n=0}^{N-1} f(n)\cdot x(n)}{\sum_{n=0}^{N-1} x(n)}

(ここでf(n)はビンnの周波数を表し、x(n)はそのビンの大きさを表します。)

⚠️💡***「ネガティブデータセット」戦略***

「訓練する際、「ネガティブ」データは「ポジティブ」データと同様に重要です。掃除機、食洗機、大きな音楽の録音を訓練セットに含めてください。これにより、NDPはこれらの高エネルギーな音を「バックグラウンド」として扱うように訓練され、真のセキュリティイベントが検出された場合にのみホストシステムの完全な電力を消費するようになります。」