車の音声認識の「性能」は千元の携帯電話ほど良くなく、技術の向上は難しい

車の音声認識の「性能」は千元の携帯電話ほど良くなく、技術の向上は難しい

最近、Automotive Newsのウェブサイトによると、音声認識技術は数年前から自動車分野に導入されているものの、現在でもこの技術にはさまざまな小さな問題が残っているという。

Google Now、AppleのSiri、MicrosoftのCortanaはすでに何百万人ものスマートフォンユーザーに優れたサービスを提供しているが、自動車メーカーは信頼性が高く効果的な音声認識システムの開発にまだ取り組んでいる。

Nuance Communications は昨年、 BMW 7 シリーズの再設計に特化した音声認識技術のアップグレード パッケージを発売しました。

JDパワーが発表した「2016年米国初期品質調査」レポートによると、自動車購入者からの苦情のうち23%が車両情報システムに関するもので、音声認識システムに関する問題もかなりの割合を占めている。米国自動車品質調査部門社長のルネ・スティーブンス氏は記者団のインタビューで、「われわれの見解では、音声認識システムに起因する不具合は依然として自動車消費者の最大の苦情問題だ。自動車メーカーは今年この分野でいくらかの改善を図ったが、進歩はまだ遅い」と語った。

レイニー・スティーブンス氏はまた、音声認識システムに関する苦情は高齢の自動車所有者だけから来ているわけではないと指摘した。実際、1960年代と1970年代に生まれたアメリカ人、およびミレニアル世代とベビーブーマー世代の間では、車両音声認識は車内で最も使いにくい機能のトップ5に挙げられています。

マサチューセッツ州バーリントンに本社を置き、車載音声制御システムの世界第1位サプライヤーであるニュアンス・コミュニケーションズ社は、車載音声認識技術は常に進歩していると述べている。ニュアンス・オートモーティブのゼネラルマネージャー、アーン・ウェイル氏は、BMW 7シリーズセダンの音声認識機能は、技術がどのように改善できるかを示す一例であると語った。同社は昨年、BMW 7シリーズの復刻版専用に開発された音声認識技術アップグレードパッケージを発売した。

アーデン・ウィアー、ニュアンス・オートモーティブ社ゼネラルマネージャー

同氏は、アップグレードされた音声認識ソフトウェアは車の所有者が発した音声コマンドを理解し、車の所有者の声を短いメッセージに変換して送信できると紹介した。車の所有者は、システム実行プロセス中に一時的に音声コマンドを追加することもできます。機能面の改善にはまだ不均衡が残っていますが、信頼性は向上しました。例えば、上記音声システムは電話番号の認識能力が非常に高く、音声ダイヤルの認識精度は90%~95%にも達します。今日の音声認識システムは、定型的なコマンドを理解して実行する能力が向上していますが、飼い主の要求に応じて「興味深い場所」を見つけるなど、あまり定型的ではないコマンドを実行するとなると、まだ少し不器用です。

初期の音声認識システムは、音声コマンドを実行するためにデータベースに依存していました。これらのデータベースのデータは、スターバックス、エクソンのガソリンスタンド、ヒルトンホテルなどのチェーン店の地理的位置など、比較的単純なものでした。新しい車載音声認識システムはクラウドサーバーに接続されています。音声コマンドが正確に理解されていれば、クラウド サーバー内の任意のビジネス拠点を見つけることができます。

実際にユーザーが使用してみると、さまざまな問題が発生します。たとえば、一部のレストランの外国語の名前は非常に理解しにくいため、音声認識システムは当然無力です。もう一つの問題は、車内の騒音が激しい場合、音声認識システムの機能にも影響が出ることです。例えば、車内で他の乗客が会話をしていると、所有者自身が発した音声コマンドはシステムによって正確に認識されません。

上記の問題を解決するために、自動車メーカーは車内のマイクの数を 1 個から、人間の 2 つの耳に相当する 2 個に増やし始めました。音声認識システムは 2 つのマイクを使用して異なる話者の位置を特定し、運転者の音声をより正確に識別します。アーデン・ヴェイル社によると、この新しい音声認識システムは「ビームフォーミング」と呼ばれ、アウディ、メルセデス・ベンツ BMWのモデルで初めて使用されるという自動車業界のいくつかの人気ブランドが現在このシステムを使い始めています。

より強力なコンピュータ チップの使用により、音声認識システムの機能がさらに向上します。クラウド接続が常に機能するとは限らないため、自動車メーカーはコンピューターチップを使用した音声認識バックアップシステムを考案し、車に搭載した。このシステムはクラウドベースの音声認識システムほど洗練されていませんが、その機能は今後も向上し続けるでしょう。

絶え間ない改善策にもかかわらず、車載音声認識システムの性能は、車内の騒音は避けられず、運転手は必然的に道路交通状況にもっと注意を払うことになるため、200ドル(約1,000元)の携帯電話の性能に匹敵する可能性は低い。 Nuance のような企業が継続的に努力したとしても、JD Power が車載音声システムの評価を向上させるのはゆっくりとしたプロセスとなるでしょう。

今日頭条の青雲計画と百家曼の百+計画の受賞者、2019年百度デジタル著者オブザイヤー、百家曼テクノロジー分野最人気著者、2019年捜狗テクノロジー文化著者、2021年百家曼季刊影響力のあるクリエイターとして、2013年捜狐最優秀業界メディア人、2015年中国ニューメディア起業家コンテスト北京3位、2015年光芒体験賞、2015年中国ニューメディア起業家コンテスト決勝3位、2018年百度ダイナミック年間有力セレブなど、多数の賞を受賞しています。

<<:  フォルクスワーゲンは3万人の雇用を削減し、39億ドルの経費を節約する計画

>>:  コミュニティの充電容量を20倍に増やす充電ソリューション:分散型共有充電スタンド

推薦する

カシューナッツチキンの作り方

カシューナッツにはタンパク質が豊富に含まれており、カシューナッツを食べると人間の記憶力を向上させるの...

歯茎からの出血は「熱」のせい?答えは…

著者: 鄭淑国、北京大学口腔医学院主任医師査読者: 孫正、首都医科大学北京口腔病院主任医師歯茎からの...

下痢のとき、餃子を食べてもいいですか?

下痢は実は私たちの生活で最も一般的な問題です。特に食事の衛生に注意を払わないと、この現象を引き起こす...

桑の葉は食べられますか?

私たちが幼少のころ、蚕を育てていたとき、蚕に食べさせるために野原に桑の葉を摘みに行きました。蚕は桑の...

豚足とレンコンのスープの作り方

豚足とレンコンのスープは、人々の食卓で最もよく食べられるスープです。豚足にはコラーゲンが豊富に含まれ...

道のない道を作るのは難しい:緑色蛍光タンパク質の伝説的な発見の旅

緑色蛍光タンパク質は自己触媒によって発色団を形成し、青色光や紫外線の刺激を受けて緑色蛍光を発します。...

8大がんの「ゴールデンチケット」

がんを恐れるこの社会では、誰もががんをできるだけ避けようとしますが、不幸はいつも静かにやってきます。...

テスラはもう売れないの?いいえ、これはまだ始まりに過ぎません!

テスラが中国市場で新モデルを発売してからどれくらい経ちましたか?答えは5年です。同社は2020年にモ...

自家製アップルサイダービネガーを飲むのにどれくらい時間がかかりますか?

アップルサイダービネガーは多くの人が好んで飲む飲み物です。リンゴは栄養価が非常に高く、ペクチン、ビタ...

カエルを食べることの利点

カエルは一般的に人工的に養殖されているため、生態系を破壊したり、有益な昆虫に害を与えたりする心配はあ...

これらの10の時間帯に水を飲むことは最も解毒効果が高い

水を飲むとなると、ほとんどの人は喉が渇いたときに飲むだけです。これは間違いではありませんが、水を飲む...

冬に食べる価値のある果物と野菜トップ10。多くの人が恋しがっています!

食べ物によっては、少し食べるだけで多くの栄養を摂取できるものもあります。しかし、食べ物によっては、大...

ランドローバー オーロラやランドウィンド X7 に似ていなければ、まだ誰かが買うでしょうか?

盗作や模倣は多くの国で自動車産業の発展にとって避けられない道であり、多くの自動車メーカーにとって注目...

中国自動車販売協会:中国の中古車販売店指数は2020年5月に48.7%

中国自動車ディーラー協会は2020年6月1日、最新の「中国中古車販売業者指数」(UCMI)を発表した...