Sogouが4つのAIボイスレコーダーをリリース、4つのコア機能でAI録音の新時代を切り開く

Sogouが4つのAIボイスレコーダーをリリース、4つのコア機能でAI録音の新時代を切り開く

ボイスレコーダー業界は常に「単純な」業界であると考えられてきました。市場に出回っているほとんどのボイスレコーダーを見ると、ほとんどのユーザーの録音ニーズを満たしているだけであることがわかります。確かに、ボイスレコーダーの目的からすると「録音」が主なテーマになるはずですが、だからといってボイスレコーダー製品にもっと想像力を働かせることができないということではありません。

2020年2月26日、Sogouはオンライン記者会見を開催し、Sogou AIボイスレコーダーS1、E1、S1故宮共同ブランド版、C1 PRO故宮共同ブランド版の4つの新しいボイスレコーダーを発表しました。

実際、名前の「AI」という言葉から、Sogou は「群衆と区別がつかない」従来のボイスレコーダーを作るつもりではなく、AI 技術とハードウェアを統合して、ユーザーの録音ニーズを総合的に解決できる人間化された録音製品を作りたいと考えていることがわかります。

この意味で、Sogou はまさに従来のボイスレコーダーの製品思考から脱却し、AI 録音の新時代を切り開きました。機能面だけから見ても、Sogou AI ボイスレコーダーには革命家が持つべき要素がすべて備わっています。

4つの主要機能が新しい体験を生み出す

製品の観点から見ると、Sogou は AI を基盤として採用し、スーパーサウンドピックアップ、正確な文字起こし、効率的な整理、万能翻訳という業界をリードする 4 つの主要機能を実現し、ボイスレコーダーにおける高次元のブレークスルーを実現しました。

優れた集音力でどんなシーンでも録音可能

まず、ボイスレコーダーに対する最も基本的な要求は「録音」ですが、製品の性能上の限界により、ほとんどのボイスレコーダーは強風やスタジアムなどの過酷な状況で「故障」し、ボイスレコーダーの使用における不確実性が大幅に高まります。

この問題を解決するために、Sogou は死角のない遠距離シーンに対応するスーパーサウンドピックアップ機能を独創的に追加しました。

ハードウェア面では、Sogou AI ボイスレコーダー S1 には 2 つの Harman 指向性マイクが搭載されており、最大 10 メートルの集音距離をサポートします。また、6 つの全方向性マイクを搭載しており、死角のない 360° 全方向の音声収音をサポートします。アルゴリズムレベルでは、Sogou AI ボイスレコーダー S1 は業界で初めて AI ノイズ低減を実装しました。 8 チャンネルのマイク信号を包括的に分析し、pureVoice AI ノイズ低減アルゴリズムに基づいて、高度なインテリジェント ノイズ低減を実現します。 40,000 以上の実際のノイズをリアルタイムでフィルタリングし、録音された人間の声をより明瞭にします。

一方、Sogou AIボイスレコーダーは、レコーダーまでの距離が遠くても音声を明瞭に録音できます。一方、Sogou AI ボイスレコーダーは、インテリジェントなノイズ低減機能により、無駄な音声情報を巧みに除去することができます。これら 2 つの要素の組み合わせにより、Sogou AI ボイスレコーダーは、特別な使用シナリオに制限されない業界初の録音製品となり、フルシーン録音の時代を切り開きました。

正確な転写は作業効率を大幅に低下させる

録音が完了したら、多くの人が録音内容をテキストに整理する必要があると思いますが、これは現在の従来のボイスレコーダーの最大の欠点でもあります。録音を聞きながらテキストに入力する必要があるのです。短い録音であれば問題ありませんが、録音が数時間にわたると、作業量は飛躍的に増加します。

そのため、Sogou は録音のリアルタイムテキスト転記機能を導入し、業界水準を上回る転記精度を維持しました。新しいSogou AIボイスレコーダーの文字起こし精度は98%に達しました。

Sogouによると、AIリアルタイム連携とSogou入力方式の語彙同期により、Sogou AIボイスレコーダーS1は「1時間の録音と5分での原稿作成」を実現できるという。つまり、録音をテキストに変換するのにかかる時間はわずか数分で、変換精度は98%と非常に高いのです。手作業と比較すると、Sogou AIボイスレコーダーS1は変換効率がはるかに優れています。

もちろん、Sogou はさまざまな言語や方言での録音シナリオも考慮に入れています。テキスト変換に関しては、中国語、英語、日本語を含む10の言語と、広東語、四川語、河北語を含む10の方言の認識をサポートしています。また、金融・貿易、医療、IT技術など5つの分野における専門用語の徹底学習も行います。これにより、Sogou AIボイスレコーダーの使用シナリオが大幅に拡大しました。

興味深いことに、Sogou AI ボイスレコーダーには強化された認識機能もあり、さまざまな話者や拍手、笑い声を認識できるため、ユーザーは正確に音声を録音できます。

録音業界の観点から見ると、正確な転写機能は、抽象的な音声を直感的なテキストに変換し、音声の直感性を大幅に高めることで、作業効率を大幅に向上させることができます。

効率的な整理により、録音ファイルを直感的に操作できます

オーディオ ファイルの数が増えるにつれて、従来のオーディオ レコーダーのほとんどのユーザーは、オーディオ レコーダー内のファイルを有線接続でコンピューターに転送し、コンピューターを介してオーディオ ファイルを整理することしかできず、単純な名前タグしかサポートしていないと思います。ただし、ビデオや写真をアーカイブするこの方法は、抽象的な記録にはあまり適していません。

ユーザーが録音をより良く整理できるようにするために、Sogou はインテリジェント要約技術を開発しました。Sogou Zhiyin™ NLP エンジンのインテリジェント要約技術により、録音原稿のテーマと重要な文章が自動的に洗練されます。たとえば、録音からキーワードを抽出して録音ラベルを作成すると、録音の直感性が大幅に向上します。

録音を検索するときは、音声アシスタントを通じて検索したいキーワードを言うだけで、Sogou AI Voice Recorder S1 がそのキーワードを含むすべての録音を表示します。 Sogou AI Voice Recorder S1 は、録音を聞き返す際に、空の録音をスキップしたり、繰り返しの単語をフィルタリングしたり、無駄な情報を可能な限り排除して、録音の連続性を高めることもできます。

興味深いことに、ユーザーがファイルを整理しやすくするために、Sogou AI ボイスレコーダーの録音ファイルは、モバイルアプリ、Web ページ、PC クライアントなどのさまざまな端末にリアルタイムで同期できるため、プラットフォーム間で録音ファイルを整理する際の効率が大幅に向上します。

ユニバーサル翻訳にはもはや「同時通訳」は必要ない

外国語のインタビューや外国語のスピーチなど、録音中に全く新しい言語に遭遇すると、誰もが戸惑うと思います。それは、まずその言語の範囲がわからず、その言語で話されている内容の意味がわからないからです。この需要に応えるために、Sogou は翻訳機能を Sogou AI ボイスレコーダー S1 に巧みに統合しました。つまり、Sogou AI ボイスレコーダー S1 は会話翻訳機能をサポートし、業界で初めて無料の会話翻訳をサポートしました。

Sogou によると、Sogou AI ボイスレコーダー S1 は 63 の言語でのオンライン翻訳をサポートしています。オフラインモードでは、中国語、英語、日本語を含む9つの一般的な言語の翻訳もサポートできます。これを基に、Sogou AI ボイスレコーダー S1 と E1 は中国語と英語のリアルタイム同時通訳もサポートしており、これは、これら 2 つの Sogou AI ボイスレコーダーが、これまで「同時通訳」でしか実現できなかったタスクを完了できることを意味します。

長い間、ボイスレコーダー業界は「録音」という言葉に制限され、ある種のボトルネックに陥っていたようです。しかし、Sogou の先駆的な思考は、「録音」という言葉から逸脱し、スーパーサウンドピックアップ、正確な転写、効率的な組織、そして万能翻訳という 4 つの革新的な機能を創造的にもたらしました。これにより、業界全体に新たな開発アイデアがもたらされる可能性があります。

Sogou は、ボイスレコーダーに初めてこれらの独創的な機能を追加することで、AI 録音の新時代の先駆者としての地位を確立しました。市場の観点から、この先駆者の高い魅力をはっきりと感じることができます。

新世傑産業研究センターが発表した「2019-2023 ボイスレコーダー産業の詳細な市場調査と投資戦略推奨レポート」のデータによると、中国のボイスレコーダー産業の出荷量の伸びは2017年以降、基本的に停滞している。Sogou AIボイスレコーダーC1は2019年3月に発売され、3か月後にはボイスレコーダー部門で販売チャンピオン、JD.comとTmallプラットフォームでそれぞれ販売チャンピオンを獲得した。その年のダブルイレブンでは、Sogou AIボイスレコーダーC1がJD.comとTmallの両プラットフォームで単一製品の総売上高で優勝しました。

Sogou がリリースした 2 つの新製品は、以前の製品をベースに全面的に進歩したことを考えると、2020 年には Sogou AI ボイスレコーダーの市場が拡大すると予測されます。同時に、最も初期の AI ボイスレコーダーの先駆者として、Sogou の高度な成果は、確かに伝統的なプレーヤーから学ぶ価値があります。

今日頭条の青雲計画と百家曼の百+計画の受賞者、2019年百度デジタル著者オブザイヤー、百家曼テクノロジー分野最人気著者、2019年捜狗テクノロジー文化著者、2021年百家曼季刊影響力のあるクリエイターとして、2013年捜狐最優秀業界メディア人、2015年中国ニューメディア起業家コンテスト北京3位、2015年光芒体験賞、2015年中国ニューメディア起業家コンテスト決勝3位、2018年百度ダイナミック年間有力セレブなど、多数の賞を受賞しています。

<<:  休暇後に仕事の効率を2倍にするにはどうすればいいでしょうか? Sogou AIボイスレコーダーC1 Proで答えをお伝えします

>>:  リモートワークの失敗を避ける方法:DingTalk、WeChat for Work、Larkのうちどれがあなたに適していますか?

推薦する

この写真を見たとき、黙っている人もいれば、羨ましがる人もいました。

ワールドカップは終わった。開催国のカタールが残念ながら負けた今回のワールドカップの初戦をまだ覚えてい...

緑豆の栄養価

緑豆といえば健康に良い食べ物なので、ご存知の方も多いと思います。緑豆は栄養価が非常に高く、特に夏に食...

2014 年 8 月のロシアのトップ 5 オンライン ショッピング サイトのトラフィック分析

1つ。ロシアのショッピング ウェブサイト ランキング (トップ 10)カテゴリー: ショッピング ·...

1665年にホイヘンスによって初めて発見された高次のネットワーク同期が発見されました

ロンドン大学クイーン・メアリー校が主導する研究では、トポロジーと動的システムを組み合わせ、高次ネット...

サラダの作り方

冷えたレタスを調理する方法は当然たくさんあります。レタス自体は私たちの日常の食生活に非常によく登場し...

なぜ一部の人の手の静脈は膨らんでいるのでしょうか?これらの場所に青い静脈が現れたら注意してください

次のような現象に気づいたことがありますか。ある人の手は滑らかで繊細に見えますが、ある人の手の甲には異...

The Pirate Bay はブロックされることを恐れていません。 BT シードがある限り、トラフィックは存在します。

近年、エンターテインメント業界は世界中の多くの国でThe Pirate Bayをブロックするために懸...

レモンハニーティーのレシピ

レモンは私たちにとって一般的な果物ですが、レモンの味は酸っぱすぎるため、一般的にはそのまま食べること...

iPhone型の爆発防止兵器が本物か偽物か警察でも判別できない

カナダ警察は最近、iPhoneによく似た防爆スタンガンという2つの致命的な武器を押収した。警察は、そ...

海藻は髪の毛を生やす食べ物ですか?

海苔にはカルシウム、カリウム、コレステロール、ビタミン、カロチン、リンなどが豊富に含まれており、特に...

黄志怡:アルゴリズムの「危険峰」の最高「岩峰」へ突進する登山家!

香港大学(HKU)のコンピューターサイエンス准教授である黄志怡氏は、登山をしていない日でも、「岩のホ...

eMarketer: 米国のアパレル小売業の電子商取引売上高は 2015 年に 600 億ドルに達する見込み

199ITオリジナルコンピレーションeMarketer は、米国のアパレルおよびアクセサリー小売電子...

全国目のケアの日丨目に関する10の噂を信じないでください →

諺にもあるように、「目は心の窓である」。目は壊れやすく、しっかりと保護する必要があることは多くの人が...

なぜ光学顕微鏡で原子を見ることができないのでしょうか?

光学顕微鏡を使えば、肉眼では見えない細菌や細胞を見ることができますが、原子のようなもっと小さなものを...