AIにおける新たなブレークスルー! 「咳モデル」が誕生しました。咳はあなたの健康状態を物語ります。

AIにおける新たなブレークスルー! 「咳モデル」が誕生しました。咳はあなたの健康状態を物語ります。

著者 |馬雪偉

序文

世界保健機関(WHO)が2021年に発表したデータによると、世界の死因上位10位による死者は合計3,900万人で、世界全体の死者数(6,800万人)の57%を占めた。これらは主に、心血管疾患(虚血性心疾患、脳卒中など)と呼吸器疾患(結核、慢性閉塞性肺疾患、下気道感染症など)という 2 つの主要な種類の疾患に関連しています。

中でも、呼吸器疾患による咳や呼吸には、私たちの健康状態に関する多くの情報が含まれています。たとえば、臨床医は「喘鳴」のような咳の音を使用して百日咳を診断し、死戦期呼吸を使用して急性心血管イベントを検出します。

では、人工知能(AI)の時代において、この技術を利用して音声データから健康情報を抽出し、身体の状態をより適切に監視できるのでしょうか?

Googleとザンビア感染症研究センター結核部門の研究チームが、この方向で重要な一歩を踏み出しました。両社は共同で、人間の声を監視し、病気の早期兆候に気付くよう設計されたバイオ音響ベースモデルHeAR(Health Acoustic Representations)を立ち上げました。 「HeAR - Health Acoustic Representations」と題された関連研究論文が、プレプリントウェブサイトarXivに掲載されました。

報道によると、彼らは多様で匿名化されたデータセットから慎重に選択された3億の音声データでHeARをトレーニングし、特に約1億の咳の音を使用してこの「咳モデル」をトレーニングしたという。

HeAR は、健康関連の音のパターンを識別でき、幅広いタスクにおいて平均的に他のモデルよりも優れた性能を発揮し、マイクをまたいで一般化することができます。 HeAR を使用してトレーニングされたモデルは、より少ないトレーニング データで高いパフォーマンスを達成しました。これは、データが不足していることが多い医療研究の分野では重要な要素です。 HeAR は現在研究者に提供されており、データ、セットアップ、計算要件を減らしてカスタマイズされた生物音響モデルの開発を加速するのに役立ちます。

HeARのようなソリューションは、AIによる音響分析を結核のスクリーニングと検出に非常に役立つものにし、最も必要としている人々に、影響が少なく簡単にアクセスできるツールを提供するでしょう」と、StopTB Partnershipのデジタルヘルス専門家、Zhi Zhen Qin氏は述べています。

将来的には、研究チームはこの研究を活用して、結核、胸部、肺などの疾患の分野で診断ツールやモニタリングソリューションの開発を進め、世界中のコミュニティの健康状態の改善に貢献したいと考えています。

現在、インドの呼吸器系健康企業サルシット・テクノロジーズは、AIを使って咳の音を分析し、肺の健康状態を評価する「Swaasa」という製品を開発している。同社は、HeAR がバイオ音響 AI モデルの機能を拡張するのにどのように役立つかを模索しています。

咳は病気の兆候となる

HeAR システムは 3 つの主要部分で構成されています。 HeAR システムは、自己教師学習を通じて、大量のラベルなしオーディオ データを活用して、さまざまな健康音響タスクに転送できる一般的なオーディオ表現を学習します。

図|HeARシステム概要

データ収集の段階では、研究チームは健康音響イベント検出器を使用しました。これは、2 秒間のオーディオ クリップ内の 6 つの非音声健康音響イベント (咳、赤ちゃんの咳、呼吸、咳払い、笑い、発話) の存在を識別するためのマルチラベル分類畳み込みニューラル ネットワーク (CNN) です。検出器は、FSD50K および FluSense データセットを使用してトレーニングされ、オーディオ クリップに「咳」、「くしゃみ」、「呼吸」などのラベルが付けられます。

この論文では 2 つのデータセットが使用されています。そのうちの 1 つは、著作権のない公開 YouTube 動画 30 億本から抽出された 2 秒の音声クリップで、合計 3 億 1,330 万クリップ、つまり約 174,000 時間の音声になります。これらのセグメントは、Healthy Acoustic Event Detector を使用してスクリーニングされました。もう1つはザンビア伝染病研究センターが収集したもので、結核の疑いのある患者599人の咳の音声録音と胸部X線写真が含まれていた。

研究チームは、2秒間の音声クリップ3億1,300万個からなる大規模なデータセットでトレーニングされたマスク付きオートエンコーダを使用しました。線形プローブにより、HeAR は 6 つのデータセットにわたる 33 の健全な音響タスクのベンチマークで、すべての健全なオーディオ埋め込みモデルの中で SOTA パフォーマンスを達成しました。

図 | HeAR は、33 の健康オーディオ タスクで最高の平均ランキング (MRR = 0.708) を達成し、他のすべてのベースライン モデルを上回りました。

HeAR は、FSD50K および FluSense データセットで他のモデルよりも優れており、特に FSD50K でトレーニングされたモデルの中で 2 位にランクされています。

図|FSD50K および FluSense データセットにおける健康音響イベント検出タスクのパフォーマンス比較。

HeAR は、人口統計、ライフスタイルを含む 14 の咳推論タスクのうち 10 でベースライン モデルを上回ります。 TB および CXR タスクでは、そのパフォーマンスは最高のモデルに匹敵します。

図|咳推論タスクの性能比較。

HeAR は、SpiroSmart データセットの 4/5 肺機能テストタスクと性別分類タスクでベースライン モデルを上回ります。

図|肺機能検査課題の成績比較。

CIDRZ データセットでの HeAR のパフォーマンスは、さまざまな記録デバイスの影響を受けず、さまざまなデバイスに対して堅牢です。さらに、HeAR はトレーニング データが少ない場合でも優れたパフォーマンスを実現できるため、ラベル付きデータが不足している医療研究においてさらに有利になります。

ただし、HeAR にも一定の制限があります。たとえば、線形プローブではモデルのパフォーマンスの可能性を十分に引き出すことができず、一部のデータ セットは規模が小さくクラスの不均衡の問題があり、HeAR などのモデルは大きく、携帯電話などのデバイスで実行するのが困難です。

研究チームは、今後はモデルの微調整や機能の追加によるパフォーマンス向上のほか、より多くのデータの収集やデータ前処理方法の改善も検討する可能性があると述べた。また、モデルをローカルデバイスで実行できるようにするために、モデルの圧縮と量子化の技術を研究することも検討できます。

AI支援による病気診断には大きな可能性がある

医師の補助から病気の単独診断まで、AIは医療分野でますます活用され、大きな可能性を示しています。

今年6月、インペリアル・カレッジ・ロンドンとケンブリッジ大学の研究チームは、AIモデルEMethylNETを訓練し、DNAメチル化パターンを観察することで、非がん組織から13種類のがん(乳がん、肝臓がん、肺がん、前立腺がんなど)を識別し、その精度は最大98.2%に達した。

7月には、ボストン大学の研究チームとその協力者らが開発したAIツールが、10種類の認知症を(同時に)診断するのに役立ち、神経科医の診断精度が26%以上向上すると期待されている。

最近、AIは、子供たちの「目に見えない殺人者」である自閉症をターゲットにした画期的な進歩も遂げています。カロリンスカ研究所の研究チームが開発したマルチモーダルデータ分析AIモデルは、生後12か月前後の子供の自閉症の初期兆候を検出できるだけでなく、2歳未満の子供を識別する精度も80.5%です。さらに重要なのは、プロセス全体では比較的限られた情報しか必要としないことです。

近い将来、AI が人間によるより多くの病気の診断に役立ち、医療健康分野にさらなる可能性をもたらすことが予測されます。

<<:  北京と天津の人々が感染しました!この虫を見つけたら、叩かないでください。

>>:  砂漠でカニを養殖できますか?はい、あなたのテーブルにやって来ます!

推薦する

赤いソーセージはどれくらい保存できますか

赤いソーセージはソーセージと呼ばれることが多いです。赤いソーセージはリトアニア原産です。赤いソーセー...

酢に漬けた生ピーナッツの作り方

人々の生活水準は絶えず向上しており、食生活も改善しています。多くの人が肉や魚をたくさん食べています。...

新学期に向けてのキャンパス安全知識リマインダー、ご確認ください〜

キャンパスの安全は非常に重要ですこれらの安全知識事前にお子様に教えてください学校火災の防止交通安全1...

プログラミングではなぜ中国語ではなく英語を使うのでしょうか?将来中国語プログラミングは可能になりますか?

著者: ドゥアン・ユエチュお使いのブラウザはビデオタグをサポートしていませんプログラミングで英語を使...

なぜ英語が唯一の科学言語なのでしょうか? |展開する

19 世紀には、科学的なコミュニケーションに多くの言語が使用されていました。その後、エスペラント語な...

これを見たら注意してください:足を組まないでください!

前回、頚椎症について皆様にご説明させていただいた際に、座り方の問題について触れさせていただきました。...

ベビーキャベツの作り方

ベビーキャベツはミニ白菜とも呼ばれ、近年日本から導入された新しい野菜の品種です。見た目は白菜によく似...

ビタミンBを含む食品

食べ物は人間が毎日必要とするものであり、さまざまな食品は人体に対してさまざまな効果をもたらします。し...

130万以上の高級車には10%の消費税が課せられる

最近、財政部と国家税務総局は「超高級車に対する消費税の課税に関する事項に関する通知」を発行し、合理的...

NIOは9月18日に米国株式市場に上場し、10億ドルを調達する予定

NIOは9月18日に米国株式市場に上場し、10億ドルを調達し、時価総額は60億~80億ドルとなる予定...

チキンシチューの作り方とは

鶏肉は私たちの体に強い栄養効果を持っているので、栄養補給が必要なときに鶏肉を選ぶ人が多いです。また、...

アウディQ7サザンエクスクルーシブエディションは、より多くの中国ユーザーのニーズを満たすために3列目のシートを追加しました

自動車メーカーにとって、広大な中国は世界で最も重要な販売市場であるだけでなく、国内のさまざまな地域の...

マンゴーゼリーチーズケーキの作り方

私の友人の多くは、日常生活でケーキを食べるのが好きだと思います。ケーキは、誕生日や人生の他の重要な祭...

ネギの栄養価は何ですか?

ニラは私たちにとって非常に馴染みのある野菜です。ニラは媚薬草、陽を育てる草とも呼ばれています。名前か...

栗酒で腎臓を養い、冬に陽を高める

甘くて香りの良い栗は、大人も子供も大好きなおやつです。柔らかくて濃厚な栗は、美味しいだけでなく、栄養...