ウィキメディア財団:AIクローラーによりウィキメディア・コモンズの帯域幅需要が50%増加

ウィキメディア財団:AIクローラーによりウィキメディア・コモンズの帯域幅需要が50%増加

ウィキペディアやその他十数件のクラウドソーシング知識プロジェクトの管理組織であるウィキメディア財団は月曜日、ウィキメディア・コモンズからマルチメディアをダウンロードするための帯域幅消費が2024年1月以来50%急増したと発表した。

同社は火曜日のブログ投稿で、その理由は知識欲の強い人間からの需要増加によるものではなく、人工知能モデルを訓練したい自動化されたデータ欲の強いクローラーによるものだと述べている。

「当社のインフラは、注目度の高いイベントの際に人間によるトラフィックの急増に耐えられるように構築されていますが、ボットによって生成されるトラフィックの量は前例のないほど多く、リスクとコストの増加を伴います」と投稿には書かれている。

Wikimedia Commons は、オープン ライセンスまたはパブリック ドメインで利用できる画像、ビデオ、オーディオ ファイルの、自由にアクセスできるリポジトリです。

さらに詳しく調べてみると、Wikipedia によると、最も「高価な」トラフィック、つまり消費されるコンテンツの種類に関して最もリソースを消費するトラフィックのほぼ 3 分の 2 (65%) がボットから来ているそうです。しかし、全体のページビューのうち、これらのボットから得られたものはわずか 35% でした。 Wikipedia によると、この違いの理由は、頻繁にアクセスされるコンテンツはユーザーに近いキャッシュに保存されるのに対し、あまりアクセスされないコンテンツは遠く離れた「コア データ センター」に保存され、コンテンツの提供にはより多くのコストがかかるためです。これはボットが通常探すコンテンツの種類です。

「人間の読者は特定の(多くの場合は類似した)トピックに焦点を当てる傾向があるのに対し、クローラーボットは大量のページを「一括読み取り」し、あまり人気のないページを訪問する傾向がある」とWikipediaは書いている。 「つまり、こうしたタイプのリクエストはコアデータセンターに転送される可能性が高くなり、リソースの消費コストが高くなります。」

全体として、ウィキメディア財団のサイト信頼性チームは、一般ユーザーへの混乱を避けるためにボットをブロックするために多くの時間とリソースを費やす必要があります。そして、これはすべて、財団が直面するクラウド コストを考慮する前の話です。

実際、これはオープン インターネットの存在そのものを脅かす、急速に拡大している傾向の一部を表しています。先月、ソフトウェアエンジニアでありオープンソースの支持者であるドリュー・デボールト氏は、AIクローラーが自動トラフィックから保護するために設計された「robots.txt」ファイルを無視していると不満を述べた。また、「実践的なエンジニア」のゲルゲリー・オロス氏も先週、Meta などの企業の AI クローラーが自身のプロジェクトの帯域幅需要を増大させていると不満を漏らした。

オープンソースのインフラが特に最前線にある一方で、開発者たちは「創意工夫と復讐心」で反撃している。一部のテクノロジー企業もこの問題の解決に取り組んでいる。たとえば、Cloudflare は最近、AI 生成コンテンツを使用してクローラーの速度を低下させる AI Labyrinth を立ち上げた。

しかし、これはむしろ猫とネズミのゲームであり、最終的には多くの出版社がログインとペイウォールの背後に隠れざるを得なくなる可能性があり、それは今日ウェブを使用しているすべての人にとって有害となるでしょう。

中国産業情報ステーションより

<<:  エキサイティングなエンターテイメントを探索してください。Huawei VR Glass メガネがあなたに本当の楽しい体験をもたらします!

>>:  iQOO 5レビュー:あらゆる面でバランスのとれた進化、史上初の「軽量」ゲーミングスマホ

推薦する

IEA: 2024 年北西ヨーロッパの水素モニタリング レポート

北西ヨーロッパは低排出水素開発の最前線にあるが、同地域の国々が2030年までに設定した目標を達成する...

極狭ベゼルの2KスクリーンHTC One M9のコンセプト画像が公開

HTC の次世代スマートフォンの主力機種は HTC One M9 という名前ではないかもしれないと...

レモングレープフルーツティーの作り方

お茶を飲むことは健康に良いことはわかっていますが、誰もがお茶の味を受け入れられるわけではありません。...

五星慧の死から学ぶO2O起業の5つの落とし穴

O2Oが人気にならないわけがない! 2015年3月5日、李克強首相は2015年政府活動報告の中で初...

おいしい塩魚の作り方

塩漬けの魚を好む友達もいますが、塩漬けの魚を美味しくするにはどうすればいいでしょうか? 多くの人は塩...

電子レンジで作るサツマイモ

今日では、多くの家庭がテレビ、オーブン、冷蔵庫、電子レンジなど、さまざまな電化製品を所有しています。...

干しエビ入り冬瓜の揚げ物

冬瓜と干しエビの炒め物は家庭料理ともいえるもので、多くの人に馴染みのある食べ物です。干しエビと冬瓜を...

医師が言う「軽い食事」とは、具体的にはどういう意味でしょうか?知っている人はほとんどいないと思います。

まずは複数選択問題をやってみましょう。次のどれが軽食と考えられますか? A. ビーガンスパイシー鍋B...

EUがGoogleを厳しく取り締まる:舞台裏で嫉妬と恨みを抱いているのは誰か?

私は、Google 検索を分割するという EU の提案は単なる象徴的なジェスチャーだと思っていたが、...

初秋のダイエットには八字法を実践しよう

「健やかな夏は四分の三が弱い」ということわざがあります。秋の初めになると、朝晩は涼しくなりますが、日...

蓮の実粥の作り方

蓮の実は白蓮またはハイビスカスとも呼ばれます。蓮の実は食用だけでなく、薬用としても使われます。蓮の実...

蒸しロールの作り方

蒸し米巻きは広東省でとても有名な軽食で、ほとんどすべての都市で見つけることができます。蒸し米巻きの作...

スタイリッシュなヘッドフォンを作る Beats 新型 Solo2 レビュー

最近、AppleによるBeatsの30億ドルでの買収が業界で話題になっている。明らかに、Beats ...

頭がなくなっても、また生えてきますよ! 「アホロートル」はなぜそんなにすごいのでしょうか?

花や鳥の市場を訪れるのが好きな人なら、この「スーパーパワー」を持つ生き物を見たことがあるかもしれませ...

大根の漬物の作り方

大根は根菜で、日常生活にとてもよく見られます。主な種類は、水大根、白大根、赤大根などです。主に野菜と...