目次
トレンド
Dell’Oro
液冷市場が、2028 年までに累計収益が 150 億ドルに達すると予想
データセンター熱管理マーケットが 2028 年までに 120 億ドルに達し、そのうち液体冷却が 35 億ドルを占めると予測。
ハイエンドアクセラレータの導入とそれらのプロセッサが液冷されることで信頼性が高まったと期待されていることが要因とのこと。2024年から2028年の5年間で、液体冷却の累計収益は150億ドルに達するとしています。
液冷方式では、単相直接液体冷却が圧倒的に優勢になるだろうとのこと。
なお、液体冷却は、空冷などの他の熱管理セグメントの成長を食いつぶすものではなく、むしろ空冷が十分にサポートしていない市場の新しいセグメントでの成長となるともしています。
Cisco Talos
ビジネスメール詐欺とランサムウェアが 2024 年第 2 四半期の最大の脅威であり、テクノロジー企業が最も狙われるセクター
観測された脅威のトップは BEC とランサムウェアで、合わせて全体の 60% を占め、ランサムウェアは、この四半期の攻撃件数の 30% を占め、前四半期から 22% 増加、ネットワークデバイスを狙ったパスワードスプレー攻撃や脆弱性スキャンなどの攻撃が増加し、全体の 24% を占めたとのこと。
最初のアクセスを取得する手段として最も多く観察されたのは、侵害された有効なアカウントの資格情報を使用することで、構成ミスと多要素認証の欠如がそれに寄与しているとしています。
<参照URL>
https://talosintelligence.com/
Stackoverflow
185 か国にわたる 65,000 人を超える開発者からの回答に基づく 2024 年開発者調査レポートを発表
開発者のAIツール使用率は2023年の70%から2024年には76%に増加、使用率の増加にもかかわらず、AIの好感度は77%から72%に減少。AIツールの精度を信頼する回答者は43%。
開発者の81%が、AIツールの最大のメリットとして生産性の向上を挙げていますが、一方で、誤情報がAI関連の最大の倫理的懸念事項として浮上(79%)しています。
Gen AI の良し悪しはデータ次第、ゴミを入れればゴミしか出てこないともしています。
AI コード補完およびジェネレーター ツールと Stack Overflow のような深いコンテキストおよび知識ツールを組み合わせると、強力な組み合わせになるとし、今後、生成型 AI によってコーディングが民主化され、開発者コミュニティが数倍に拡大するとしています。
USキャリア
AT&T
2月の大規模障害で、FCCからその原因はすべてAT&Tにあると指摘される
この障害は、2月22日の未明の定期メンテナンス期間中にAT&Tのネットワークの設定ミスによりサービス停止が発生、何百万台ものデバイスに障害が発生し、何百万もの音声通話がブロックされました。
作業員が適切なピアレビューなしに誤った設定を行ったため、作業実施の3分後に、AT&T ネットワークは「保護モード」に入り、「トラフィックがネットワークにさらに伝播するのを防ぐため、すべてのネットワーク接続をシャットダウンする自動応答」がトリガーされたとのこと。
結果、登録済みのデバイス 1 億 2,500 万台以上が影響を受け、音声通話 9,200 万件以上がブロックされ、全米 50 州、ワシントン DC、プエルトリコ、米領バージン諸島の 911 コールセンターへの 25,000 件以上の通話が遮断されたとしています。
ネットワーク変更を元に戻すのに約2時間かかり、再登録要求がネットワークに殺到し、AT&Tのデバイス登録システムが過負荷になったため、完全なサービスが回復するまでに少なくとも12時間を要したとのこと。
この障害で、米国経済に推定5億ドルの影響を与え、AT&Tの損失は、最大1億4000万ドルに上るともされます。
AT&Tは、ダウンしてから3時間以上、そしてネットワークが復旧して1時間近く経ってから初めてFirstnetに状況を通知しており、FCCは、今週の報告と最近の他の障害に基づいて、サービスプロバイダーに対し、業界で認められた関連するベストプラクティスを実施することの重要性を喚起する公示を発表する予定で、AT&Tに対しては、FCC規則の「潜在的な違反」に関する公安・国土安全保障局の調査に基づき、この問題を執行局に委ねたとのこと。
また、同キャリアは今月初め、第三者によるデータ侵害ですべてのモバイルトラフィックの通話記録が乗っ取られたことを公表しています。このデータ侵害はSnowflake上で保管していたデータで発生し、ロシアとつながりのあるシャイニーハンターズグループによって行わていたとされ、AT&Tは盗まれた情報を削除するために攻撃者に身代金を支払ったとされています。
<参照URL>
https://docs.fcc.gov/public/attachments/DOC-404150A1.docx
Lumen
Microsoft AzureにPrivate Connectibity Fabricを提供する契約を発表
AI需要で利用可能な容量が圧迫され、ファイバーやルート、ネットワーク容量や機能に対する需要が、現在、希少なリソースになりつつあるとともに、ダークファイバー アクセスが次のクラウドのボトルネックになる可能性があるとし、新規および既存のルートの組み合わせへのアクセスを提供し、必要に応じてファイバーを提供するとのこと。
Frontier
Nokiaと100G-PONをテスト
Frontier の固定回線ネットワークは現在、家庭・企業向けに 10G/25G を提供しており、一般消費者の利用できる最高速度は DL/ULともに 5 Gbpsです。
Nokia Lightspan 光ファイバーアクセスプラットフォームを使用して2005 年頃から使用されている光ファイバー約 12㎞でテストし、米国通信事業者として初めて100Gのブロードバンド速度を試験したと発表しています。
単一ファイバー上で最大4世代のPON(10G、25G、50G、100G)をサポートできるとのこと。
なお、Nokiaは、最近、Google Fiberと接続してカンザスシティ地域で50G PONもテストしています。
<参照URL>
https://www.telecoms.com/fibre/frontier-and-nokia-trial-100g-50g-25g-and-10g-pon-simultaneously
ワールドワイドキャリア
Telefonica
Fortinet、Quantum Xchange、Warpcomと共同で、量子コンピューターによる将来の攻撃から守るための新ソリューションを開発実証
量子コンピューターは、将来、既存の暗号化方式の多くを破ることができるようになると予想されており、その時をq-dayと呼称されています。
これを防ぐために、各社は量子セキュリティアーキテクチャに基づくソリューションを開発し、現在、実稼働環境でテスト、オンプレミスでもクラウド環境でも、世界中のどこにでも販売および実装でき、さまざまなタイプの環境に簡単に適応可能だとしています。
Singtel
34社のモバイル通信事業者からなるBridge Allianceと提携し、地域API連合を構築
SingtelのParagon は、通信ネットワーク向けのオールインワン オーケストレーション プラットフォームで、Bridge Alliance は、Paragon を使用してユーザーのネットワーク認証、ユーザー検証、ネットワーク品質 API を統合する Bridge Alliance API Exchange (BAEx) を導入しているとのこと。
Linux Foundation の CAMARA API を利用して、通信 API の地域的な集約と標準化が可能になり、企業は新サービスの市場投入までの時間を短縮し、複数の通信サービス プロバイダーとの連携の複雑さを軽減できるとしています。
また、Bridge Alliance との提携発表に続き、Singtel はタイの AIS およびマレーシアの Maxis とMoUを締結、SingVerify を通じてモバイル加入者向けのネットワークベースの認証を可能にしたとしています。
GSMA Open API Gateway をベースとする SingVerify は、通信事業者が違法なアカウント乗っ取りやフィッシング詐欺に対処するのに役立つとしています。
AST Space Mobile
5機のBluebird LEOが完成し、8月第1週にフロリダ州ケープカナベラルに出荷する準備が整ったと発表
5機の衛星は、軌道上にあるBluewalker3衛星をベースに開発され、帯域幅の10倍の増加により、プレミアムローバンドスペクトルを使用する5,600以上のセルで米国全土に非連続通信サービスを提供するとしています。
今後、45 基から 60 基の衛星を使用して、日常的に使用するスマートフォンに直接セルラー ブロードバンドを提供する連続的なサービスの提供に拡大する予定とのこと。
なお、この衛星通信事業者は、AT&T、Verizon、Google、Vodafone、楽天、American Tower、Bell Canada から投資を獲得しています。
<参照URL>
https://feeds.issuerdirect.com/news-release.html?newsid=5212606427775376
政府・団体
米国政府
将来の規制のためにさらなる情報を収集し、オープンウェイトモデルの監視すると発表
NTIA曰く、現在のシステムを混乱させる能力を持つ公共のAIモデルの危険性を検討することが重要であるとのこと。
一方で、米国は「現在、基礎モデルから生じる多くのリスクを監視し、効果的に対応する能力を持っていない」とし、そのため、特定のリスクを監視するモデルの能力に関する証拠の収集、指標の評価と比較、これらのリスクを対象とした政策の採用という、重点を置くべき3つの主要分野を提案しています。
オープンウェイト モデルは、ウェイトまたはパラメーターが公開され、ユーザーがモデルをダウンロードできるファウンデーションモデルと定義し、リスクを軽減するための独自の機会と課題をもたらす可能性があるとしています。
NTIAは、オープンファンデーションモデルに新たなリスクがあるという証拠がまだ十分になく、その配布に新たな制限を課すほどではないと現時点では判断しているとのこと。
Al-Enabled ICT Workforce Consortium
ICT 関連の職種の 92% 以上が AI によって高度または中程度の変革を受けるとのレポートを発表
同コンソーシアムは、AI人材の課題に対処するために、Google、IBM、Microsoft、SAP、Intel、Cisco、Accenture、Indeed、Eightfold AIなど、大手テクノロジー企業によって4月に結成されたコンソーシアムです。
コンソーシアムは 7 つの「職種」にわたる 47 の特定の ICT 職種を分析。
これらの職種には、ビジネスと管理、サイバーセキュリティ、データ サイエンス、設計とユーザー エクスペリエンス、インフラストラクチャと運用、ソフトウェア開発、テストと品質保証が含まれます。
調査の結果、主要スキルの少なくとも 50% が AI の影響を受けるとのこと。
ビジネスと管理、デザインとユーザー エクスペリエンス、テストと品質保証の分野で最大の変革が起こるとし、職務は役職レベル別でも分析され、初級レベルの職の 96%、中級レベルの職の 84% がAI によって大幅に影響を受けると結論付けています。
今後、あらゆる役職レベルの労働者は、AI 主導の競合分析、AI 統合戦略、機械学習 (ML) リテラシー、プロンプト エンジニアリング、データ サイエンスと視覚化、自然言語処理 (NLP) のスキルを習得する必要があるとし、重要性が増すその他のスキルとしては、製品開発ライフサイクル、アジャイル手法、プロセス改善、予測分析、データ管理、成功 KPI、統計モデルの理解などを挙げています。
AI によって日常的なタスクが自動化され、ワークフローが合理化され、データ分析が容易になり、
「ハイパー パーソナライゼーション」が実現できるとのこと。
<参照URL>
https://www.cisco.com/c/m/ai-enabled-ict-workforce-consortium.html
Tech Giants
Microsoft
Bing Generative Searchをプレビュー
Googleは5月に米国で提供開始した、Google 検索のAI Overviews 機能の対抗となります(開始時、ユーザーの質問に対して、無意味かつ不正確で、時には潜在的に危険な回答を次々に生成したと酷評されました)。
「ごく一部の」ユーザーのみが利用できる Bing Generative Searchは、大規模および小規模の生成 AI モデル (正確にはどのモデルかは不明) の組み合わせによって実行され、Web 全体から情報を集約し、検索クエリに応じて要約を生成するとのこと。
たとえば、ユーザーが「スパゲッティウエスタンとは何か?」と検索すると、そのサブジャンルの歴史や起源、代表的な例に関する情報とともに、その情報の出所を示すリンクやソースが表示されます。
この機能は徐々に展開しており、時間をかけてフィードバックを集め、テストと学習を行い、より広範囲に利用できるようにする前に、優れたエクスペリエンスを生み出すよう取り組んでいるとのこと。
なお、こうした生成AIによる概要生成は、情報源となっているサイトへのトラフィックを食いつぶす恐れがあり、ある調査では、AI 概要によって Web ページ リンクが強調されなくなるため、パブリッシャー トラフィックの約 25% に悪影響が及ぶ可能性があるとされています。
<参照URL>
https://blogs.bing.com/search/July-2024/generativesearch
https://apnews.com/article/google-search-ai-overviews-internet-traffic-ebb6bbbde17ed29a5f7b630d9e5e285b
Phi-3ファインチューニングサービスを発表
開発者が独自のサーバーを管理することなく、当初無料で、OpenAI の GPT-3.5 モデルと同等のパフォーマンスを発揮するPhi-3 小型言語モデルを微調整するサービスを発表しました。
Phi-3は、コンテキスト長は 4,000 ~ 128,000 の範囲で、コストは 1,000 入力トークンあたり 0.0003 米ドルから
1,000 入力トークンあたり 0.0005 米ドルの範囲とのこと。
OpenAIのGPT-4o miniの料金のちょうど2倍、出力トークンについては約1.5倍の値段になります。
また、偏見や毒性を軽減するためのガードレールを備え、企業が安全に使用できるように設計されているとしています。
加えて、Models-as-a-Service (サーバーレス エンドポイント)をGA。
Phi-3-small (画像入力を処理できる Phi-3-vision 今後間もなく)がサーバーレス エンドポイント経由で利用できるようになり、開発者は基盤となるインフラストラクチャを管理することなく、AI 開発を迅速かつ簡単に開始できるようになったとのこと。
Phi-3-mini-4k-instruct の場合、サーバーレス ファインチューニングの価格は、1,000 トークンあたり 0.004 ドル (100 万トークンあたり 4 ドル) からとしています。
Gemini 1.5 Proを発表
実験的な「バージョン 0801」をGoogle AI StudioとGemini APIを通じて早期テストとフィードバックに利用できるようになったとのこと。
このモデルは最大 200 万トークンの拡張コンテキストウィンドウをもち、多言語タスクに優れ、数学、複雑なプロンプト、コーディングなどの技術分野で強力なパフォーマンスを発揮するとしています。
OpenAI のGPT-4o (ELO: 1286) や Anthropic のClaude-3.5 Sonnet (ELO: 1271) などの強力な競合製品よりも優位(ELO:1300)とのこと。
<参照URL>
https://deepmind.google/technologies/gemini/pro/
https://www.reddit.com/r/Bard/comments/1dernor/gemini_15_pro_is_insanely_good/
AIチャットボットGemini AIに、Gemini1.5Flashを導入
Gemini 1.5 Flash (32,000 トークンをサポート)は、サブスクリプションのレベルに関係なく、すべてのユーザーが利用できるようになるとのこと。
Google によると、このアップデートにより、ユーザーは Gemini AI の応答品質と応答速度に関して「全面的に」改善され、推論機能と画像理解機能の改善を実感できるだろうとしています。
無料版において、ファイルアップロードも可能になり、たとえば、画像をアップロードしてモデルにそれに関する質問をしたり、経済学の学習ガイドを入力してモデルに練習問題を作成させたりすることが可能としています。
まもなくリリースされるもう 1 つの機能により、Gemini はデータファイルを分析し、それに基づいて視覚化やグラフを作成できるようになるともしています。
<参照URL>
https://blog.google/products/gemini/google-gemini-new-features-july-2024/
「より安全」、「より小型」、「より透明」であるとする3 つの新しい「オープン」生成 AI モデルをリリース
Gemma 2 2B
フットプリントが小さいため、デバイス上のアプリケーションに特に適しており、ラップトップやエッジデバイスなど、さまざまなハードウェアで実行できる分析テキストを生成する軽量モデル。
特定の研究および商用アプリケーション向けにライセンスされており、Google の Vertex AI モデル ライブラリ、
データ サイエンス プラットフォーム Kaggle、Google の AI Studio ツールキットなどのソースからダウンロード可能。
わずか 26 億のパラメータを含むこの新しい言語モデルは、OpenAI のGPT-3.5や Mistral AI のMixtral 8x7Bなど、
はるかに大規模な同等モデルと同等か、それを上回るパフォーマンスを発揮するとのこと。
ShieldGemma
ヘイトスピーチ、嫌がらせ、性的に露骨なコンテンツなどの有害性を検出しようとする「安全分類」のコレクション。
Gemma 2 をベースに生成モデルへのプロンプトやモデルが生成するコンテンツをフィルタリングするために使用可能。
Gemma Scope
開発者は Gemma 2 モデル内の特定のポイントの仕組みをより解釈しやすくすることが可能。
Gemma 2 によって処理された高密度で複雑な情報を解析し、分析と理解が容易な形式にするのに役立つ特殊なニューラル ネットワークで構成され、これらの拡張ビューを研究することで、Gemma 2 がどのようにパターンを識別し、情報を処理し、最終的に予測を行うかについて洞察を得ることが可能。
Character AIのCEOなどがGoogleに参加
もともとGoogleの社員であった社長とCEOがGoogle DeepMind AI 研究グループに返り咲き、Character AIのLLM 技術のライセンス供与に関する非独占契約を締結したとのこと。
Character.AI は、自社で開発したLLMを使用したチャットボットを提供しており、Web 版サービスの月間訪問者数が 1 億人に迫るとともに、モバイルアプリはリリース後1 週間以内に 170 万人のユーザーを獲得、チャットボットの応答時間を短縮する有料版を販売して収益を上げています。
Character.AI は、今回の取引で得た資金を自社の製品ポートフォリオの強化に充てる予定としています。
<参照URL>
https://blog.character.ai/our-next-phase-of-growth/
3rdParty Cookieの廃止計画を撤回
Googleは、Privacy Sandbox計画の一環として、3rdParty Cookieの廃止を段階的に行うとしていました。
これは、広告主がユーザーのデバイスにインストールして、オンライン アクティビティに関するデータを収集する3rdParty Cookieを来年初めまでに廃止することで、ブランドが消費者について収集できるデータの量を減らし、それによってオンライン プライバシーを向上させ、代わりにChrome に直接組み込まれたAIに置き換えるものです。
この AI はユーザーの閲覧アクティビティを分析して、ユーザーの関心分野を特定。
そこから AI は、サードパーティの Cookie のように閲覧履歴を明らかにすることなく、ユーザーの関心分野に関する情報を広告主に提供できるとしていました。
英国の競争・市場庁 (CMA) からこの計画は競合他社が同社の広告サービスと競争することが困難になる可能性があるかの監視対象となり、広告主によるユーザー追跡を常に防止できるとは限らないという懸念が表明され、結果、現段階では、Chrome で引き続き利用可能になる予定とのこと(Web サイトがユーザーの IP アドレスを追跡するのを防ぐIP 保護と呼ばれるプライバシー サンドボックス技術をChrome のシークレット モードで2025年に利用できるようにする予定)。
<参照URL>
https://privacysandbox.com/news/privacy-sandbox-update/
AndroidのPlayストアにAIを活用した新機能を追加
基準を満たさないアプリを大量に削除する予定と合わせ、Gemini AI をベースとして、 AI を活用したアプリ比較、類似アプリの自動整理カテゴリ、コンテンツ専用ハブ、データパーソナライゼーションコントロール、PC での複数のモバイル ゲームのプレイのサポートなどの機能が追加されます。
<参照URL>
https://blog.google/products/google-play/google-play-july-2024-new-updates/
自動運転タクシーWaymoに50億ドルを追加投入
Waymoは現在、サンフランシスコとフェニックスに加え、ロサンゼルスとオースティンなどで、1週間に5万回以上の有料配車サービスを提供しているとのこと。
また、中国Zeekr製Zeekr 009ミニバンベースのロボタクシー車両をサンフランシスコの公道でテストしています。なお、米国政府によるコネクテッドカー規制案に関する商務省の事前通知に対してパブリックコメントを提出し、Zeekrが提供するベース車両には「運転自動化やテレマティクスの機能が組み込まれていない」としています。
なお、ライバルでオリジナルのロボタクシーOriginの製造を目指していたGMのCuriseは計画を放棄、5億8300万ドルの損失を出しています。
<参照URL>
https://www.cnbc.com/2024/07/23/alphabet-to-invest-5-billion-in-self-driving-car-unit-waymo.html
https://www.reddit.com/r/sanfrancisco/comments/1e8bm7e/which_one_is_this_autonomoustesting_vehicle/?share_id=iugQar0UrPBnmgczr7sBo&utm_content=1&utm_medium=android_app&utm_name=androidcss&utm_source=share&utm_term=1
Apple
安全で安心、信頼できるAIを開発するというホワイトハウスの取り組みに参画・署名
AI 企業は、一般公開前に AI モデルをレッドチーム(敵対的なハッカーとして行動し、安全対策をストレステストする)でテストし、その情報を一般公開しなければなりません。
ホワイトハウスのコミットメントでは、Apple やその他の企業は、安全な環境で AI モデルの重みに取り組み、モデルの重みにアクセスできる従業員をできるだけ少なくすること、ユーザーが AI によって生成されたものとそうでないものを見分けられるように、透かしなどのコンテンツ ラベリング システムを開発することも要求しています。
一方、商務省は、オープンソース基盤モデルの潜在的な利点、リスク、影響に関する報告書を近日中に発表するとのこと。
オープンソース AI は、ますます政治的に規制の対象になりつつあり、AI のスタートアップや研究エコシステムが大幅に制限するなど業界全体に大きな影響を及ぼす可能性があるとされています。
Amazon
レジなしチェックアウトJust Walk Out向け生成AIモデルを発表
世界中の 170 を超える小売店で使用されているJust Walk Outにおいて、カメラからのビデオ、棚のセンサーからの重量信号、誰かが手に持ったものの写真や、製品に埋め込まれた RFID チップを入力情報として、テキストや画像を生成する代わりに、レシートを生成するとのこと。
以前は複数のモデルを組み合わせた複雑なものでしたが、単一モデルで、3D マップと 1 つのアクションに 統合したとしています。
入店時に支払い情報、クレジットカード、モバイルウォレットを提供するだけで買い物ができ、退店時には、購入した商品の支払いが領収書とともに発行されます。
<参照URL>
https://www.aboutamazon.com/news/retail/amazon-just-walk-out-improves-accuracy
Connect Contact Lens にコール後の作業を支援する新機能を発表
Contact Lens は、何十万件にもおよぶコンタクトセンターと顧客との会話をAI で要約して生成するツールを提供します 。
Amazonは、データを収集するのは得意だが、データを取得して何かを行うことが 苦手だったとし、生成 AI による要約機能からを提供を開始。通話終了後数秒以内に概要が生成され、通話後のレポートを作成する際に、関連する詳細とともに通話の概要を迅速かつ簡単に提出できるようになるとのこと。
今回の新機能では、主要な議論のポイント、提起された問題、実行されたアクション、その他の重要なコンテキストをまとめた詳細な要約を生成するとのこと。
<参照URL>
https://docs.aws.amazon.com/ja_jp/connect/latest/adminguide/analyze-conversations.html
Meta
4050 億パラメータ、128,000 トークンのコンテキスト ウィンドウを持つモデル Llama 3.1 405B をリリース
2024 年までの 15 兆トークン(7,500 億語相当)のデータセットを準備し、合成データも組み合わせて、16,000個のNvidia H100 GPUを使用してトレーニングされたこのモデルは、新しいトレーニングおよび開発手法の恩恵も受け、OpenAIのGPT-4oやAnthropicのClaude 3.5 Sonnetなどの主要な独自モデルと競合できるとしています。
また、 AWS、Azure、Google Cloud などのクラウドで使用でき、WhatsApp や Meta.ai でも使用され、米国ベースのユーザー向けのチャットボット エクスペリエンスを強化しているとのこと。
Llamaは、現状テキストベースですが、画像や動画を認識し、音声を理解 (および生成) できるマルチモーダルなLlama モデルを積極的に開発しているとのこと。
<参照URL>
https://ai.meta.com/blog/meta-llama-3-1/
https://about.fb.com/news/2024/07/open-source-ai-is-the-path-forward/
画像を見て、それが何を見ているのかを説明できるセグメンテーションモデルSegment Anything 2を発表
木に部分的に隠れている犬や、雨漏りした屋根から雨水を溜めているバケツなどを識別、前VersionのSA1 と SA2 の違いは、後者は画像だけでなくビデオにも適用できることとのこと。
画像セグメンテーションをビデオに適用することは不可能だったとし、サンゴ礁や自然の生息地などを研究するために、こうしたモデルをよく使い、かつビデオで実行でき、ゼロショットで、望むことを伝えられるのがポイントとしています。
SA2 モデルはオープンソース化されており、GitHubからダウンロードでき、無料のデモも入手できます。
また、利用した膨大な量のデータに関しても、トレーニング用に特別に作成された約5万本のビデオの注釈付きデータベースを公開しているとのこと。
AI研究の大半はオープンソース化されているものの、依然として商業的利益を重視していることは間違いなく、Metaの最終的な目標は、ユーザーのコンテンツをすべて引き出し、一種のビジネス エージェントを迅速に立ち上げて
「顧客とやり取りし、販売や顧客サポートを行う」こととのこと。
<参照URL>
https://about.fb.com/news/2024/07/our-new-ai-model-can-segment-video/
https://github.com/facebookresearch/segment-anything-2
AI SutudioをGA
6月からベータテスト中だったAI Studioを米国のすべてのクリエイターに展開、パーソナライズされたAI搭載チャットボットを作成できるようにすると発表しています。
独自のプロンプトや提案されたテンプレートを使って、キャプションの作成、投稿のフォーマット、ミームの生成を行うボットを構築できるとのこと。
チャットボットは自分専用に使用したり、誰とでも共有したりでき、これらのチャットボットは、Instagram、Messenger、WhatsApp、Web などの Meta のサービス全体で機能するとしています。
<参照URL>
https://about.fb.com/news/2024/07/create-your-own-custom-ai-with-ai-studio/
Metaの顔認識ソフトウェアの使用によってプライバシー権が侵害されたとしてテキサス州に起訴された件で、14億ドルの和解金を支払うことにFacebookが自動写真タグ付け機能を通じてユーザーがアップロードした写真や動画から何百万もの生体認証情報を収集、この慣行をユーザーに開示せず、同意を得なかったととされ、テキサス州に5年間で14億ドルを支払うことに同意しており、最初の5億ドルの支払いは来月になる予定とのこと。
※2019年にFacebookはシステムを明示的にオプトインにし、2021年までに顔認識システムをシャットダウン、10億人を超えるユーザーの生体認証データの膨大なコレクションを削除。その際、集団訴訟を起こされ、和解金として6億5000万ドルの支払いを命じられています。
企業
Accenture
NVIDIA AI Foundry上で開発された Accenture AI Refinery フレームワークのリリースを発表
クライアントが Llama 3.1 モデルを使用してカスタムLLMを構築できるように設計されており、企業は独自のデータとプロセスを使用してこれらのモデルを改良およびパーソナライズし、ドメイン固有の生成 AI ソリューションを作成できるとのこと。
Accentureは、企業は『なぜそれをやるべきなのか? ユースケースは何か?』と尋ねるとし、従業員の生産性について考えるとき、1 日の時間がもっとあればいいのに、に生成AI は、要約、ベスト プラクティス、次のステップなど、反復的で単調なタスクを自動化して応えるとしています。
このフレームワークには以下の4つが含まれるとのこと。
#1ドメインノードのカスタマイズとトレーニング
企業は独自のデータとプロセスを使用して LLM モデルを改良し、特定のビジネス ニーズに対するモデルの関連性と価値を高めることが可能。
カスタマイズは AI Foundry 上で実行されるため、堅牢で効率的なモデルトレーニングを実現。
#2スイッチボード プラットフォーム
ユーザーは特定のビジネス コンテキストやコストや精度などの基準に基づいてモデルを選択して組み合わせ可能。
#3Enterprise Cognitive Brain
企業のデータと知識をスキャンしてベクトル化し、生成 AI システムの機能を強化する企業全体のインデックスを
作成。
#4エージェントアーキテクチャ
AI システムが自律的に動作できるように設計されたアーキテクチャ、人間の監視を最小限に抑えながら責任ある AI の動作をサポート。
Chevron
AIを活用した石油採掘を概説
石油・ガス事業では膨大な量のデータが生成され、例えばニューメキシコ州の地震調査では、1 ペタバイトのファイルが生成されるとのこと。
判断に使える画像に変換するには、100 エクサフロップスの演算が必要で、このようなデータ処理をサポートするために、2008 年から GPU を活用してきたとしています。
現在、最新の生成 AIツールを活用して、膨大なデータセットからさらに多くの洞察と価値を引き出しているとのこと。
例えば数マイルに及ぶ油井において、他の企業がその井戸の周辺で作業している可能性があり、生成AI が干渉を警告して、人間のユーザーが積極的に介入し、どちら側も混乱しないようにできるとのこと。
また、エンジニアリング基準、仕様、安全速報、その他の警告を作成するためにLLMを活用し、絶えずモデルの微調整を行っているともしています。
加えて、ロボットモデルも使い始めており、危険な作業はロボットにやらせ、人間は安全な場所にいて、作業がきちんと行われているか確認するなどの構想を持っているとのこと。
<参照URL>
https://venturebeat.com/ai/how-chevron-is-using-gen-ai-to-strike-oil
Googleを除くBingなど一部の検索エンジンによるRedditのコンテンツへのアクセスをブロック
robots.txt ファイルに最近変更が加えられ、Reddit コンテンツをスクレイピングしようとする検索エンジンやその他のサービスに対し、無許可のスクレイパーをブロックするコードと、「Reddit はオープンなインターネットを信条としていますが、公開コンテンツの悪用は信条としていません」というテキストを追加したとのこと。
非営利目的で使用する研究者やその他の特定の団体にコンテンツへのアクセスを提供する予定であるともしています( Google と年間 6,000 万ドルになるとされるコンテンツ ライセンス契約を結んだので、Googleは除外)。
<参照URL>
https://www.redditinc.com/blog/robot-txt-update
Tesla
2026年に人型ロボットOptimusの販売を開始すると発表
OptimusはすでにTeslaの施設の一つで、バッテリーの取り扱いなどの作業を自律的に実行し始めているとのこと。
来年、社内使用向けにヒューマノイドロボットを少量生産し、できれば2026年には他社向けに大量生産する予定としています。
<参照URL>
https://digitalassets.tesla.com/tesla-contents/image/upload/IR/TSLA-Q2-2024-Update.pdf
ベンダ
OpenAI
Webから情報を得て質問に「タイムリーな回答」を提供するAI検索機能Search GPTを発表
暫定的なプロトタイプとしていますが、クエリを入力すると、SearchGPT は Web からの情報と写真、および関連ソースへのリンクを提供します。
また、追加の質問をしたり、サイドバーで追加の関連検索を調べたりすることができます。
一部の検索では、一般的な位置情報を「収集してサードパーティの検索プロバイダーと共有」し、結果の精度を向上させます(近くのレストランのリストや天気予報の表示など)。
設定メニューの切り替えにより、ユーザーがより正確な位置情報を共有することもできます。
Search GPTは、まず「小規模なグループ」のユーザーとパブリッシャー向けにリリースされ、将来的には SearchGPT の一部の機能を ChatGPT に統合する予定とのこと。
Google の AI を利用した検索である AI Overviews は批判の的になっており、盗作、不正確さ、コンテンツの食い合いなどが問題視されているとともに、情報源となっているサイトへのトラフィックを食いつぶす恐れがあるとされています。
<参照URL>
https://openai.com/index/searchgpt-prototype/
GPT-4o Long Outputを発表
現時点ではアルファ版ですが、より長い出力コンテキストが欲しいというフィードバックに基づき、GPT-4oから出力サイズが大幅に拡張されており、GPT-4oの4,000トークンから最大64,000トークンまでの出力が可能で、16倍増加させています。
※最大コンテキストウィンドウは 128,000 のまま
API上に構築するサードパーティの開発者にとっては、チャットボットが最大約 200 ページの小説ほどの長さの、はるかに長い応答を返すことができるようになります。
モデルの価格は次のとおりです。
「100万入力トークンあたり6ドル、100万出力トークンあたり18ドル」
「100万入力トークンあたり5ドル、100万出力あたり15ドル」の通常のGPT-4o、「100万入力トークンあたり0.15ドル、100万出力トークンあたり0.60ドル」のGPT-4o miniの価格と比較して価格は抑えているとのこと。
<参照URL>
https://openai.com/gpt-4o-long-output/
GPT-4o Miniを期間限定無料でファインチューニング可能と発表
コア技術に対するコントロールを維持しながら、開発者をエコシステム内に留めることを目指し、9 月 23 日まで開発者は追加費用なしで GPT-4o ミニ モデルを特定のアプリケーション向けにカスタマイズできるとのこと。
<参照URL>
https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/
https://medium.com/pondhouse-data/fine-tune-openais-gpt-4o-mini-llm-ai-model-for-free-37c7222e95eb
GPT-4oのリアル音声応答を提供開始
ユーザーは iOS および Android 向けの公式 ChatGPT モバイル アプリで AI チャットボットとより自然に会話できるようになります。
現在はα版で、ChatGPT Plusの少数のユーザーに公開され、2024年秋にすべてのPlusユーザーに段階的に展開される予定とのこと。
<参照URL>
https://openai.com/index/chatgpt-can-now-see-hear-and-speak/
Mistral AI
フラッグシップ モデルMistral Large 2をリリース
Large 2 によってオープン モデルのパフォーマンスとコストの基準が引き上げられるとのこと。
Google Vertex AI、Amazon Bedrock、Azure AI Studio、IBM watsonx.ai で使用できます。
*商用利用するには、有料ライセンスが必要
1230 億のパラメーターでコード生成などでLlama3.1 405B(4050億パラメーター)を上回っています。
加えてもっともらしいことをでっち上げるのではなく、知らないことがあるときにはそれを認めるなど、
より識別力のある応答をするようにトレーニングされているとしています。
なお、多言語対応ではありますが、マルチモーダルではありません。
<参照URL>
https://mistral.ai/news/mistral-large-2407/
Stability AI
3Dビデオ生成用の新しいAIモデルであるStable Video 4Dを発表
Stable Video Diffusionモデルをベースとする最新モデルは、
ビデオを入力として受け取り、3D 物体を 8 つの異なる視点から撮影した複数の角度のビューに変換。
物体の動きを含め、物体が見えない側からどのように見えるかを解釈し、
さまざまな角度からその動きや外観を再現できるとのこと。
5フレームのビデオを約40秒で生成することができ、最適化プロセス全体には約20〜25分かかるとしています。
<参照URL>
https://stability.ai/news/stable-video-4d
3D画像生成のための超高速モデル Stable Fast 3Dをリリース
1枚の2D画像から3Dモデルを約0.5秒という超高速で作成するとのこと。
ゲームやバーチャルリアリティ、小売、建築、デザインの分野で企業やインディーズ開発者のニーズに応えるとしています。
<参照URL>
https://stability.ai/news/introducing-stable-fast-3d
xAI
Elon Muskが率い、LLM Grokを開発するxAI、メンフィス・スーパークラスターでトレーニングを開始したと発表
このクラスターは10万個の液冷式 NVIDIA H100 GPUと単一の RDMA ファブリックで構成されているとのこと。
今年の 12 月までにあらゆる基準で世界最強の AIをトレーニングすることを目指しているとしています。
<参照URL>
https://wreg.com/news/local/xai-memphis/training-starts-at-musks-xai-supercomputer-facility/
Cohere
Series D 5億ドルを調達し、同社の評価額が55億ドルに達したと発表
企業が従業員をサポートし、ビジネスシステムを自動化するために実装できる実用的な、企業の効率化のための AI の構築を掲げるCohereの調達総額は9億7000万ドル。
PSPインベストメンツが主導し、Cisco、富士通、AMDベンチャーズ、カナダの輸出信用機関EDCなどが参加しています。
<参照URL>
https://www.bloomberg.com/news/articles/2024-07-22/ai-startup-cohere-valued-at-5-5-billion-in-new-funding-round?srnd=undefined
https://www.linkedin.com/posts/cohere-ai_ai-startup-cohere-valued-at-55-billion-activity-7221142549883707394-p00g?utm_source=share&utm_medium=member_desktop
Snowflake
イスラエルAI21 Labs の企業向けJamba-Instruct LLMをCortex AI サービスに追加すると発表
Snowflake Coretex AIは、Snowflake 独自の Arctic や、Google、Meta、Mistral AI、Reka AIなどの LLM を幅広くカバー。
今回追加したモデルにより、Snowflake のエンタープライズ顧客は、品質と精度を損なうことなく長いドキュメントを処理できる生成 AI アプリケーション(チャットボットや要約ツールなど)を構築できるようになるとのこと。
AI21 LabsのJambaは、実証済みのトランスフォーマー アーキテクチャと新しいメモリ効率の高い構造化状態空間モデル (SSM) を組み合わせたオープン生成 AI モデルです。
このハイブリッド モデルは、ユーザーに 256K の巨大なコンテキストウィンドウ(LLM が処理できるデータ量、約 800 ページのテキストに相当)へのアクセスを提供し、52B のパラメーターのうち 12B のみをアクティブ化、選択したパラメータをアクティブにするMixture of Experts(MoE)レイヤーを組み合わせることでパフォーマンスだけでなく効率性も実現しています。
Mixtral 8x7B(同クラスの別のモデル)と比較して、長いコンテキストで 3 倍のスループットを実現し、企業の財務履歴、収益報告の記録、長時間の臨床試験のインタビューなど、広範なドキュメント処理に関連するさまざまなユースケースで活用できるとしています。
<参照URL>
https://docs.snowflake.com/en/release-notes/2024/other/2024-07-25-new-llm-model-jamba
https://www.ai21.com/blog/jamba-instruct-on-snowflake-cortex-ai
Salesforce
Workdayと、高度な AI 機能とデータ統合によって企業ソフトウェアを刷新する戦略的パートナーシップを発表
従業員、顧客、財務データをより利用しやすくし、企業の生産性と効率性を高めるとし、日常的なタスクを自動化するAI 従業員支援サービスエージェント、Workday の HR および財務データと Salesforce の CRM データを統合する統合データ基盤、Slack とのシームレスな統合という 3 つの主要コンポーネントを中心に展開するとのこと。
<参照URL>
https://www.salesforce.com/jp/news/press-releases/2024/08/02/workday-employee-service-agent/
1 兆個のテキスト トークンと 34 億枚の画像を含む巨大なオープンソース データセットであるMINT-1Tを公開
Webページや科学論文など、幅広いソースから情報を取得、これまで公開されていたデータセットの 10 倍の大きさで、画像とテキストの自由形式のInterleave Sequenceを特徴とするMultimodal Interleave Data Setであり、マルチモーダル学習に有効とされています。
これにより、小規模な研究室や個人の研究者が、大手テクノロジー企業に匹敵するデータにアクセスできるようになった点で大きな影響を与えるとされています。
一方で、膨大な量のデータにより、プライバシー、同意、ソース マテリアルに存在する偏見を増幅する可能性など、複雑な問題が生じるとされています。
データセットが増加すれば、社会的な偏見や誤った情報が AI システムに誤ってエンコードされるリスクも増加します。
さらに、量を重視することと、データの質と倫理的な調達を重視することのバランスを取る必要があり、AI コミュニティは、公平性、透明性、説明責任を優先するデータ キュレーションとモデル トレーニングのための堅牢なフレームワークを開発するという課題に直面しているとされます。
<参照URL>
https://github.com/mlfoundations/MINT-1T
https://arxiv.org/pdf/2406.11271
NVIDIA
企業が特定のニーズに合わせたカスタムの大規模言語モデルを作成し、展開するのを支援するAI Foundryを発表
NVIDIAは、単なるハードウェアメーカーではなく、フルスタックAIソリューションプロバイダーとしての地位を確立しようとしています。
AI Foundry は、DGX Cloudなどのハードウェア、NeMoなどのソフトウェアツール群、NVIDIAのAI スペシャリストによる専門的なガイダンスを組み合わせて、Meta が最近リリースしたLlama 3.1などのオープンソースモデルを
特定のビジネス ユース ケースに適応させる複雑なプロセスを簡素化し、企業がカスタマイズバージョンを開発できるようにするとのこと。
また、カスタマイズされたモデルをコンテナー化された API アクセス可能な形式にパッケージ化し、簡単に展開できるようにするNIM (Nvidia Inference Microservices)を発表しています。
<参照URL>
https://blogs.nvidia.com/blog/ai-foundry-enterprise-generative-ai/
Nvidia Inference Microservices(NIM) のライブラリを大幅に拡張
Hugging Face Inc. の推論サービスが Nvidia クラウド上で利用可能になり、3 次元のトレーニングと推論をサポートするとのこと。
NIM は、NVIDIA AI Enterprise スイートの一部として提供されるコンテナ化されたマイクロサービスのセットであり、AIモデルの導入を簡素化し、高速化するとしています。
それぞれがさまざまなハードウェア設定に合わせて調整された最適化された推論エンジンであり、APIを介してアクセスできるため、レイテンシと運用コストを削減し、パフォーマンスとスケーラビリティを向上できるとのこと。
開発者は NIM を使用して、大規模なカスタマイズを行わずに AI アプリケーションを迅速に導入し、独自のデータを使用してモデルを微調整できるとしています。
Hugging Face は Nvidia の DGX クラウド上で推論サービスとして提供し、Hugging Face の 400 万人の開発者に、サーバーレス推論でのより高速なパフォーマンスとより容易なアクセスを提供。
自然言語処理と機械学習の開発とステージングに特化したプラットフォームと、テキスト分類、翻訳、質問応答などの NLP タスク用の事前トレーニング済みモデルのライブラリを提供し、NLP モデルを操作するためのリソースを提供するオープンソースの Python ライブラリであるTransformers での使用に最適化されたデータセットの大規模なリポジトリも提供するとしています。
<参照URL>
https://huggingface.co/blog/inference-dgx-cloud
https://blogs.nvidia.co.jp/2024/07/31/hugging-face-inference-nim-microservices-dgx-cloud/
人型ロボットの開発を加速
次世代のヒューマノイド ロボットの開発、トレーニング、構築のためのサービス、モデル、コンピューティング プラットフォームを提供し、AI モデル開発者やソフトウェア メーカーを支援しているとのこと。
提供されるサービスには、ロボットのシミュレーションと学習のためのNIM マイクロサービスとフレームワーク、マルチステージのロボット ワークロードを実行するための Nvidia Osmo オーケストレーション サービス、開発者が少量の人間のデモンストレーション データを使用してロボットをトレーニングできるようにするAI シミュレーション対応の遠隔操作ワークフローなどがあるとのこと。
ロボット工学者は、Nvidia Omniverse プラットフォーム上に構築されたロボット シミュレーションのリファレンス アプリケーションである Nvidia Isaac Sim で、生成 AI のシミュレーション ワークフローを強化でき、モデルを実行するための Nvidia Jetson Thor ヒューマノイド ロボット コンピューターが提供されます。
Boston Dynamics、ByteDance Research、Figureなどが早期アクセス プログラムに参加しているとのこと。
なお、2月の最終ラウンドでOpenAIなどから6億7500万ドルの出資を受けたFigureは、最新モデル「Figure 02」の予告動画を2024年8月6日の日付とともに公開しています。
<参照URL>
https://venturebeat.com/ai/nvidias-latest-ai-offering-could-spark-a-custom-model-gold-rush/
Github
開発者が生成AI を使ってアプリケーションを試用および構築するための簡単な導入手段を提供するGitHub Modelsを発表
GitHub Models は、Meta の Llama 3.1、OpenAI のGPT-4o、Mistral Large 2、AI21 Jamba-Instruct、Microsoft Phi-3、Cohereのモデルを含む、より広範な AI モデルへの直接アクセスを開発者に提供。
開発者はさまざまなモデルを試すために多くのサイト間を行き来し、複数のアカウントを作成する必要があったとし、既存の GitHub ID を使用して GitHub プラットフォーム内で直接アクセスして実験できるAI モデルの集中カタログを提供、開発者が単なるコード補完にとどまらず、生成AI モデルを試して独自のアプリケーションに統合できるようにするとのこと。
また、ユーザーが AI 搭載アプリケーションの実験から実環境(Azure)への展開に簡単に移行できるパスも提供しています。
<参照URL>
https://github.blog/news-insights/product-news/introducing-github-models/
Intel
第13/14世代Core CPUにおける不安定性の問題の原因をついに特定したと発表
現在、当該世代のデスクトップ向けCPUにおいて、CPUのマイクロコード(プロセッサー上で実行される、低レベル演算を制御するファームウェア)の問題が原因で、プロセッサーが必要以上の電圧を要求し、安全な動作範囲を超過してしまい、動作不安定となるとのこと。
8月中旬までに影響を受けるチップの「マイクロコードアップデート」をリリースする予定としています。
このパッチにより、ゲームやその他のタスク実行中にCPUがクラッシュするという2023年12月にまで遡る問題がようやく解決されます。
ただし、マシンにクラッシュが発生した時点で、そのCPUに回復不能な損傷が発生している可能性もあるとされ、Intelは、クラッシュしたさいにはサポートに連絡するよう求めています。
Fortanix
断片化された暗号化セキュリティリスクを発見、評価、修復できるようにする Key Insight ソリューションの拡張を発表
データが複数のクラウド環境やオンプレミス環境に分散しているため、組織は暗号化キーがどこにあるか、暗号化がどの程度適切に適用されているかを把握できないことがよくあります。
さらに、企業の暗号化セキュリティ体制の詳細を手動で検出して列挙することは複雑で時間がかかります。
Key Insight はデータベースとストレージをスキャンして、ハイブリッドクラウド環境全体で暗号化キーとデータ サービスを検出できるようになったとのこと。
これにより、通信、医療、金融サービスなどの規制の厳しいセクターがコンプライアンスを満たすために機密データを暗号化することが多いという問題に対処可能になるとしています。
ユーザーはオンプレミスで暗号化キーと関連データ サービスをスキャンできるようになり、チームは単一のプラットフォームから暗号化セキュリティ態勢を検出、評価、修正できます。
また、アクセス制御を改善するためのフェデレーション認証が含まれており、組織の既存の ID アクセス管理インフラストラクチャへのシームレスな統合が可能になるとのこと。
<参照URL>
https://support.fortanix.com/hc/en-us/articles/25755753679252-Fortanix-Key-Insight-Overview
PagerDuty
生成AI機能を追加したPagerDuty Advanceを発表
関連するコンテキストを明らかにし、レポートを読むという面倒な作業を減らしてインシデントのライフサイクルを一部自動化することで、停止やインシデントへの最初の対応を支援するとのこと。
情報技術の専門家やエキスパートは、ログを調べるのではなく、根本原因の解決やシステムのオンライン復帰に多くの時間を費やすことができるとしています。
また、Advancedは、Slack 内で直接機能し、簡単なプロンプトを使用して、インシデントに関する重要な情報の要約をすばやく取得できるとともに、一般的な診断の質問を予測して、解決を迅速化するためのトラブルシューティング手順を提案できるともしています。
加えて、進捗状況や現在の課題に関するステータス更新の下書きも自動生成し、プロセス中のレポート作成や事務処理の煩雑さを軽減。
インシデントが 解決された後の事後検証でも同様の動作が行われ、生成されたすべてのデータを収集して主要な調査結果のハイライトと、問題が再発しないようにするための推奨される次のステップが含まれるレビューを生成可能とのこと。