Dell'Oroは、昨年、通信機器市場全体が5%下落したとし、主に、北S米市場がRAN とブロードバンド アクセスの両方における活動の弱さから約20%鈍化、アジア太平洋地域の前向きな発展が欧州全体の成長鈍化をほぼ補ったとしています。
その結果、相対的に見て、China Banにも関わらず、Huaweiの市場シェアは2022年の28%から増加し、2023年の通信機器収益の30%を占めるとされています。
一方で、5GSA導入は失速しており、後進国の通信事業者においては、 5G収益化への懸念が根強く残っているため、5G 導入計画の策定を予想よりも遅くなっており、通信支出の低迷がさらに悪化しているとされています。
そのため、通信市場は2023年ほどではないものの、2024年も厳しい状況が続く可能性が高く、現在の市場予測はせいぜい前年比横ばいであると予想されています。
OpenRAN 展開については単一の大手サプライヤーに大きく依存する傾向が続き、中小規模ベンダー(OpenRAN を推進するために起業された企業)は、より広範な市場に影響を与えることができない可能性があるという見方が広まっています。
OpenRANでSamsungをテストする仏Orangeは、セットで組み合わせるほうが簡単で、小規模ベンダーがこの取り組みに参加するのは非常に難しいリスクがあるとし、英Vodafoneは、Parallel Wirelessと協力して、当初は非常に目立っていたが、今ではもう参考にならないとしています。
*ParallelWirelessもMavenirも人員削減を行い、経営方針を変えるなどしているが、アナリストに「破産に向かって悪循環に陥っている」とされます。
つまるとことの障壁は、OpenRAN インターフェイスを使用すると、通信会社は同じモバイルサイトで複数ベンダーを組み合わせることができるが、マルチベンダー ネットワークの複雑さに対処せねばならず、運用コストは削減されず、その結果、通信事業者はサイトごとに単一ベンダーのアプローチに落ち着いてしまったことです。
マルチベンダRANでは、パフォーマンスの鍵となるCU/DUのベースバンドソフトウェアを持つベンダが主導権を握り、Massive MIMOではDUとRUのアルゴリズムを合わせる必要があり、OpenRANでMassive MIMOのパフォーマンスは現状出せず、研究開発の3分の1がシステム統合に費やされます。
単一ベンダーの世界では、システム統合からハードウェアに至るまで網羅するリソースを持つ大手キットベンダーが自然と有利になり、Dell'Oro Group は、マルチベンダーのOpenRAN 導入は2028 年までに RAN 市場の 10% に過ぎないとしています。
結果、「数十億規模のビジネスを今そこに置くか? 成熟度が低いので躊躇している、まだそこには来ていない。」となっています。
<参照URL>
https://www.lightreading.com/open-ran/telcos-doubt-open-ran-challengers-will-have-a-role
Boston Dynamics、Tesla、Google DeepMind、Archer Aviation の元従業員で構成され、26億ドルの評価額であるスタートアップFigureが、OpenAIがトレーニングをしたVLMを搭載した人型ロボットFigure 01のデモを公開。
ロボットがあたかも人間と非常に自然に対話し、従い、望むことを直感しているように見える動作で、これまでの他社の多くの例よりもはるかにスムーズに動作する様子が示されています。
*LLMであることを考えれば、SFでよくあるAIの反乱とか考えるものではないです。
<参照URL>
https://twitter.com/adcock_brett/status/1767913955295744449
dishの全国5Gネットワークが米国人口の70%以上に35Mbps以上のダウンロード速度を提供
<参照URL>
https://www.google.com/finance/quote/SATS:NASDAQ?hl=en
電力が高騰し、天然資源が不足する中、GPUが非常に高価であるという、非常に奇妙な状況だとし、今後数年以内にNVIDIA GPUの今の価格の数分の1の価格で、はるかに優れたパフォーマンスを備えた代替品が登場するのではないか(Google TPUやその開発者のスタートアップGroqが開発するLPUなど)と見ており、間違った時期に資金を投資すると、減価償却費が莫大になり、償却額が巨額になる可能性があるとしています。
エッジで展開可能な最大 100 億のパラメータを備え、ユーザー デバイスに展開可能なSLMに注目し、従業員が、NOCやSOC(ネットワークおよびサービスオペレーションセンター)と「分かりやすい言葉で」会話して「何が起こっているのか」を知ることが可能になるような、特定のシナリオに効果のある適切なモデルを組み込むことができる AI ツールの構築に資金を投入するとのこと。
OCPのOpen Rack v3に設置したGrand Tetonサーバ にNvidia H100 GPU を含む総計224,576 GPU を搭載した2クラスターを構築。(年末までに 350,000 GPU を超える予定としています)
各クラスタの400Gbps CLOSネットワークは、OCPのWedge400 および Minipack2、Arista 7800 で構成されたRoCEv2ネットワークと、Mellanox Quantum2 InfiniBandネットワークでそれぞれ構成。
また、分散ネットワークストレージは、スタートアップ Hammerspaceと協力、OCPのYosemite v3 +Sierra Pointのモジュラー型サーバと、Metaの分散ストレージ プラットフォーム Tectonic によって構成され、バックアップしているとのこと。
このクラスタにより、Llama 3を含む、より新しく強力なAIシステムをトレーニングするとしています。
<参照URL>
https://engineering.fb.com/2024/03/12/data-center-engineering/building-metas-genai-infrastructure/
2024年は選挙の年と言われ、64 か国で大規模な選挙が行われ、生成AIアプリが悪用される可能性が高まり、地球上のほぼ半数の人々に影響を与える懸念があることから保護機能の向上が図られるまで制限されるとのこと。
Vertex AI Search for Healthcareは、医療システム従事者が管理上の問題や膨大な数の臨床記録に対応できるように、データアクセスのための MedLM、 Healthcare Data Engine 、Cloud Healthcare APIなどを使用して、検索やAIチャットボット機能が医療システム全体の幅広いデータに接続できるようになったとのこと。
また、Healthcare Data Engine を使用すると、医療機関は患者記録をクラウドに大規模にアップロードできるとしています。
これらにより、看護師や臨床医が入力した電子医療記録データ、スキャンされた文書、その他の臨床データを理解できる、医学向けの検索機能により、医療従事者は、多数の文書やメモを自分で検索する必要がなく、必要なものを入力するだけで素早く見つけられ、かつ医療用語や独自のコンテキストを理解するチャットボットを作成できます。
AIモデルやその他のワークロードをホストするバッテリー駆動のDCネットワークを構築する予定とのこと。
一部のエンタープライズ アプリケーションは 24 時間稼働する必要があるが、その他のアプリケーションは設定された間隔でのみアクティブ化されるとし、時々実行するだけでよいアプリケーションをホストするサーバーを、電力網への影響が最小限に抑えられる時間にアクティブ化できるように停電時用のバックアップバッテリーを活用し、セクションの余剰エネルギーを他のセクションに送るなど、顧客のワークロードと電力使用量を管理するとしています。
<参照URL>
https://sidewalkinfra.com/news/powering-the-data-future-sustainably-introducing-verrus
AWS・GCPに続きAzureも同様の決断をしました。
来年発効されるクラウドプロバイダーの切り替えを容易にすることで競争を促進する欧州データ法に定められた規定に沿って、Azure からデータを移行する選択もサポートするとしています。
ただし、契約終了を選択した顧客のみかつ無料転送はストレージデータにのみ適用され、顧客はデータの転送後にすべての Azure サブスクリプションを解約する必要があるという要件が設けられているため、マルチクラウドユーザーにはメリットがありません。(毎月 100 GB のデータを Azure から無料で転送できるが、焼け石に水)
<参照URL>
https://azure.microsoft.com/en-us/updates/now-available-free-data-transfer-out-to-internet-when-leaving-azure/
https://learn.microsoft.com/en-gb/azure/cost-management-billing/manage/cancel-azure-subscription#create-a-support-request
Open AI GPT-4をベースとし、最初のセキュリティ用生成AIを謳うCopilot for Securityは、組織が前例のないサイバー攻撃の急増と、熟練したセキュリティ人材の深刻な不足に直面している中、(サイバー犯罪による世界経済の損失は今年だけで 8 兆 5,000 億ドルに上ると予測され、400 万人のポジションが埋まっていない)進化し続けるサイバー脅威に対処するセキュリティ専門家を支援するとしています。
Microsoft Defender XDR、Microsoft Sentinel、Microsoft Purview、Microsoft Entra、Microsoft Intune やサードパーティ ツールなどと連携し、修復手順を提供し、レポート作成などの時間のかかるタスクを自動化するとのこと。
<参照URL>
https://www.microsoft.com/security/business/ai-machine-learning/microsoft-security-copilot
Microsoft Copilot for Security: AI-Powered Security for All
https://microsoft.github.io/PartnerResources/skilling/microsoft-security-academy/microsoft-security-copilot
企業は RAG を使用して、OpenAI GPT-4 を社内のドキュメントクラウドに接続、会社のポリシーや人事に関する情報 (会社がアクセスを許可している場合) などを引き出すことができ、従業員が、技術やプログラミングの知識がなくても、特定の職務責任・タスク・働き方・ワークフローに対応するアプリを作成できるようになるとのこと。
<参照URL>
https://www.microsoft.com/en-us/microsoft-365/enterprise/copilot-for-microsoft-365#Pricing
DarwinAI はプリント基板のハードウェアの問題を見つけるための機械学習プラットフォームを開発、また、AIシステムの小型化と高速化にも注力しています。
プリント回路基板 (PCB) はマザーボードやUSB フラッシュ ドライブなどの単純なデバイスにも利用されており、電子コンポーネントが PCB に取り付けられると、プリント基板アセンブリになります。
DarwinAI は、このようなアセンブリの障害を自動的に検出でき、メーカーの品質保証における手作業の量を削減できるとされます。
自社のデバイス用部品の製造を担当する委託製造業者に、このソフトウェアを使用させることで、欠陥のあるコンポーネントをより効率的に検出できるようにするとともに、オンデバイスの生成 AI 機能に役立てるのではないかとのこと。
新しい方法でファンにリーチしようとしているブランドやロイヤルティプログラムにはまだ価値を見出すことができるとの話もありますが、NFTマーケットは過去最高値から大幅に減少しています。
<参照URL>
https://odyssey.starbucks.com/#/faq
A 地点から B 地点まで大量の荷物を移動するなど、反復的で物理的に負担がかかる作業の自動化において、ヒューマノイドは投資家の関心を集めています。
Amazonが一部のフルフィルメントセンターでAgilityのDigitロボットのテストを開始し、今年1月にはFigureがBMWとの契約を発表するなど人型ロボットのテストが増えています。
これらの企業が継続的な成功を収めるには、今後数年間が非常に重要であり、有意義な ROI を証明することが求められています。
<参照URL>
https://apptronik.com/news-collection/apptronik-and-mercedes-benz-enter-commercial-agreement
Grafana Agent または Grafana Agent Operator を使用して K8s インフラのデータを手動で構成する必要なくなり、Grafana Kubernetes Monitoring Helm チャートを使用して、メトリクス、ログ、イベント、トレース、コスト メトリクスの Grafana Cloud への転送が自動化されるとのこと。
また、Grafana Cloud上で、「問題のあるポッド」セクションからトラブルシューティング操作を開始でき、アラートの重要度順に表示されるクラスター/Namespaceごとのアラートの詳細のグラフを確認することで、最も差し迫った問題をより迅速に解決できるようになるともしています。
Grafana Kubernetes Monitoring では、使用されているクラウド プロバイダーや K8s ディストリビューションに関係なく、影響を受ける各クラスター、ノード、ポッド、コンテナのグラフとともに、重大な問題のスナップショットが提供され、履歴データ分析を迅速に表示できる「タイムピッカー」機能もあり、ユーザーは特定の時間枠におけるリソースの使用状況を調べて、非効率性やコスト管理に適切に対処できるともしています。
<参照URL>
https://grafana.com/about/press/2024/03/12/grafana-labs-announces-updates-to-kubernetes-monitoring-solution-open-source-innovations-and-findings-from-2024-observability-survey/
https://grafana.com/docs/grafana-cloud/monitor-infrastructure/kubernetes-monitoring/navigate-k8s-monitoring/#manage-alerts
https://grafana.com/docs/grafana-cloud/monitor-infrastructure/kubernetes-monitoring/navigate-k8s-monitoring/#see-the-issues-at-a-glance
Akamaiの認定コンピューティングパートナーとなったNeuralMagicは、GPUを搭載したより高度なハードウェアではなく、従来のCPUベースのサーバー上で AI ワークロードをより効率的に実行できるソフトウェアを提供。
開発者は、高価で入手困難な GPU サーバーで実行されるディープラーニングモデルを比較的コスト効率が高い CPU サーバーでディープラーニングモデルをほぼ同じパフォーマンスで実行できるようになるとしています。
Akamaiは、中小企業や個人開発者を対象としたConnected Cloudを発表し、分散クラウドインフラを提供、加えて、最近発表したGeckoにより、コンピューティングとストレージをネットワークエッジまで拡張し、グローバル CDN ネットワークを活用して世界中の数百のロケーションでホストすることで、低遅延を実現、ネットワーク エッジで AI モデルを効率的に提供するとしています。
NVIDIA BlueField-3 DPUとその上で稼働するVASTのストレージ・DB向けOS、SuperMicroのサーバを組み合わせ、サービスプロバイダーやハイパースケール企業向けに、Nvidia DPU が組み込まれたシステムを活用したAIソリューションを構築できるインフラを提供するとのこと。
AI では、ユーザーからのクエリを処理するために、トレーニング、微調整、展開中に膨大な量のデータを合成する必要があります。
VAST のデータ プラットフォームは、AI 用の非構造化データをキャプチャ、カタログ化、保存するソフトウェアフレームワークで、BlueField DPU と組み合わせることで、AI 処理とストレージ間のデータの移動を大幅に加速でき、必要な機器の量が大幅に削減されるとしています。
<参照URL>
https://vastdata.com/press-releases/vast-nvidia-bluefield-architecture-for-ai-factory
https://vastdata.com/press-releases/vast-supermicro-partner-to-simplify-accelerate-AI-pipelines
Claude 3 ファミリーには、OpenAIやGoogleなどの業界大手のクラス最高のモデルにも匹敵するOpus、速度とコストのバランスのSonnetがすでにあります。
新しいHaiku は他の製品よりも 3 倍高速であり、速度と低遅延が必要なユースケースに最適とされ、顧客サービス、フィールドワーク、質疑応答など迅速な回答が理想的なユースケースに合うとのこと。
迅速な出力を生成するため、応答性が高く魅力的なチャットエクスペリエンスと、多くの小さなタスクの同時実行が可能になるとしています。
(Haiku は 32,000 トークン未満のプロンプトに対して、1 秒あたり最大 21,000 トークン、または約 30 ページのテキストを処理)また、このモデルはわずか 1 ドルで 400 件の最高裁判例または 2,500 枚の画像を分析できるとしています。
<参照URL>
https://www.anthropic.com/news/claude-3-haiku
企業顧客と緊密に連携してモデルを顧客固有のニーズに合わせて調整しているCohereは、検索拡張生成 (RAG) を含むツール提供と、パフォーマンス向上、最大 128,000 トークンまでのコンテキストウィンドウを手頃な価格を提供するとのこと。
現在の顧客やパートナーには、Oracle、Notion、Scale AI、Accenture、McKinsey などが含まれるとしています。
Scale AI のGen AI PlatformはCohereのLLMをベースに、カスタマーサポートチーム向けのカスタム ナレッジ マネジメント アプリケーションを構築しているとのこと。
<参照URL>
https://txt.cohere.com/command-r/
Databricksは、MistralのオープンモデルをDatabricks Data Intelligence Platformとネイティブに統合し、Databricks Marketplaceへのアクセスを提供し、Mosaic AI Playgroundと組み合わせて、顧客が独自のデータを使用して微調整できるようにするとのこと。
企業は、Databricks Marketplace を通じて、Databricksプラットフォームのセキュリティ、データプライバシー、ガバナンス機能を活用しながら、Mistral AIのモデルを生成AIアプリケーションに迅速に適用できるようになるとしています。
Armv9 アーキテクチャとArm Neoverse V3AEを使い、自動車向けCPUにサーバクラスのパフォーマンスを与えることで自動車メーカーは開発時間を大幅に短縮し、これまでよりも最大 2 年早く、AI を活用した新しいエクスペリエンスを車両に提供できるとのこと。
またIPが出てから1-2年かかる物理チップ到着を待たず、最新チップの仮想バージョンを提供。
仮想プロトタイピングを可能にし、物理シリコンが利用可能になった瞬間に開発を開始できるようになり、開発時間が大幅に短縮されるとしています。
<参照URL>
https://www.arm.com/ja/products/silicon-ip-cpu/automotive-enhanced
https://newsroom.arm.com/automotive-virtual-platforms
多くのソリューションは、セキュリティ向けAI モデルを活用する上で企業全体のデータ ソースからの追加のコンテキストや知識が欠けているとし、AvalorのData Fabric for Securityは、サイバーセキュリティ資産、コントロール、アイデンティティ、脆弱性、バグ、その他のデータポイントの信頼できる情報源として機能し、セキュリティ チームが発見から修復までリスクデータを集約、正規化、重複排除、追跡できるようにし、どの事業部門が脆弱性の影響を受けるかに関するデータなどのコンテキストの詳細を提示できるととのこと。
Securitiや Dig Securityなど他と異なるのは、あらゆるソースからのデータをあらゆる形式で処理できることと、
その独自の脆弱性リスク管理および優先順位付けツールのセットとされます。
この買収により、Zscalerは、セキュリティインシデントの効率的なレポート作成、インシデントの軽減、資産検出、データ分類、セキュリティポリシーの生成などの機能をZero Trust Exchangeに追加するとしています。
<参照URL>
https://www.zscaler.com/press/zscaler-expands-its-zero-trust-exchange-ai-powered-cloud
https://www.avalor.io/post/hitting-ludicrous-speed-with-zscaler