youtube版(スライド付き) 関連リンク Introducing Markdown for Agents インターネットのトラフィックが従来の検索エンジンからAIエージェントやAIクローラーへと急速に移行する中、CloudflareはWebサイトのコンテンツをAIが理解しやすい形式で提供する新機能「Markdown for Agents」を発表しました。 従来のWebサイトは人間が閲覧することを前提にHTMLで構築されていますが、AI(LLM)にとってHTMLは構造が複雑で、タグやスクリプトなどの「ノイズ」が多く含まれます。これらはLLMのトークンを無駄に消費し、コスト増や精度の低下を招く要因となっていました。例えば、あるブログ記事をHTMLのまま読み込むと約16,000トークン必要ですが、Markdownに変換すると約3,000トークンで済み、約80%ものトークン削減が可能になります。 「Markdown for Agents」は、HTTPの「コンテンツ・ネゴシエーション」という仕組みを利用しています。AIエージェントがリクエスト時に「Accept: text/markdown」というヘッダーを送信すると、CloudflareのネットワークがオリジナルのHTMLをリアルタイムでMarkdownに変換して返します。 新人エンジニアにとって注目すべきポイントは以下の通りです: トークン効率の最適化: 開発者は自分で変換ロジックを実装することなく、エッジ側で最適化された軽量なデータを受け取れます。レスポンスヘッダーには推定トークン数(x-markdown-tokens)も含まれるため、RAG(検索拡張生成)の実装時にコンテキストウィンドウの管理がしやすくなります。AI向けの意思表示: 「Content-Signal」ヘッダーを通じて、そのコンテンツをAIの学習や検索に利用してよいかというポリシーを明示できます。エージェント・ファーストの設計: これからのWeb開発は、人間のユーザーだけでなく、AIエージェントを「第一級の市民」として扱う設計(エージェント最適化)が重要になることを示唆しています。 現在はBeta版として、Cloudflareの特定のプラン(Pro以上など)で利用可能です。この技術は、AIエージェントがWeb上の情報をより安価に、高速に、そして正確に理解するための強力なインフラとなるでしょう。 引用元: https://blog.cloudflare.com/markdown-for-agents/ MiniMax M2.5: Faster. Stronger. Smarter. Built for Real-World Productivity. MiniMax社が発表した最新モデル「MiniMax-M2.5」は、実務での生産性を最大化するために設計されたLLMです。数十万件の複雑な実世界環境を模した強化学習(RL)を経て、コーディング、エージェントとしてのツール利用、オフィス業務において世界最高水準(SOTA)の性能を達成しました。 1. シニアエンジニアのように「設計」から関わるコーディング能力 M2.5は単にコードを書くだけではありません。熟練したソフトウェアアーキテクトのように、実装前に機能分解やUIデザインの計画を立てる能力(Spec-writing)が備わっています。 広範な対応力: Go, Rust, TypeScript, Pythonなど10以上の言語に対応し、Web、Android、iOSなどマルチプラットフォームの開発をサポート。開発全工程をカバー: ゼロからのシステム設計から環境構築、機能改善、そして厳格なコードレビューまで、開発ライフサイクルの全域で信頼できるパフォーマンスを発揮します。ベンチマーク: SWE-Bench Verifiedで80.2%を記録し、ClaudeやGPTシリーズを凌ぐ進化速度を見せています。 2. 爆速かつ「安すぎて計測不能」なコスト効率 エンジニアがコストを気にせず、エージェントを24時間稼働させ続けられる世界を目指しています。 圧倒的な速度: 秒間100トークンという、競合他社の frontier モデルの約2倍の速さで動作します。衝撃的な低価格: 100トークン/秒で1時間連続稼働させてもコストはわずか1ドル。出力コストベースでは、Claude OpusやGPT-5の1/10から1/20という破格の安さを実現しました。 3. 高度な自律性と検索・ツール利用 「とりあえず検索する」だけでなく、情報の密度が高いWebサイトを深く探索する能力が向上しました。 効率的な思考: 前モデル(M2.1)と比較して、より少ない推論ステップ(約20%削減)で正解に到達できるようになり、トークン効率と実行速度が大幅に改善されています。 4. 技術的裏付け:独自のRLフレームワーク「Forge」 この高性能を支えるのが、...
続きを読む
一部表示