Anthropic 原始碼外洩引發企業安全危機與 DMCA 誤判爭議
Anthropic 在 npm 套件中意外洩漏 512,000 行原始碼,引發嚴重的企業安全危機,隨後試圖透過 DMCA 封鎖外洩內容時,又因誤傷大量合法 GitHub 專案而遭到社群批評。
Anthropic 在 npm 套件中意外洩漏 512,000 行原始碼,引發嚴重的企業安全危機,隨後試圖透過 DMCA 封鎖外洩內容時,又因誤傷大量合法 GitHub 專案而遭到社群批評。
Anthropic 推出新功能,讓 Claude AI 能直接控制 Mac 電腦進行任務操作,旨在建立自主 AI 代理。同時,公司正因被國防部列為供應鏈風險而面臨法律挑戰。
AI 代理競賽升溫,Anthropic 的 Claude 取得 macOS 操作權限,Cloudflare 推出 Dynamic Workers 以提升執行效率,業界正努力突破 AI 代理從演示到生產部署的難關。
AI 產業正從聊天機器人轉向自主執行任務的「代理人」。Anthropic 推出了可透過通訊軟體控制的 Claude Code Channels,而 OpenAI 則在研發整合 ChatGPT、編程工具與瀏覽器的桌面「超級應用程式」。同時,Cursor 的新模型 Composer 2 也展現了強大的編碼競爭力,顯示出代理型 AI 已成為科技巨頭的兵家必爭之地。
OpenAI 正在開發整合 ChatGPT、Codex 及 Atlas 瀏覽器的桌面級「超級應用」,試圖將 AI 從對話工具轉型為能自動執行任務的系統代理。此舉引發 Google 重組其代理團隊進行反擊,也帶來隱私與壟斷的法律關注。
Nothing 執行長 Carl Pei 預測,智慧型手機的 App 時代即將終結,取而代之的是能理解用戶意圖並自動執行任務的 AI 代理。這一變革將使手機從「工具箱」進化為真正的「個人助手」,並挑戰現有的應用商店生態與商業模式。
Nothing 執行長裴宇指出,未來智慧型手機將告別 App 時代,轉向由 AI 代理人主導。隨著 MiniMax M2.7 與微軟 Fabric IQ 等技術成熟,AI 將能直接理解並執行使用者的複雜意圖,App 將轉化為後台服務,這將徹底改變手機的硬體設計與軟體開發邏輯。
AI 正在從被動的對話機器人進化為具備主動行動能力的「桌面代理」。Perplexity 推出「Personal Computer」功能讓 AI 能操作本地文件,而 Gumloop 獲 5000 萬美元融資推廣低代碼代理工具。最新學術研究指出,這類代理需在安全協議與連續流處理上取得突破。
Google 與三星為 Gemini 推出任務自動化功能,使其能代表用戶在 App 內執行下單與叫車動作。Perplexity 則將 AI 代理帶入本地電腦檔案系統。專家分析指出,這場代理型 AI 革命正推動底層向量搜尋技術的快速發展。
輝達(Nvidia)計畫投入 260 億美元開發開源權重(Open-Weight)模型,並正式發表具備 120B 參數的混合架構模型 Nemotron 3 Super。此外,輝達亦傳出研發開源代理工具 NemoClaw,旨在與 OpenClaw 競爭,全面佈局企業級 AI 代理市場。
Meta 收購 AI 代理社交網絡 Moltbook,以及 OpenAI 將 Sora 整合進 ChatGPT,標誌著「代理人網路」正式進入大眾市場。這一轉變意味著未來數位互動將由 AI 代理人代替人類完成,影響範圍涵蓋社交、電子商務與工業製造。同時,隨著 Mind Robotics 獲得 5 億美元融資,自主 AI 代理也正在加速進入實體工廠,引發關於數據真實性與版權的新一輪爭議。
Meta 收購了專為 AI 智能體設計的社交網路 Moltbook。該平台允許自主 AI 相互溝通與發文,Meta 意在藉此構建未來智能體協作與 A2A 通訊的基礎設施。
AI 產業正從聊天機器人轉向具備自主執行能力的代理型 AI。關鍵進展包括 Andrej Karpathy 發佈 630 行代碼的開源科研代理、微軟推出跨應用協作的 Copilot Cowork,以及 Nvidia 籌備中的 OpenClaw 開源平台。這標誌著 AI 將開始自動化科學發現與企業工作流,成為邁向 AGI 的重要階段。
2026 年初 AI 代理人技術進入爆發期。輝達計畫推出開源代理平台,微軟推出 Copilot Cowork 與企業級治理工具 Agent 365(月費 $99)。同時,AI 大師 Andrej Karpathy 開源了僅 630 行的 autoresearch 腳本,宣稱可自動化科學實驗。摩根士丹利預測 2030 年將有近 4,000 億美元的電商支出由 AI 代勞。然而,安全性問題如「數位雙面間諜」風險,也促使 OpenAI 收購 Promptfoo 以加強防禦。
Andrej Karpathy 提出了「九之進行曲」概念,警告 AI 達到 90% 可靠性與 99.9% 的生產級要求之間存在巨大工程鴻溝。LangChain 執行長建議通過「外掛工程」與結構化知識圖譜(如 FIBO)來解決 AI 代理的不可靠問題,這標誌著 AI 開發重點從模型規模轉向確定性工程。
Andrej Karpathy 提出 AI「九的進軍」理論,強調從 90% 到 99.999% 可靠性的工程難度。與此同時,LangChain 執行官與 Google 專家正致力於「支架工程」與持久記憶技術。MIT 的新技術據傳可壓縮 記憶體 50 倍,這些突破正試圖解決 AI 代理從演示轉向生產環境的瓶頸。
MIT 研究人員發表了 Attention Matching 技術,能將大語言模型的 KV 快取記憶體需求降低 50 倍,且不失精度。同時 Google 開源了基於 Gemini 3.1 的持續性記憶體代理,標誌著 AI 從外部向量資料庫轉向原生記憶體工程。
Perplexity 與 Read AI 推出全新的代理型 AI 工具,具備自主任務拆解與執行能力。ServiceNow 亦證實其 AI 代理已能處理 90% 的 IT 請求,標誌著 AI 進入代理執行時代。
三星宣佈將 Perplexity AI 搜尋整合至即將推出的 Galaxy S26,標誌著從傳統語音助理轉向「多智能體生態系統」。用戶將能直接喚醒專業代理人處理特定任務,此舉挑戰了 Google 在行動搜尋領域的長期壟斷地位。
2025 年 AI Agent 開發已從實驗轉向工程化。本文深入分析 OpenAI Agents SDK、Google ADK、GitHub Spec Kit、Pydantic AI、Mastra 及 Agno 六大框架,探討結構化編排、類型安全與 MCP 協議如何定義新一代 AI 開發標準。