呆呆Kiki (@Square-Creator-375db5cb4dac6) 的見解

📰 加密市場熱點速遞

1. OpenAI推出GeneBench-Pro，AI科研評測再升級
OpenAI近期發佈研究級基準測試工具GeneBench-Pro，重點評估AI在複雜生物數據處理、分析路徑選擇與判斷決策方面的能力。這類測試更貼近真實科研流程，反映出大模型正從通用問答走向高門檻專業場景。對市場而言，AI基礎設施、科研計算與垂直應用賽道的關注度有望繼續升溫，但實際落地效果仍需持續觀察。

2. 伯克利新基準潑冷水，前沿AI代理最難任務通過率僅2.6%
加州大學伯克利近期推出“Agents’ Last Exam”基準測試，覆蓋55個行業、1490個真實工作流。結果顯示，當前前沿AI代理在最難層級任務中的通過率僅爲2.6%，說明AI距離完全自主處理複雜企業流程仍有明顯差距。該結果強化了市場對“人類監督+漸進部署”路徑的預期，也提醒投資者理性看待AI代理敘事熱度。

3. AWS上線Claude Sonnet 5，雲廠商加速AI模型生態競賽
AWS宣佈Anthropic新推出的Claude Sonnet 5已可通過Amazon Bedrock及AWS上的Claude平臺使用，顯示雲服務巨頭正持續加碼模型分發與企業接入能力。隨着頭部模型更快進入雲端生態，企業部署AI的門檻有望進一步降低，利好算力、雲服務與AI應用鏈條。對加密市場來說，AI賽道熱度擴散或繼續影響相關概念資產情緒。

#AI #加密市场 #Crypto