رؤى Sherrell Kuperman lgf(@Square-Creator-lgf)

#open #openledger $OPEN AI 繪圖再進化！OpenAI 於本週二正式推出全新影像生成模型「ChatGPT Images 2.0」。新模型大幅強化了「推論能力」與「文字渲染」技術，用戶現在能一次生成多張圖片、自訂極端長寬比，甚至能在圖片中精準生成英文單字。不過外媒實測發現，該模型在處理中文等非英語系文字時，仍會出現難以辨識的「AI 亂碼」。 （前情提要：壽命僅 3 個月！OpenAI 無預警關停科研寫作平台 Prism，戰略大轉向「不再搞副業」） （背景補充：ChatGPT 幕後推手 Srinivas Narayanan 閃辭 OpenAI，一週三已有高層出走）   圖像生成的戰場再度升溫。OpenAI 於週二（21 日）宣布為全球 ChatGPT 與 Codex 用戶推出全新的影像生成 AI 模型 —— ChatGPT Images 2.0，並為付費訂閱者提供更強大的運算版本。 這次的重大更新不僅帶來了更細緻的畫面表現，更試圖解決過去 AI 繪圖最令人頭痛的「文字拼寫（Text rendering）」問題。 結合推論能力，單次提示可產出多張圖片 與過去的模型相比，Images 2.0 最大的突破在於它整合了 ChatGPT 強大的「推論（Reasoning）」能力。這意味著 AI 在生成圖片前，會執行更多的思考步驟，甚至能連上網路搜尋最新資訊（該模型的基礎知識庫截止日期為 2025 年 12 月）。 新模型的亮點升級包含： 多圖連續生成：用戶只需輸入一次提示詞（Prompt），就能讓模型產出一系列圖片，例如一整本學習手冊的視覺內容。 高度客製化尺寸：打破傳統的比例限制，新模型支援從 3:1（極寬）到 1:3（極高） 的長寬比，用戶可直接在提示詞中指定所需尺寸。 更細緻的資訊圖表：外媒實測要求生成「舊金山明日天氣預報與推薦活動」的資訊圖表時，AI 成功將天氣細節與當地地標（如渡輪大廈、卡斯楚戲院、泛美金字塔）精準地融合在同一個畫面中。