#open #openledger $OPEN

AI 繪圖再進化!OpenAI 於本週二正式推出全新影像生成模型「ChatGPT Images 2.0」。新模型大幅強化了「推論能力」與「文字渲染」技術,用戶現在能一次生成多張圖片、自訂極端長寬比,甚至能在圖片中精準生成英文單字。不過外媒實測發現,該模型在處理中文等非英語系文字時,仍會出現難以辨識的「AI 亂碼」。 (前情提要:壽命僅 3 個月!OpenAI 無預警關停科研寫作平台 Prism,戰略大轉向「不再搞副業」) (背景補充:ChatGPT 幕後推手 Srinivas Narayanan 閃辭 OpenAI,一週三已有高層出走)   圖像生成的戰場再度升溫。OpenAI 於週二(21 日)宣布為全球 ChatGPT 與 Codex 用戶推出全新的影像生成 AI 模型 —— ChatGPT Images 2.0,並為付費訂閱者提供更強大的運算版本。 這次的重大更新不僅帶來了更細緻的畫面表現,更試圖解決過去 AI 繪圖最令人頭痛的「文字拼寫(Text rendering)」問題。 結合推論能力,單次提示可產出多張圖片 與過去的模型相比,Images 2.0 最大的突破在於它整合了 ChatGPT 強大的「推論(Reasoning)」能力。這意味著 AI 在生成圖片前,會執行更多的思考步驟,甚至能連上網路搜尋最新資訊(該模型的基礎知識庫截止日期為 2025 年 12 月)。 新模型的亮點升級包含: 多圖連續生成:用戶只需輸入一次提示詞(Prompt),就能讓模型產出一系列圖片,例如一整本學習手冊的視覺內容。 高度客製化尺寸:打破傳統的比例限制,新模型支援從 3:1(極寬)到 1:3(極高) 的長寬比,用戶可直接在提示詞中指定所需尺寸。 更細緻的資訊圖表:外媒實測要求生成「舊金山明日天氣預報與推薦活動」的資訊圖表時,AI 成功將天氣細節與當地地標(如渡輪大廈、卡斯楚戲院、泛美金字塔)精準地融合在同一個畫面中。