傳統AI圖像生成技術雖能產出視覺驚艷的作品,但在處理化學分子結構、物理電路圖等科學內容時,常因忽視底層邏輯導致嚴重錯誤。例如生成的分子結構可能原子數量不符,電路連接方式違背物理規律。研究團隊指出,現有文本到圖像模型過度依賴視覺相似性,如同讓未學過化學的人憑想象繪制分子式,結果必然偏離科學本質。
為客觀評估生成質量,研究團隊構建了包含1400個測試問題的SciGenBench基準體系。該體系覆蓋數學、物理、化學等五大領域,通過“視覺問答”反向驗證圖像準確性——若AI能正確回答圖中電阻值、幾何坐標等具體問題,則證明圖像信息無誤。評估維度涵蓋信息完整性、幾何精度、科學合理性等五個方面,確保全面把握圖像質量。
基于研究結論,團隊提出“螺旋協同演進”發展路徑:程序化方法可為像素生成提供結構化訓練數據,幫助其學習科學邏輯;像素生成的視覺表現力則可反哺程序化方法,使圖像更生動直觀。這種工程師與藝術家的跨界合作模式,有望催生新一代科學圖像生成系統——既能繪制精密工程圖,也能制作科普宣傳材料,甚至具備邏輯推理與創造性想象的雙重能力。







