允中 發自 凹非寺
量子位 | 公眾號 QbitAI
關于AI的討論其實越來越兩極化。
一邊是技術飛速推進:模型能力在變強,Agent在出現,OpenClaw開始能調用工具、執行任務、操作系統。
另一邊,則是越來越普遍的情緒——AI焦慮。
很多人都在問同一個問題:如果AI不只是聊天工具,而是開始真正參與工作流程,那人類的位置會發生什么變化?
大多數討論其實都只停留在想象層面。有人覺得AI馬上取代一切,也有人覺得它只是玩具。
但真正的問題在于另一件事——AI在真實世界里,究竟已經走到了什么程度?
于是,B站最近干脆把這件事做成了一檔直播挑戰:讓AI進入真實任務環境,在直播里接受壓力測試。他們直接把這個問題,做成了一場公開實驗。
一個官方策劃的直播系列——《龍蝦代替人類》挑戰。
邏輯其實很簡單:
讓不同領域的UP主,在直播中把真實任務交給OpenClaw執行,從任務拆解、資料查詢到實際操作,都盡量讓AI去完成。
重點不是演示,而是真實過程。
直播意味著沒有剪輯、沒有重來。如果卡住、出錯、甚至翻車,觀眾都會實時看到。
換句話說,這更像是一場公開的技術壓力測試。
昨天(3月13日)已經有一場直播跑了一輪測試。
純用AI開發了爆款產品小貓補光燈App的UP——AI進化論-花生,把“龍蝦”直接拉去當程序員。
簡單講完基礎使用(比如如何判斷系統運行、模型接入和部署注意事項)后,他就開始給AI扔任務。
前兩個任務其實翻車得挺真實:
先讓Claude Code配合龍蝦分析他的B站賬號并給出選題建議——第一次直接失敗,第二次才跑通流程;隨后又嘗試讓AI整理桌面,但因為執行速度太慢,最終也沒跑完。
但第三個任務就有點意思了。花生讓AI開發一個iOS小貓補光燈App的升級版。結果AI居然真的把應用做出來了。
當然過程也很戲劇化:
龍蝦會把任務分配給Claude Code協作,但又時不時“不太信”Claude的建議;有一次花生讓它修改代碼,它甚至“偷懶”沒執行指令。
最后花生給了個很有意思的評價:
龍蝦在產品思路和編程能力上確實很強,像個有幾年經驗的產品經理,但目前做出來的版本整體還比較粗糙,需要繼續打磨。
接下來幾天的直播內容會更豐富一些:
今晚(3月14日)的直播陣容會更有意思。
導演小策和Jack-cui會把AI拉進完整的視頻創作流程,讓它參與選題、腳本甚至編導,看看內容生產鏈條里加入AI Agent會不會產生新的創作方式。
而另一場更抓眼球的實驗還在繼續,來自UP主程泓寧_宇宙ebike。
他的挑戰目標很直接——用OpenClaw,一天賣出100萬。
驗證AI到底是商業能力的第一次高光時刻,還是直播間大型翻車現場?這幾天大概就會有答案。
3月16日,UP主籽岷、圖靈的貓、馬夫魚33會讓AI去打游戲,看看AI代打到底是高光操作還是現場翻車。
還有一場設定更極端一點:
3月20日UP主秋芝2046準備讓AI參與公司管理,《用龍蝦管公司,會倒閉嗎?》。
另外一個小看點,是神秘嘉賓。
官方已經透露會有周鴻祎參與,不過具體內容還沒公布。
整個系列看下來,其實有點像AI龍蝦版的真人秀。
其實從更大的視角看,這件事的意義可能不只是一次直播挑戰。
今天很多關于AI的討論,其實都建立在情緒之上——有人過度樂觀,有人極度焦慮。
但技術的發展,最終還是要回到一個最現實的問題:它到底能不能在真實世界里工作。
所以這次直播,本質上更像一次公開實驗。
讓AI在真實任務、真實時間和真實壓力下跑一遍流程。
看看它到底能做到什么程度,也許結果不會完美,但至少比任何討論都更接近事實。
如果你身邊有人正在討論——AI會不會取代人類、未來工作會變成什么樣,不妨讓他親自了解行業中深度使用者的使用情況。
因為很多問題,只有在真實實驗里,答案才會慢慢出現。









