當人工智能的討論陷入"取代危機"與"技術烏托邦"的兩極漩渦時,B站用一場持續數日的直播實驗給出了新的觀察視角。這場名為《龍蝦代替人類》的挑戰活動,將OpenClaw智能體推入真實工作場景,通過連續的壓力測試展現AI在復雜任務中的實際表現。
在首場程序員崗位測試中,AI進化論-花生為智能體布置了三項任務。前兩次嘗試遭遇現實阻礙:分析B站賬號時首次流程崩潰,第二次才勉強完成;桌面整理任務則因執行效率低下被迫中止。轉折出現在第三項挑戰——當被要求開發iOS版小貓補光燈升級應用時,智能體展現出令人驚訝的編程能力,盡管過程中出現指令執行偏差和代碼修改拖延等插曲,最終仍交付了可運行版本。創作者評價其產品思維接近資深從業者,但完成度仍需打磨。
即將展開的系列測試將拓展至更多領域。導演小策與Jack-cui將帶領智能體完整參與視頻創作流程,從選題策劃到腳本編寫,探索AI介入內容生產的新可能;程泓寧_宇宙ebike則設定了更具挑戰性的目標——借助AI實現單日百萬銷售額,這場商業實驗將檢驗智能體在市場運營中的實際價值。
游戲與管理的極端場景測試同樣引人注目。3月16日,籽岷等三位UP主將讓AI接管游戲操作,通過實時對戰檢驗其策略執行能力;更受關注的當屬秋芝2046策劃的公司管理實驗,這場名為《用龍蝦管公司,會倒閉嗎?》的測試,將把智能體置于行政決策的核心位置。值得關注的是,活動方透露360集團創始人周鴻祎將以神秘角色參與后續環節,具體形式尚未公布。
這場持續十天的公開實驗,本質上是對AI落地能力的現實檢驗。當技術論文中的參數突破轉化為具體工作場景中的操作表現,當實驗室環境里的完美演示遭遇真實世界的復雜變量,智能體的實際表現或許比任何理論探討都更具說服力。對于那些困在"AI焦慮"中的人們,這些持續更新的測試數據,正在提供更立體的認知維度。
從程序員崗位到商業運營,從內容創作到公司管理,實驗設計覆蓋了現代職場的核心領域。每個測試場景都保留了意外發生的可能性——指令誤解、執行偏差、系統崩潰等真實問題,恰恰構成了評估AI實用價值的關鍵維度。當觀眾透過直播鏡頭目睹這些不完美卻真實的交互過程,關于技術替代的抽象爭論,或許能獲得更具象的解答。












