有消息稱,人工智能領域知名企業OpenAI正與訓練數據公司Handshake AI展開合作,共同推動一項涉及第三方外包人員的數據收集計劃。據相關報道,OpenAI要求這些外包人員提供其過往及當前工作中的真實成果,以獲取高質量訓練數據。
近年來,人工智能行業呈現出一種趨勢:各大公司紛紛通過聘請外包人員來生成用于模型訓練的數據。這一戰略布局的背后,是各企業希望借助這些數據,最終實現旗下模型對更多白領工作的自動化處理。OpenAI此次的行動,正是這一行業趨勢的具體體現。
具體而言,OpenAI在一份演示文稿中明確要求外包人員詳細描述自己在其他工作中執行過的任務,并上傳“實際完成的真實職場工作成果”案例。這些案例需要是具體的產出物,而非文件摘要,涵蓋Word文檔、PDF、演示文稿、Excel表格、圖片以及代碼倉庫等多種形式。
為確保數據收集的合規性,OpenAI要求外包人員在上傳這些成果前,必須刪除其中包含的專有信息和個人身份信息。為此,OpenAI還向他們推薦了一款名為ChatGPT“超級清洗工具(Superstar Scrubbing)”的應用,以協助完成這一操作。
然而,這一數據收集方式也引發了知識產權方面的擔憂。知識產權律師埃文?布朗在接受采訪時指出,任何采用這種模式的人工智能實驗室都“正將自身置于極高風險之中”。他解釋說,這種模式高度依賴外包人員自行判斷信息是否屬于機密,一旦出現疏漏,可能引發嚴重的法律問題。
針對這一報道,OpenAI發言人拒絕發表評論,未對相關事宜作出進一步回應。









