隨著人工智慧技術的快速發展,生成式AI正逐漸滲透到我們的日常生活和各行各業中。從文字創作到藝術設計,從虛擬助理到智慧客服,AI的身影無所不在。然而,幣安倒閉ptt科技的創新與應用,離不開法律的規範與引導。為進一步保障與監管AI技術創新,我國推出了《生成式人工智慧服務管理暫行辦法》(以下簡稱《辦法》),為AI技術的合規應用提供了明確的法律架構。
在此之前,我國已經推出了針對深度合成演算法的《網路資訊服務深度合成管理規定》(以下簡稱《深度合成規定》),明確了深度合成服務相關方的義務與主體責任。 《辦法》和《深度合成規定》建構了針對大模型的“雙備案係統”,即“深度合成演算法備案”和“大模型備案”。
今年4月,我國頒布了一批已備案的生成式人工智慧服務訊息,這標誌著對AI服務管理的進一步加強。本文將深入解析《辦法》的核心要點,探討大模型(生成式人工智慧)備案的合規,幫助企業與開發者在享受AI技術紅利的同時,確保每一步都符合法律規範,共同推動人工智慧業界的穩健前行。
01 大模型備案VS演算法備案
在此之前,我們先簡單討論以下大模型備案和演算法備案的異同。根據《深度合成規定》,深度合成技術是指利用深度學習、虛擬實境等生成合成類演算法製作文字、圖像、音訊、視訊、虛擬場景等網路資訊的狗狗幣多少錢?技術,包括但不限於文字生成、音樂生成、文字轉語音等。而深度合成演算法備案是對服務提供者所開發或擁有的該技術演算法進行備案。同一種演算法隻需要備案一次。
《辦法》指出,具有輿論屬性或社會動員能力的深度合成服務提供者,應按照《互聯網資訊服務演算法推薦管理規定》,透過當地的網信部門,履行備案和變更、註銷備案手續。
對於大模型服務提供者來說,因為大部分大模型服務中使用了深度合成技術,完成深度合成演算法的備案一般也需要完成大模型備案;反之則不然,若某項大模型技術使用的是已經備案的演算法或接口,則不需要提供深度合成演算法備案。在美國如何買比特幣?當然,如果一個大模型服務使用了多種未備案的深度合成演算法,則需要對每個演算法進行備案。
02 備案的生成式AI(大模型)要求
為達到備案標準,服務提供者需要根據《生成式人工智慧服務安全基本要求》(以下簡稱《要求》)提供以下資料:語料安全、模型安全、安全措施,以及以上的安全自我評估。各板塊的重點審查內容如下圖所示。
1. 語料安全
語料安全性確保了大模型訓練時所使用的資料合規、安全。語料安全的板塊涵蓋以下內容:
·語料來源安全:對於特定語料來源,提供者在採集前後都應進行安全評估;含違法不良資訊超過5%的語料不應採集或使用,且不應使用違反我國網路安全相關法律法規要求阻斷的資訊作為訓練語料。
·語料來源多樣性:應提高語料來源的多樣性,確保每種語言和類型的What is happening to Dogelon Mars?語料都來自多個來源,並合理搭配境內外來源語料。 ·語料來源可追溯性:使用開源語料時應具有相應的開源授權協議或文件,使用自採語料時應有採集記錄,並且避免採集明確不可採集的語料。
·商業語料使用:使用商業語料時,應有法律效力的交易合約或合作協議,並應對交易方或合作方提供的語料、承諾、材料進行審核。 ·語料知識產權保護:應設置知識產權負責人,建立管理策略,對語料中的知識產權侵權風險進行識別,不應使用有侵權問題的語料進行訓練。
·語料的個人資訊保護:使用包含個人資訊的語料時,應取得個人資訊主體的授權同意,或滿足其他合法使用條件。
·安全評估:提供者對語料安全情況進行評估時,應採用人工抽檢、關鍵字、分類模型等方法,確保抽樣合格率達到規定標準。
·語料標註安全:應對標註人員進行安全訓練、評估、劃分,並指定標註的規則。同時應對標註語料進行抽檢。
2.模型安全
模型安全是為了確保生成式人工智慧大模型產品在提供服務時所產生的內容的安全、準確、合法,同時保護智慧財產權和使用者隱私。
·模型合規:如需基於第三人基礎模型提供服務,應使用已主管機關備案的基礎型。
·內容安全性:訓練時優先考慮生成內容的安全性,並引導模型產出正向內容。
·準確度與可靠性:提高生成內容中數據及表達與科學常識及主流認知的符合程度,減少其中的錯誤內容,並提高生成內容對使用者的幫助作用。
3.安全措施
建立全麵的安全管理體係,包括合規性、風險控製、透明度、用戶控製、未成年人保護、響應機製和係統安全性,以促進生成式人工智能服務的健康發展並保護用戶權益。
·模型安全性:使用經備案的模型,並對關鍵場合,例如金融、醫療信心、基礎設施的風險保護措施,和未成年人使用場景實施額外保護。
·服務透明度:公開服務信息、模型算法概要、個人信息用途;顯著位置展示,易於用戶訪問。
·用戶輸入信息:提供便捷方式讓用戶關閉信息訓練功能;顯著告知信息收集狀態和關閉選項。
·內容標識:確保圖片、視頻等內容標識符合國家標準。
·計算係統安全:評估供應鏈安全,芯片支持硬件安全啟動,保障係統安全運行。
·投訴舉報機製:提供投訴舉報途徑,明確處理規則和時限。·服務穩定性:隔離訓練與推理環境,防範攻擊;定期安全審計,建立備份和恢複策略。
03寫在最後
此外,《要求》也提出了一些其他條件,包括但不限於:
· 關鍵字庫量不少於10,000個,且具代表性,每週最好至少依照網路需要更新一次詞庫。
· 建立完整的生成內容測驗題庫,總規模不少於20000題,且具代表性。
· 建立完整的拒答測驗題庫,包含應拒答題庫和非拒答題庫各500題等等。
隨著《生成式人工智慧服務管理暫行辦法》的實施,大模型備案所涉及一係列相對複雜的流程與合規問題,對許多產業內的個體經營者提出了新領域的挑戰。合規不僅是企業與開發者的責任,更是推動整個產業健康有序發展的關鍵。在享受AI技術帶來的便利和紅利的同時,我們必須時刻保持警醒,確保每一步操作都在法律的框架之內。最後,如各位老友有任何AI領域的法律及合規問題,也隨時歡迎來與颯姐共同探討!