彼之砒霜,我之蜜糖。
(資料圖)
從ChatGPT出現到目前為止,大大小小的大模型一只手已經數不過來了。不管這些模型參數規模大小,上察天文,下曉地理,總能找出來一個符合應用場景的。這樣的“外掛”說成是解放生產力,也不算為過。
但一家歡喜一家愁。在大模型一路狂奔的背后,那些支持他們訓練的數據來源,也成了業內心頭一直放不下的障礙。鑒于OpenAI、谷歌等一眾巨頭一直以來“白嫖”的優良傳統,各個數據源頭如Twitter、Reddit等知名社交平臺和社區,都表示:想用我的數據可以,把錢拿來!
這下AI巨頭們反倒被數據源牽著鼻子走了,但是有人偏偏不信這個邪。
近日,搜索引擎巨頭谷歌宣布:以后只要是發布在網上的信息,谷歌都可以拿來訓練AI!不管是語言模型,只要是和AI相關的服務,都在允許范圍內。
谷歌新政策一出,業內徹底炸開了鍋!
堂而皇之“侵犯隱私”,還能合規合法?
AI訓練“侵犯隱私”的輿論正鬧得沸沸揚揚,谷歌卻頭鐵得出臺了新的隱私政策,想借此給自己套上免死金牌。
近日,谷歌更新隱私政策,表示將利用網絡公開數據訓練旗下的AI模型。
其中,谷歌在新隱私協議的“可公開獲取的資源”中聲明:“我們可能會收集公開的在線信息或來自其他公共來源的信息,幫助訓練Google的AI模型。”該大模型將會為谷歌翻譯、谷歌旗下聊天機器人產品“Bard”及Cloud AI等產品和功能提供支持。
去年年底谷歌就更新了一版隱私政策。對比上一版,谷歌將“收集信息以幫助訓練語言模型”的相關措辭更改為“訓練人工智能模型”,并新增明確了自家AI產品對于數據的使用權利。
這似乎意味著,谷歌在訓練旗下聊天機器人及其他AI模型,或未來開發AI產品的過程中,有權使用人們在網上公開發布的任意內容,什么“版權”、隱私在該政策面前統統不存在了。
經確認,7月5日,谷歌中文版隱私政策也已經進行同步更新。
谷歌的這項政策沒有針對誰,指的是在座的所有網民。只要你在網上發表了什么內容,谷歌都可以拿來訓練AI。消息一出,網上瞬間炸開了鍋。
“版權已死” “隱私不在”等等悲觀情緒不一而足,更有的直言“AI正在吞食一切”。
但也有人認為,谷歌的此項舉措并沒有嚴格意義上的“違規違法”。有相關律師表示,“無論在我國還是域外,對公開數據的正常收集和使用,在一般情況下不算違法。”但是他還說,一旦個人通過郵件等方式明確拒絕了此項政策,那就另當別論了。
其他法律人士表示,就目前可獲得的信息而言,谷歌對收集與處理用戶個人信息的范圍和目的作出了詳細說明,即使以歐盟GDPR項下更為嚴格的“告知-同意”規則為標準,谷歌的這一收集與處理行為至少在形式上具有合法性。
只是在實際施行中涉及的行為是否合法,還需進一步確認。
AI巨頭們的“數據之戰”
單純看谷歌的一系列操作,可能覺得有些無厘頭。但有意思的是,就在谷歌更新隱私政策前不久,另外一個AI巨頭就被起訴“侵犯隱私”。
兩名美國作家在舊金山聯邦法院對OpenAI提起訴訟,聲稱 OpenAI 沒有獲得版權授權,就濫用他們的作品來訓練人工智能。
起訴書中顯示,OpenAI 的訓練數據超過 30 萬本書,其中就包括本就飽受爭議,版權歸屬不清晰的“影子圖書館”(大多是以侵犯版權的方式向公眾免費提供書籍文獻內容的線上網站)。
此前OpenAI和微軟還被16 位匿名人士要起訴,因為這兩家公司沒有經過他們的同意就泄露了他們的個人隱私,要求兩家賠償30億美元。
這么看來,谷歌此舉反倒有一種“自保”的意圖。
而另一方面,則更加突出了AI大潮之下,數據的重要性。各家都在保衛和爭奪“數據”中絞盡腦汁。
Reddit采取的方式簡單粗暴,就是提高API價格。Twitter則是限制數據的曝光,CEO馬斯克近日宣布 Twitter 將“臨時限制”用戶每日閱讀推文數量:未驗證的賬戶每天只能看到 600 條推文,對于新的未驗證賬戶,一天只能看到 300 條。經過驗證的賬戶每天只能閱讀 6000 條帖子。
當各家AI的發展進度逐漸持平以后,算力和參數都漸漸被弱化。接下來的競爭,就看誰能更快更多地獲取到“高質量”數據了。
標簽:
幾乎每一周都是會在微博知乎等一些社交平臺可以獲得有哪些新游戲可以在
據中國大熊貓保護研究中心消息,7月7日,旅韓大熊貓“華妮”產下一對雌
10日晚有消息稱高盛公司將天賜材料評級下調至賣出,目標價28 8元,
繼范弗里特后,誰將是下一個離開猛龍的人選?答案很可能就是西亞卡姆。
智通財經APP獲悉7月11日在銀華基金2023年下半年策略會上銀華基金業務副
參考消息網7月11日報道據香港《南華早報》網站7月9日報道,亞奧理事會
工人日報-中工網記者李國通訊員蘇志剛代兵周朕2023年7月10日,在西部航
◎7月10日豆神教育與協商引入的重整投資人簽訂了預重整 重整投資協議,
松花江網,是經國家互聯網信息辦公室批準的國家一類新聞網站,吉林省重
7月7日至12日,兒童劇《大運河漂流記》在中華世紀壇劇場上演,大小觀眾
簡述影響企業目標市場戰略選擇的因素
1、企業在市場細分的基礎上選擇目標市場,因此對目標市場的評價也是在
西亞卡姆成又一位離開猛龍之人?放話
繼范弗里特后,誰將是下一個離開猛龍的人選?答案很可能就是西亞卡姆。
田都村_關于田都村介紹
田都村,關于田都村介紹這個很多人還不知道,我們一起來看看!1、田都村
東莞橫瀝全面推進“百千萬工程”,展
文、圖 羊城晚報全媒體記者余曉玲通訊員鄧明敏7月10日,東莞市橫瀝鎮高
刑事訴訟原告是誰
導讀:刑事訴訟原告是誰有兩種情況,即檢察院,以及被害人,即公訴案件
金陵爭霸,烽火將燃!2023賽季超三聯
金陵爭霸,烽火將燃!7月14日-16日,2023賽季超三聯賽南京爭霸賽即將熱
華爾街銀行據悉為先正達 IPO 尋找
知情人士透露,華爾街的銀行正在幫助先正達集團為其650億元人民幣的A股
澳大利亞和泰國純電動汽車比例大幅增
泰國的純電動汽車銷量增至上年同期的13倍,達到5000輛,純電動汽車在整
Threads 五天注冊用戶破億,打破 C
7月10日,Meta首席執行官扎克伯格宣布,在剛剛過去的這個周末,公司對
田都里_關于田都里介紹
田都里,關于田都里介紹這個很多人還不知道,我們一起來看看!1、田都里
“明珠”來了!最尖端醫學影像診斷設
被譽為“醫學科技皇冠上的明珠”的全球最尖端醫學影像診斷設備——PET
推出 4 年后,官方為 Fairphone
荷蘭公司Fairphone提供的支持時間更長,他們目前已經向旗下的Fairphone
承德露露:汕頭高新區露露南方有限公
同花順金融研究中心7月11日訊,有投資者向承德露露提問,請問汕頭高新
振芯科技:7月10日融資買入2301.06萬
7月10日,振芯科技(300101)融資買入2301 06萬元,融資償還2878 52萬
全線首個基坑見底明挖車站!青島地鐵
日前,由青島市政空間開發集團有限公司承建的青島地鐵15號線體育館站首
中信建投期貨7月11日貴金屬日報:美
短期內貴金屬預計將持續波動,由于人民幣升值,內外比價收縮,滬金2310
港媒:哈爾濱承諾舉辦一屆“出色”亞
參考消息網7月11日報道據香港《南華早報》網站7月9日報道,亞奧理事會
21解讀|稅優健康險覆蓋面擴展 險企
南方財經全媒體記者孫詩卉上海報道近日,國家金融監督管理總局發布《關
宿建德江
宿建德江 唐 孟浩然 移舟泊煙渚,
售價已接近50萬人民幣 名爵Cyberste
7月10日,上汽名爵官方發布了名爵Cyberster的內飾官圖。新車計劃在2024
AMD Ryzen 5 7500F僅在中國銷售,
AMDRyzen57500F僅在中國銷售,或使用了有缺陷的IOD,中國,芯片,amd,英特
港股異動 | 云頂新耀-B(01952)早盤
云頂新耀-B(01952)早盤持續走高漲超6%,截止發稿漲6 17%,報19 96港元
夢幻聯動!哪吒敖丙助力電影《茶啊二
動畫電影《茶啊二中》發布與電影《哪吒之魔童降世》聯動短片,哪吒敖丙
緊盯江河湖庫 力保安全度汛
我國即將進入“七下八上”防汛關鍵期,區域性洪水、干旱、高溫熱浪
田遨_關于田遨介紹
田遨,關于田遨介紹這個很多人還不知道,我們一起來看看!1、田遨,原名