OpenAI現允許網站阻止其網絡爬蟲抓取數據,避免數據被用于訓練AI模型
                發布時間:2023-08-08 17:09:18 文章來源:中關村在線
                OpenAI近日推出了一項新功能,允許網站阻止其網絡爬蟲從其網站上抓取數


                (資料圖片)

                OpenAI近日推出了一項新功能,允許網站阻止其網絡爬蟲從其網站上抓取數據訓練GPT模型,以解決可能涉及到的數據隱私和版權問題。網絡爬蟲是一種自動化的程序,可以在互聯網上搜索和獲取信息。OpenAI的網絡爬蟲名為GPTBot,其會以一定的頻率訪問各種網站,并將網頁內容保存下來,用于訓練GPT模型。 OpenAI表示,網站運營者可以通過在其網站的Robots.txt文件中禁止GPTBot的訪問,或者通過屏蔽其IP地址,來阻止GPTBot從其網站上抓取數據。OpenAI還表示,“使用GPTBot用戶代理抓取的網頁可能會被用于改進未來的模型,并且會過濾掉那些需要付費訪問、已知收集個人身份信息(PII)、或者有違反我們政策的文本的來源。”對于不符合排除標準的來源,“允許GPTBot訪問您的網站可以幫助AI模型變得更加準確,并提高它們的通用能力和安全性。” 然而,這并不會追溯性地從ChatGPT的訓練數據中刪除之前從網站上抓取的內容。互聯網為大型語言模型(如OpenAI的GPT模型和谷歌的Bard)提供了大部分的訓練數據,為AI訓練獲取數據已經變得越來越有爭議。一些網站,包括Reddit和Twitter,已經采取措施打擊AI公司免費使用其用戶帖子的行為,而一些作者和其他創作者也因為涉嫌未經授權使用其作品而提起訴訟。

                標簽:

                資訊播報

                樂活HOT

                娛樂LOVE

                精彩推送

                亚洲高清成人一区二区三区| 色在线亚洲视频www| 亚洲最大黄色网站| 精品国产亚洲一区二区三区| 亚洲国产中文字幕在线观看| 亚洲av无码成人精品国产 | 久久亚洲国产最新网站| 亚洲av乱码一区二区三区 | 亚洲日韩国产成网在线观看| 国产天堂亚洲国产碰碰| 深夜国产福利99亚洲视频| 亚洲aⅴ天堂av天堂无码麻豆| 亚洲精品无码久久久久牙蜜区| 亚洲精品国产综合久久久久紧| 亚洲国产精品网站在线播放 | 亚洲AV日韩精品久久久久久| 亚洲av激情无码专区在线播放| 亚洲国产精品一区二区久久| 久久亚洲精品成人AV| 亚洲AV人无码激艳猛片| 亚洲高清资源在线观看| 亚洲国产夜色在线观看| 亚洲AV成人一区二区三区在线看 | 亚洲日韩AV一区二区三区中文 | 亚洲A∨无码无在线观看| 久久久久亚洲精品无码蜜桃| 亚洲第一网站免费视频| wwwxxx亚洲| 亚洲精品动漫免费二区| 亚洲av无码不卡私人影院| 久久青草亚洲AV无码麻豆| 亚洲中文无码av永久| 亚洲一区二区三区高清不卡| 亚洲中文字幕无码亚洲成A人片| 亚洲AV日韩AV无码污污网站| 亚洲国产成人久久一区WWW| 亚洲性猛交XXXX| 亚洲专区先锋影音| 亚洲一区二区三区国产精品无码 | 亚洲av高清在线观看一区二区 | 亚洲精品中文字幕|