OpenAI現(xiàn)允許網(wǎng)站阻止其網(wǎng)絡(luò)爬蟲抓取數(shù)據(jù),避免數(shù)據(jù)被用于訓(xùn)練AI模型
                發(fā)布時間:2023-08-08 17:09:18 文章來源:中關(guān)村在線
                OpenAI近日推出了一項新功能,允許網(wǎng)站阻止其網(wǎng)絡(luò)爬蟲從其網(wǎng)站上抓取數(shù)


                (資料圖片)

                OpenAI近日推出了一項新功能,允許網(wǎng)站阻止其網(wǎng)絡(luò)爬蟲從其網(wǎng)站上抓取數(shù)據(jù)訓(xùn)練GPT模型,以解決可能涉及到的數(shù)據(jù)隱私和版權(quán)問題。網(wǎng)絡(luò)爬蟲是一種自動化的程序,可以在互聯(lián)網(wǎng)上搜索和獲取信息。OpenAI的網(wǎng)絡(luò)爬蟲名為GPTBot,其會以一定的頻率訪問各種網(wǎng)站,并將網(wǎng)頁內(nèi)容保存下來,用于訓(xùn)練GPT模型。 OpenAI表示,網(wǎng)站運營者可以通過在其網(wǎng)站的Robots.txt文件中禁止GPTBot的訪問,或者通過屏蔽其IP地址,來阻止GPTBot從其網(wǎng)站上抓取數(shù)據(jù)。OpenAI還表示,“使用GPTBot用戶代理抓取的網(wǎng)頁可能會被用于改進(jìn)未來的模型,并且會過濾掉那些需要付費訪問、已知收集個人身份信息(PII)、或者有違反我們政策的文本的來源。”對于不符合排除標(biāo)準(zhǔn)的來源,“允許GPTBot訪問您的網(wǎng)站可以幫助AI模型變得更加準(zhǔn)確,并提高它們的通用能力和安全性。” 然而,這并不會追溯性地從ChatGPT的訓(xùn)練數(shù)據(jù)中刪除之前從網(wǎng)站上抓取的內(nèi)容。互聯(lián)網(wǎng)為大型語言模型(如OpenAI的GPT模型和谷歌的Bard)提供了大部分的訓(xùn)練數(shù)據(jù),為AI訓(xùn)練獲取數(shù)據(jù)已經(jīng)變得越來越有爭議。一些網(wǎng)站,包括Reddit和Twitter,已經(jīng)采取措施打擊AI公司免費使用其用戶帖子的行為,而一些作者和其他創(chuàng)作者也因為涉嫌未經(jīng)授權(quán)使用其作品而提起訴訟。

                標(biāo)簽:

                資訊播報

                樂活HOT

                娛樂LOVE

                精彩推送

                亚洲欧洲精品视频在线观看| 亚洲精品无码成人AAA片| 亚洲AV日韩AV永久无码绿巨人| 亚洲一区二区高清| 亚洲精品久久无码av片俺去也| 亚洲三级高清免费| 亚洲av午夜精品无码专区| 亚洲国产片在线观看| 亚洲国产精品久久网午夜| 亚洲成AV人片久久| 亚洲一区在线免费观看| 亚洲一级黄色大片| 亚洲最大的黄色网| 亚洲综合成人婷婷五月网址| 亚洲中文字幕乱码熟女在线| 中文字幕亚洲情99在线| 亚洲欧美国产国产一区二区三区| 亚洲夂夂婷婷色拍WW47| 亚洲国产日韩a在线播放| 国产精品亚洲专区无码牛牛 | 久久人午夜亚洲精品无码区| 亚洲成aⅴ人片久青草影院按摩| 亚洲AV一区二区三区四区| 日本系列1页亚洲系列| 亚洲国产天堂久久久久久| 久久亚洲国产精品123区| 亚洲日本va在线视频观看| 亚洲AV无码乱码国产麻豆穿越| 亚洲人成网站在线播放影院在线| 亚洲精品在线不卡| 精品亚洲成A人无码成A在线观看 | 国产v亚洲v天堂无码网站| 国产∨亚洲V天堂无码久久久| 亚洲av成人无码久久精品| 亚洲网红精品大秀在线观看| 亚洲H在线播放在线观看H| 亚洲国产成人久久精品大牛影视 | 亚洲精品免费在线| 精品丝袜国产自在线拍亚洲| 亚洲国产成人久久精品软件 | 亚洲一区中文字幕在线电影网|