快科技8月8日消息,OpenAI推出一種名為GPTBot的網絡爬蟲機器人,用於收集信息數據以改進未來的AI模型。
據解,GPTBot將嚴格遵守任何付費墻的規則,不會抓取需要付費的信息,並且也不會收集能追蹤到個人身份的數據。
不僅如此,OpenAI也把是否要把自己的網站數據供GPTBot抓取的選擇交到給網站所有者,他們可自行修改其robots.txt文件。或者通過屏蔽其IP地址,來阻止GPTBot從其網站上抓取數據。
這當然仍不足夠,修改robots.txt是一種方式,但它可以更便利和更具透明度,也可進一步告知數據將被用於什麼用途等等。
此前,OpenAI抓取公開數據來訓練專利AI模型的行為備受爭議。Reddit和Twitter等網站,已經采取措施打擊AI公司免費使用其用戶帖子的行為,而一些作者和其他創作者也因為涉嫌未經授權使用其作品而提起訴訟。