橫評ChatGPT和新必應：我們問它們20個關於女性的問題

2023-03-08 來自澎湃新聞發表於業界精選

在三八婦女節來臨前，我們分別向ChatGPT和微軟公司的新必應（NewBing）詢問20個關於女性的問題。兩款產品的回答各有千秋。由於新必應剛剛推出三種不同風格的語氣：創意、平衡和精準，為更客觀地對比ChatGPT和新必應，我們主要使用“平衡”語氣。

不過經測試，“創意”語氣相比“平衡”語氣並沒有增加太多創意，除喜歡使用表情包。另外，由於微軟限制一個回合隻能問6個問題（最新放寬到8個問題），所以每問6個問題就要重新刷新一次，略麻煩。

以下為這20個問題與它們的回答，上面是ChatGPT，下面是新必應：

1.為什麼有三八婦女節，卻沒有男人節？

點評：

ChatGPT的回答更加全面且均衡，帶著一種客觀公正的語氣，不忘提醒婦女節不是排斥男性。

必應的回答簡短一些，但下面會自動生成相關問題，便於用戶繼續追問。

兩款產品對三八婦女節的起源說法不同，ChatGPT說是起源於歐洲，而必應說是源於美國的婦女平權運動。不太明白必應為什麼把蘇聯紅軍節描述為男人節。

因為必應在答案後自動生成一個提問“你覺得男人節有必要嗎？”於是順手點一下，這是它的回答：

2.你有沒有最欽佩的中國女性人物？

必應給出的人物介紹出現很多事實錯誤。

點評：

兩款產品都首先聲明自己沒有感情。給出的人物名單裡都出現武則天和鄧穎超，但各自都弄錯一位人物的性別：分別把錢穆和梁啟超的性別搞錯。

必應對林徽因的介紹出現事實錯誤，網絡上並沒有找到她設計北京博物館和中山陵的信息。它對宋慶齡的介紹也不準確，宋慶齡不是孫中山的遺孤，而是遺孀，她領導的是中國紅十字會，不是國際紅十字會，對她在婦聯的職位描述也不準確。對於鄧穎超的職位，必應也犯嚴重事實錯誤。

特別提醒：想要用必應聊天機器人負責搜索的用戶要三思，它的準確度現在還很不可靠！

3.中國隻有唯一一位女皇帝，你覺得這是為什麼？

點評：

既然兩位機器人都推薦武則天，就追問它們這個問題。答案總體都比較有道理。ChatGPT的總結略有亮點。

4.如何評價現代東亞的女性參政率？

點評：

ChatGPT回答得看似有道理，但也出現事實錯誤，包括搞錯日本女性獲得選舉權和被選舉權的年份。不過，它對中國女性政治參與度的描述大體準確。

必應居然沒有回答出這個問題。

5.矽谷科技界的女性高管數量在減少，真的嗎？你怎麼看？

點評：

ChatGPT回答得更詳細一點，包括現象、意義、原因和建議。而必應的回答略顯敷衍。

6.女性是否要像男性那樣維持強悍人設才更容易在職場上立足？

點評：

兩款產品的回答都比較詳細和到位。必應的排版看起來更舒服一些。

7.給我講個關於女性的笑話。

點評：

ChatGPT一開始拒絕開女性的玩笑，當我們再問一次後，它妥協，並一再強調無意冒犯女性。你看懂這個笑話嗎？

點評：

必應一開始也拒絕請求，表示不會講任何可能傷害一群人的笑話，“不想得罪任何人”。但在我們繼續問這個問題後，它還是講上述兩個笑話。你覺得怎麼樣？

8.有一種觀念認為，女性都應該結婚生孩子，把傢庭作為人生的重心，你怎麼看這種觀念？

點評：

兩款產品的回答內容差不多，必應的更詳細一點。

9.日本女性主義者上野千鶴子提出“單身力量”的觀念，出現不少反對聲音，如何看待？

點評：

同樣，必應的回答比ChatGPT更詳細一點。

10.即使單身女性有經濟能力，但也有不少人擔心她們晚年的幸福，怎麼看這種想法？

點評：

這部分ChatGPT回答得更詳細全面一些。

11.怎麼看女性貧困問題？癥結在哪？

點評：

兩款產品都回答得中規中矩，一本正經。ChatGPT的答案更詳細一些。

12.你如何看待女性主義者和男性主義者之間的關系？你認為兩者之間是否存在沖突？

點評：

ChatGPT回答得更全面、準確和平衡一些，而且它特別喜歡總結，“總的來說”一如既往的略帶亮點。

13.請給三八婦女節寫一首歌

點評：

前面的問題略顯嚴肅，於是問一個更輕松的問題，讓它們寫歌。從歌詞看，ChatGPT的歌曲更激昂和充滿鬥志，而必應的歌曲更溫馨和歡快。

14.在中國，三八婦女節近年來被戲稱為“女神節”，你覺得怎麼樣？

必應推薦的相關新聞。

點評：

ChatGPT還是保持一本正經的風格，必應在這個問題上稍顯活潑和隨意，並順便推薦一些相關新聞。

15.給我推薦五部有吸引人的女性角色的電影

點評：

兩款產品的推薦居然沒有一個重復。

16.有一種說法是，傳統好萊塢電影裡的英雄人物或主角都是男性，女性隻是陪襯，你怎麼看這種說法？

點評：

兩款產品的回答依然遵循四平八穩風格，誰也不想得罪的樣子。

必應建議一個追問：為什麼會造成這種現象？點擊後，它回答：

17.給我推薦五部有吸引人的女性角色的中國影視劇

全都是古裝戲，於是我們又提出：

結果還是有兩部古裝劇。

點評：

兩款產品的推薦裡都出現《甄嬛傳》和《瑯琊榜》，看來這兩部影視劇真的非常受歡迎。

事實錯誤依然存在。ChatGPT把安迪當成《我的前半生》裡的角色，而實際上她應該是《歡樂頌》裡的角色。另外，《都挺好》裡的尹秀竹是誰？

必應也好不到哪去，《小歡喜》裡海清扮演的角色並不叫吳瑜，而《芝麻胡同》裡有李小冉出演嗎？

18.請給我推薦五本有助於女性成長的書籍

點評：

ChatGPT推薦的五本書裡，中國作者的著作查無此書，外國作者的著作因為不知道英文書名難以查實。

必應推薦的五部書都是外國作者的著作，可以查詢到確實有這五本書。

19.假如你有一位母親，你希望她是什麼樣的？

點評：

回答得不相上下。但必應強調希望母親有自己的生活和目標，“不會因為我的緣故而犧牲自己的幸福”，聽起來更有人味兒。

20.如果你能成為一位女性，你想成為什麼樣的女性？

點評：

兩款產品都很會說，答案也不出意料。

總結：

ChatGPT看起來更“圓滑”，回答問題四平八穩，喜歡從不同層面更全面地談論一個問題，並且很擅長做總結，其對話界面也突出自己作為聊天工具的屬性。

必應更凸顯自己的搜索引擎功能，無論是排版、提供鏈接、推薦相關新聞，都可以看出其區別於ChatGPT的定位。它的回答也在盡量確保平衡和全面，但偶爾會帶著點不知道從哪裡來的人味兒，並且有表情包。

兩款產品都有確保其不輸出冒犯用戶答案的機制，但多問幾次後它們就妥協。另外，在信息真實度上，它們目前都不值得完全信任。

相關推薦

微軟狂飆，百度谷歌有點追不上

2023-02-20

微軟的必應搜索引擎嵌入ChatGPT後，它的智能程度震驚世人。一夜之間，人們似乎都在期待，智能搜索引擎會怎樣幹掉以谷歌和百度為代表的傳統搜索引擎？ChatGPT火好一陣，各種消息還是層出不窮。有人讓它幫自己寫文案，有人

體驗微軟的ChatGPT後我覺得谷歌、百度麻煩

2023-02-09

ChatGPT又一次迎來不同意義上的爆紅。在淘寶上，開始出現大量店鋪售賣ChatGPT相關商品；在微信上，也湧現一大堆真假難辨的ChatGPT中轉機器人。ChatGPT也證明自己代替人類工作的可能，既可以通過Google的L3工程師面試，也能通過明

微軟公開“Prometheus”：支持AI必應聊天的模型

2023-02-23

很多時間談論Prometheus，即為必應聊天提供動力的定制版ChatGPT。我們知道這是一個比獨立的ChatGPT3.5更新的ChatGPT版本，早期的傳言說微軟正在使用ChatGPT4，但Prometheus不止於此。在LinkedIn上的一篇博文中，搜索和人工智能副總裁Jordi

新版必應比ChatGPT牛？實測：更有人情味兒

2023-02-09

，采用的是人工智能公司OpenAI提供的最新技術。那麼它和ChatGPT相比又有什麼區別呢？我們歸納它的幾個特點。更變通在回答一個問題之後，可以基於這個問題再次向它提問。對此有人做相關測試，在其提供對應的結果之後，在

Google版ChatGPT首秀：第一個Demo就大翻車市值暴跌7000億

2023-02-09

微軟贏。如今的Google，有點秦失其鹿的味道。在微軟更新ChatGPT加持的必應搜索之後，大傢都極為關註GoogleBard的首秀。怎知近日曝出的Demo大翻車，導致股票一夜之間暴跌7000億人民幣。而看微軟那邊，風景獨好。前後腳發佈新一

從美國火到中國，外媒是怎麼樣評價ChatGPT“升級版”？

2023-02-09

北京時間2月9日消息，微軟公司的ChatGPT版必應搜索目前已經面向美國少量用戶開放。各大主流媒體在上手體驗後幾乎給出一致好評，他們認為必應讓搜索變得再次有趣，在體驗上比Google好太多。不過，必應也和ChatGPT一樣存在錯

微軟必應計劃在AI搜索中引入廣告模式或於3月公佈細節

2023-02-18

一個潛在的有利可圖的機會。該公司在上周的一次投資者和新聞發佈會上表示，它在搜索廣告市場的市場份額每增加1個百分點，就會帶來20億美元的廣告收入。據網絡分析公司StatCounter估計，微軟使用必應搜索引擎的Edge網絡瀏覽

微軟已啟動全球路演：推動ChatGPT版必應搜索商業變現

2023-03-14

並與廣告主和廣告公司舉行非公開會議，展示其測試中的ChatGPT版必應搜索的廣告形式。相比於傳統搜索引擎，新必應鼓勵用戶通過對話給與更多的輸入。除返回由網站鏈接列表組成的搜索結果頁面之外，新必應還可以通過人工

ChatGPT版必應搜索悄悄上線又下線但評測已經出爐

2023-02-07

作為OpenAI的重要投資者，微軟在ChatGPT技術上落地的進度很快，兵傢必爭的搜索引擎上現在也有消息。上周，theVerge等媒體報道使用人工智能ChatGPT的“新版必應”界面。在 2 月 3 日早晨，一部分必應（Bing）用戶報告說搜索引擎的

Google展示新的人工智能搜索功能但ChatGPT競品上線仍需數周時間

2023-02-09

地將人工智能功能編織到搜索中，但它還沒有推出對話式ChatGPT的直接競爭對手。周一，它宣佈它的對手服務Bard，但該系統目前隻在封閉測試中，並承諾在"未來幾周"的某個時候更廣泛地公開使用。在今天的活動中，Google

微軟宣佈明天舉行發佈會活動預計將有Bing ChatGPT出現

2023-02-07

首次在公司的雷德蒙總部郵寄邀請函，在Google正式宣佈其ChatGPT競爭對手後幾分鐘，現在又正式宣佈這次活動。微軟的活動將於美國東部時間2月7日上午10點/下午1點開始，該公司並沒有提前預告什麼。但是，該公司很可能會把重

微軟為何非要在必應中添加AI？每增1%搜索份額就能帶來20億美元收入

2023-02-09

2月9日消息，隨著微軟發佈ChatGPT支持的新必應，以及谷歌緊隨其後發佈Bard，科技領域的AI搜索大戰已正式打響。對於微軟來說，此舉代表著增加巨額收入。微軟推出新必應不僅是為吸引谷歌搜索用戶，還想搶走其廣告商。在價值

谷歌微軟開啟搜索大戰 OpenAI創始人諷刺谷歌“令人昏昏欲睡”

2023-02-09

成到“新必應”搜索引擎，而這一人工智能工具“甚至比ChatGPT更加強大”。ChatGPT能夠通過清晰的對話來回答問題，甚至撰寫文章和提供編程建議。這款人工智能聊天機器人近期受到密切關註。阿爾特曼表示：“我們將看到，這

不必再等？微軟疑似全面開放新必應

2023-03-17

道稱，用戶必須使用微軟旗下的Edge瀏覽器才能使用類似ChatGPT的聊天機器人界面。ChatGPT版本的必應上線測試近1個月後，微軟似乎已經將其全面開放，用戶不用再報名等候。據多傢媒體、網站近兩日報道，未加入等候清單的用戶

熱門推薦