谷歌借機器學習技術增強現實生活中的文本圖像翻譯體驗


Google正在通過機器學習(ML)驅動的附加功能,對其翻譯服務帶來新一輪升級。這使得用戶能夠更輕松地翻譯現實世界中出現的文本,比如店面招牌、菜單、文檔、名片等項目。更棒的是,新功能不會簡單粗暴地將譯文覆蓋到原始文本的上方,而是利用AI生成的背景來重建像素,以便帶來更自然的使用體驗。

1.jpg

谷歌搜索副總裁兼總經理 Cathy Edwards 指出:

很多情況下, 單詞的上下文組合 —— 比如背景圖像 —— 真正為用戶看到的內容賦予更大的意義。

此時你肯定不希望圖像中可能出現的重要背景,被翻譯後的文本給遮蓋住。

為讓進展更加順利,谷歌還使用被稱作“生成對抗網絡”(又稱 GAN 模型)的機器學習技術。

在該技術加持下的“魔術橡皮擦”功能,可從 Pixel 智能機拍攝的照片中智能擦除不需要的對象。

2.jpg

但現在,Google 也將它運用到翻譯功能上。通過將譯文融合到復雜的背景圖像中,可為用戶帶來更加自然且無縫的使用體驗。

在軟件呈現的畫面中,你能夠像原文那樣查看譯文,而不是在當前圖像上再添加一層遮擋。說到這,一些人可能已經聯想到該公司有意打造的新款 AR 眼鏡。

Google 稱,每月都有超 10 億人次使用該公司的翻譯服務,涉及超過 100 種語言的文本和圖像。

今年開始,Google 還開始在公共場所,與少數員工和值得信賴的測試者們,一起評估他們的 AR 原型設備。

遺憾的是,該公司首次進軍消費級智能眼鏡領域的 Google Glass 產品,最終隻是曇花一現。

最後,Google 沒有分享其翻譯功能的長期規劃,僅表示相關功能會在今年晚些時候推出。


相關推薦

2024-02-13

烈的關註,讓用戶與AI的互動變得更高效。這也就是為何谷歌在去年12月發佈的大模型Gemini的宣傳片引起轟動:在片中,Gemini似乎能夠實時識別圖片,還會生成音頻和圖片來輔助回答。谷歌Gemini宣傳片截圖。不過,谷歌在事後承

2023-02-16

數字,Facebook 用4.5年,WhatsApp用3.5年,Instagram用2.5年,谷歌則用將近一年。中國科學院自動化研究所研究員、數字內容技術與服務研究中心主任張樹武在接受科技日報記者采訪時表示,人們可以把ChatGPT視為繼語音、圖像視頻識

2023-03-15

“阿爾法狗”(AlphaGo)擊敗韓國圍棋冠軍李世乭,以及機器學習的誕生,AI 算法、算力、數據“三駕馬車”獲得突破性技術進展。但問題在於,機器學習利用循環神經網絡(RNN) ——序列數據或時序數據的人工神經網絡來處理文

2024-03-18

的新型多模式方法,這種方法可以實現更靈活、更強大的機器學習和"人工智能"系統。該公司本周早些時候在研究網站 arxiv.org 上發佈的一篇研究論文顯示,蘋果公司使用一種所謂的"精心混合"圖像字幕

2024-02-16

剛剛,我們經歷LLM劃時代的一夜。Google又在深夜發炸彈,GeminiUltra發佈還沒幾天,Gemini1.5就來。卯足勁和OpenAI微軟一較高下的Google,開始進入高產模式。自傢最強的Gemini1.0Ultra才發佈沒幾天,Google又放大招。就在剛剛,GoogleDeepMind

2023-11-13

包括手勢、動作序列或皮膚紋理的變化等。從理論上講,機器學習模型要比人類要更擅長總結出詞匯之間松散的相關性,神經網絡的輸入不對輸入數據的性質做任何假設,隻要某種模式頻繁出現,就有可能發現動物交流中蘊含的

2023-05-23

ChatGPT大火之後,多傢公司加入生成式AI這一領域的競賽,谷歌推出競品Bard人工智能聊天機器人,並已進行升級,亞馬遜也準備為電商增加類ChatGPT搜索,已在招聘研發人員。在ChatGPT掀起的生成式人工智能開發與應用浪潮中,蘋果

2023-01-06

察世界,如視覺、聽覺和我們對語言的理解。另一方面,機器則通過算法可以處理的數據來解釋世界。因此,當機器"看到"一張照片時,它必須將照片編碼為它可以用來執行圖像分類等任務的數據。當輸入有

2024-03-12

入選。其中包括師從陳丹琦、韓傢煒教授的博士生。蘋果機器學習研究中心(AppleMachineLearningResearch)發佈2024年在人工智能/機器學習領域獲得博士生獎學金的“蘋果學者”名單。值得一提的是,今年共有21位學者獲獎。其中,華

2022-09-22

識別系統置於其軟件和服務的核心地位。但在人工智能和機器學習領域,語音識別仍是一個頗具挑戰性的話題。好消息是,今日OpenAI隆重地宣佈Whisper的開源——可知作為一套自動語音識別系統,官方宣稱它能夠實現多種語言的

2022-08-27

給Imagen加上“指哪打哪”的能力,會變得有多強?隻需上傳3-5張指定物體的照片,再用文字描述想要生成的背景、動作或表情,就能讓指定物體“閃現”到你想要的場景中,動作表情也都栩栩如生。不止是動物,其他物體像墨鏡

2024-03-09

一百萬倍。”Google工程師:2028年有10%概率實現AGI而Google機器人團隊的軟件工程師Alex Irpan,在LLM領域出現進展後發現,AGI的到來會比自己預想的更快。Irpan對於AGI的定義如下——一個人工智能系統,在幾乎所有(95%+)具有經濟價

2023-02-15

據TheInformation爆料,OpenAI在最近幾個月裡挖至少十幾名GoogleAI的員工,而這些工程師都在ChatGPT的研究中發揮至關重要的作用。如今已經沒人能否認,OpenAI憑ChatGPT火遍全球。所有AI從業者和投資人都想知道,一傢成立7年的小初創公

2023-03-03

一年一度的蘋果博士獎學金又開獎啦!剛剛,蘋果機器學習研究中心(AppleMachineLearningResearch)發佈2023年在人工智能/機器學習領域獲得博士生獎學金的“蘋果學者”名單。今年,共有22位學生榮獲蘋果獎學金,其中,華人學生占