Peech:一款可能真正不錯的文本轉語音應用


當進入AppStore下載Peech應用時會立即註意到該應用的圖標顯示烏克蘭國旗和該公司的簡單標志。但這不僅僅是一種團結的表現。這款文字轉語音應用的團隊有三位東歐創始人,他們受到俄羅斯跟烏克蘭戰爭的嚴重影響。

TechCrunch通過Zoom采訪聯合創始人兼CEO Andrey Poznyak,當時他正在波蘭,但他最初來自白俄羅斯。Poznyak是抗議白俄羅斯2020年總統選舉結果的數千人中的一員。

“之後出現相當多的抗議活動,然後鎮壓開始,”波茲納克告訴TechCrunch,“我作為政治犯在監獄裡待半年。”

在白俄羅斯出獄後,Poznyak逃到烏克蘭。但在俄羅斯入侵前的幾個月裡,他不得不再次搬遷到波蘭。近600萬像Poznyak這樣的難民已經離開烏克蘭以在其他歐洲國傢尋找安全。

不知何故,在個人和政治動蕩中,他建立Peech,該公司剛剛在Flyer One Ventures的領導下籌集55萬美元的資金。這不是一個小成就。

Peech有50種語言版本,是一個文本轉語音的應用,實際上聽起來相當自然。雖然它不能取代有聲讀物中高質量的人工解說,但Peech使人們能輕松地抓取長篇網絡文章或文件並聆聽它們。

Poznyak表示:“現在看看我的瀏覽器,我有30個標簽打開著--其中一些,我已經整整一年沒有讀過,但我不想失去它們,因為這些信息非常有用。”據悉,Poznyak在技術管理方面擁有12年的經驗。像許多忙碌的讀者一樣,他發現通過聽有聲讀物或播客來學習更容易,因為這更有利於多任務的處理。

Pzynak是對的,消費者需要一種產品來幫助他們通過音頻消費更多的書面內容。

Poznyak指出,Peech能通過機器學習使其文本-語音輸出聽起來如此自然。Peech使用開源的原始音頻模型WaveNet,該模型由DeepMind創建,該公司於2014年被Google收購。

“我們在引擎蓋下有六七個不同的機器學習模型,”Poznyak告訴TechCrunch。他提到來自AWS、Google和微軟的模型並指出他們的一些模型是內部設計的。

隻要每月支付約3美元用戶就可以無限制地使用Peech應用並可以根據自己的需要上傳盡可能多的word文檔、PDF或文章鏈接。另外,用戶還可以上傳書頁的照片,Peech可以將其掃描成文本並讀給其聽。這種應用對有低視力、閱讀障礙或其他使閱讀成為挑戰的人來說也是一種財富。

通過向TikTok用戶提供免費的高級訂閱以換取推廣,Peech在影響者營銷方面做得不錯。#peechapp標簽有近3000萬次瀏覽,大部分來自“BookTok”和“StudyTok”的創作者。

如果Peech達到更大的受眾群,那麼看看出版物對他們的文章被交叉填充會有什麼反應對該應用來說可能成為一個問題。粘貼已經獲得的文章的URL然後用Peech的技術幫助閱讀是一回事,但Peech有一個應用內的發現工具可以讓用戶聽預先加載的文章。

如果它流行起來,這些公司不可能對此有好感,因為在Peech應用中收聽這些文章意味著原網站得不到頁面瀏覽量,這意味著廣告收入減少。

實際上,許多大型媒體公司如《紐約時報》都在音頻內容方面進行大量投資,其中包括被重新利用為播客的敘述性文章。Peech要想長期成功則需要在如何跟這些出版商打交道方面更加認真。


相關推薦

2024-03-23

OpenAI申請商標VoiceEngine,暗示著OpenAI可能即將推出圍繞語音引擎開發的產品或者服務,很有可能是類似Siri那樣的個人助理產品。OpenAI正在申請一個新商標VoiceEngine,商標的覆蓋范圍主要是圍繞語音識別、語音合成和語音生成幾個

2022-09-30

語音清晰度之外,Android應用在調用該服務的時候能夠讓文本轉語音聽起來更加自然。在Android開發者博文中,Google還放出升級前後兩者之間文本轉語音對比。國外科技媒體 The Verge 坦率地表示,雖然聲音聽起來更加得清晰,但是

2023-01-10

。對於計算機行業來說,VALL-E是一項驚人的技術壯舉,有可能改變我們與數字媒體互動的方式。語音的音調、魅力和風格都在生成的語音中保持不變,這是在使TTS系統聽起來更自然方面邁出的重要一步。微軟會不會基於這項技術

2023-09-26

行語音對話,提供更直觀的交互方式。該功能由一個新的文本轉語音模型提供支持,能夠通過文本和幾秒鐘的語音樣本生成類似人類的音頻,且與專業配音演員合作,提供5種可供用戶自行選擇的聲音。此外,該功能還能使用開

2024-04-01

克隆,有效幫助言語障礙學生。然而,鑒於合成語音技術可能存在的濫用風險,OpenAI目前僅對少數可信合作夥伴開放小規模測試。通過這種方式,公司旨在深入解技術的潛在應用,並評估可能帶來的風險。OpenAI也希望通過此舉引

2024-06-08

的信任和選擇。這一成就主要得益於訊飛星火大模型在長文本、長圖文、長語音處理等方面的技術突破,以及其在多情感超擬人合成語音功能上的創新。此外,前不久科大訊飛還宣佈訊飛星火Lite API永久免費開放,以及訊飛星火P

2024-04-01

造的擔憂。該公司分享名為“語音引擎”(VoiceEngine)的文本轉語音模型小規模試用的早期演示和用例,據發言人介紹,目前約有10傢開發商可使用該模型。OpenAI在3月早些時候向記者介紹這一功能,但決定暫不大規模發佈。OpenAI

2022-09-21

Tap to Alexa,開關訪問控制器使那些有嚴重行動障礙的人有可能直接在Fire平板電腦上發出Alexa請求。對於有語言障礙的用戶,Fire平板電腦上的文字轉語音功能旨在讓用戶輸入短語,並通過平板電腦大聲說出來。還可以為常用短語

2023-09-29

聽、說”。新的版本支持語音進行操作和溝通,通過新型文本轉語音模型和語音識別系統實現,允許用戶進行語音對話,並且提供5種不同的語音選擇,iOS和安卓APP都已經開放。有網友展示對於ChatGPT語音的簡單測試,AI已經完全

2023-11-07

GPT,進入GPT Store就可以搜索到他們的GPT,並且這些原創GPT可能會登上排行榜。OpenAI將分為生產力、教育和“隻是為好玩”等類別,關註那些最有用和最讓人開心的GPT。接下來的幾個月,如果用戶打造的GPT上線GPT Store,還可以根據

2023-02-18

聽到發件人聲音的信息似乎不是最緊迫的技術進步,但它可能會受到年長的傢庭成員和合作夥伴/配偶的歡迎,他們希望聽到親人大聲說的信息,就像他們在同一個房間一樣。該專利的發明人是曾從事Siri工作的胡瓊;蘋果公司負

2023-10-28

等。Spot是該公司成立20多年來推出的首款商用機器人,是一款電動液壓機器狗,它能走能跑,還能爬樓梯、上坡下坡。此外,它還擁有跳舞、探索礦井,以及幫助醫務人員等諸多技能,但它還在不斷學習新的技巧。

2024-04-24

中的聲音來自被告一北京某智能科技公司運營的平臺中的文本轉語音產品。原告曾為被告二北京某文化傳媒公司錄制錄音制品,而被告二將這些錄音制品的音頻提供給被告三某軟件公司,允許其使用、復制、修改數據用於其產品

2024-10-10

院經審理後認定,軟件公司僅使用殷某的聲音開發涉案的文本轉語音產品,該AI合成的聲音與殷某自然的音色、語調、發音風格高度一致,足以使得普通人將其與殷某本人聯系起來,識別出殷某的身份。因此,殷某的聲音權益保