Peech：一款可能真正不錯的文本轉語音應用

2022-07-26 發表於業界精選

當進入AppStore下載Peech應用時會立即註意到該應用的圖標顯示烏克蘭國旗和該公司的簡單標志。但這不僅僅是一種團結的表現。這款文字轉語音應用的團隊有三位東歐創始人，他們受到俄羅斯跟烏克蘭戰爭的嚴重影響。

TechCrunch通過Zoom采訪聯合創始人兼CEO Andrey Poznyak，當時他正在波蘭，但他最初來自白俄羅斯。Poznyak是抗議白俄羅斯2020年總統選舉結果的數千人中的一員。

“之後出現相當多的抗議活動，然後鎮壓開始，”波茲納克告訴TechCrunch，“我作為政治犯在監獄裡待半年。”

在白俄羅斯出獄後，Poznyak逃到烏克蘭。但在俄羅斯入侵前的幾個月裡，他不得不再次搬遷到波蘭。近600萬像Poznyak這樣的難民已經離開烏克蘭以在其他歐洲國傢尋找安全。

不知何故，在個人和政治動蕩中，他建立Peech，該公司剛剛在Flyer One Ventures的領導下籌集55萬美元的資金。這不是一個小成就。

Peech有50種語言版本，是一個文本轉語音的應用，實際上聽起來相當自然。雖然它不能取代有聲讀物中高質量的人工解說，但Peech使人們能輕松地抓取長篇網絡文章或文件並聆聽它們。

Poznyak表示：“現在看看我的瀏覽器，我有30個標簽打開著--其中一些，我已經整整一年沒有讀過，但我不想失去它們，因為這些信息非常有用。”據悉，Poznyak在技術管理方面擁有12年的經驗。像許多忙碌的讀者一樣，他發現通過聽有聲讀物或播客來學習更容易，因為這更有利於多任務的處理。

Pzynak是對的，消費者需要一種產品來幫助他們通過音頻消費更多的書面內容。

Poznyak指出，Peech能通過機器學習使其文本-語音輸出聽起來如此自然。Peech使用開源的原始音頻模型WaveNet，該模型由DeepMind創建，該公司於2014年被Google收購。

“我們在引擎蓋下有六七個不同的機器學習模型，”Poznyak告訴TechCrunch。他提到來自AWS、Google和微軟的模型並指出他們的一些模型是內部設計的。

隻要每月支付約3美元用戶就可以無限制地使用Peech應用並可以根據自己的需要上傳盡可能多的word文檔、PDF或文章鏈接。另外，用戶還可以上傳書頁的照片，Peech可以將其掃描成文本並讀給其聽。這種應用對有低視力、閱讀障礙或其他使閱讀成為挑戰的人來說也是一種財富。

通過向TikTok用戶提供免費的高級訂閱以換取推廣，Peech在影響者營銷方面做得不錯。#peechapp標簽有近3000萬次瀏覽，大部分來自“BookTok”和“StudyTok”的創作者。

如果Peech達到更大的受眾群，那麼看看出版物對他們的文章被交叉填充會有什麼反應對該應用來說可能成為一個問題。粘貼已經獲得的文章的URL然後用Peech的技術幫助閱讀是一回事，但Peech有一個應用內的發現工具可以讓用戶聽預先加載的文章。

如果它流行起來，這些公司不可能對此有好感，因為在Peech應用中收聽這些文章意味著原網站得不到頁面瀏覽量，這意味著廣告收入減少。

實際上，許多大型媒體公司如《紐約時報》都在音頻內容方面進行大量投資，其中包括被重新利用為播客的敘述性文章。Peech要想長期成功則需要在如何跟這些出版商打交道方面更加認真。

相關推薦