聲音經濟

發稿時間:2022/04/15
聲音經濟
聲音經濟
作者|緒方憲太郎
譯者|林詠純
出版社|商周出版
出版日期|2022/04/14

  已有超過三分之一的美國人擁有智慧音箱;台灣每5人就有1人收聽Podcast;2021年Podcast廣告年收益已超過10億美元;Spotify美國Podcast聽眾人數在2023年將成長至3,750萬,聲音經濟是繼智慧型手機後的下一場科技革命。

  聲音經濟改變人們的溝通方式,使我們不再被「螢幕」綁架,已成為備受關注、充滿潛力與商機的全新藍海市場。聲音經濟的崛起,Podcast的風潮只是一個開端,聲音的無窮潛力受到全球的關注,Google、Apple、Facebook、Amazon等跨國企業積極投入聲音市場,是現今商業界最受矚目的焦點。隨著語音辨識、深度學習等聲音科技的發展,讓人們從被螢幕綁架的現況中解放,大幅改變人與資訊的互動方式。

文章節錄

  每當新的介面誕生,多數人都會覺得「應該不會有更進一步的發展了吧」。譬如電腦出現、普及的時候,多數人都在無意識中深信這就是傳遞、接收資訊所發展出來的終極形式。

  如果深陷於這樣的想法,那麼接下來出現的智慧型手機,看起來也只是電腦的延伸,不過就是電腦的縮小版。我們在智慧型手機登場的時候,想必已經看過許多企業受限於眼前慣用的介面,沒有趕上席捲世界的新潮流。

  電腦在30年前登場,智慧型手機在10年前登場。但介面變化的間隔愈來愈短,智慧型手機不可能過了10年之後依然獨領風騷。

  智慧型手機登場的時候,許多日本企業準備從原本以電腦為中心的商業模式轉型,卻因為慢了一步而陷入苦戰。現在可能又會發生同樣的狀況,新的介面又再度被GAFA等海外企業掌控也無所謂嗎?

  資訊大致可以分成兩種:分別是文字、圖片、影片等「用手製作,用眼睛接收的資訊」,以及語音這種「用嘴巴製作,用耳朵接收的資訊」。Google 透過自動抓取(利用機器讀取收集)網路上的內容,一口氣掌控了前者;但後者尚未被任何人掌控。語音領域的霸主到底會是誰呢?

  文字、圖片、影片的時代、智慧型手機的時代還會再持續一陣子,但為什麼語音科技革命會在現在這個時間點到來?

  這場革命當然不是突然發生的。微小的潮流從好幾年前就開始持續,新的潮流一點一滴往這裡匯聚,涓滴細流逐漸壯大,現在即將成為一條大河。在漫長的助跑期間,科技逐漸進步、內容變得充實、裝置陸續登場、人們聆聽的習慣發生改變,因此眼前終於展開一片廣大的藍海。

  到處都出現預兆,但儘管已經看見萌芽的兆頭,語音領域依然只有一小部分轉換成收益,日本也尚未誕生多少殺手級內容。語音領域仍是未開發的市場,成長的可能性極大。

▍科技進步帶來革命

  為什麼現在終於迎來改變的時代呢?關鍵就在於「語音科技的進步」、「裝置的普及」與「『聆聽』習慣的擴大」。

  分析技術在語音科技的進步中尤其特別重要。

  其實語音的數位化早在很久以前就已經實現了,從使用唱片或錄音帶錄音的類比時代,轉變成將聲音以數位檔案保存、傳送、接收的時代,不是這一、兩天的事情。

  但從前數位化的聲音,只是以數位檔案蓄音,儲存震動的高低,檔案裡只有成堆的數據。除非開啟檔案實際聆聽,否則不會知道裡面儲存了哪些語音或資訊。

  不過,分析語音的技術在這幾年飛躍性地提升,機器逐漸能夠理解數位語音檔案的內容。而這項的技術進步,正是Apple 的Siri、Google 的Google 助理等語音助理誕生的背景。

  現在網路上累積了龐大的資訊,提供幫助電腦進行深度學習(機器學習)所需的豐富素材,再加上能夠取得具備分析所需處理能力的電腦,這樣的技術才得以實現。

  話說回來,無法得知語音檔案內容的狀態到底有什麼問題呢?

  直截了當地說,就是無法轉換成收益。語音檔案如果有辦法進行機器化分析,就能夠搜尋,廣告的可能性也會擴大,成為收益化的泉源。

  回顧1990到2000年代初期網路上的文字資訊應該就會很清楚,從前寫在紙上的資訊變成數據,開始能夠利用機器進行分析,所以也能夠搜尋或推薦,進一步創造出金流。於是網路上的廣告收益,有好長一段時間超過了報紙、雜誌、電視等大眾媒體。

  最具代表性的語音科技,就是將語音當成文字辨識的技術。如果沒有將人類說出的語言傳換成文字的語音辨識技術,就無法發展出Siri 或Google 助理等語音助理。這項技術對語言的依賴性大,因此中、英語領域的進展地特別快速。

 深度學習需要大數據,使用人口多的中、英語必然具備優勢。另一方面,使用這個語言的人口規模直接就能轉換成市場規模,因此使用人口多的語言,參與的企業也多。

  日語因為語言的特殊性,使用人口相對較少,語音辨識稍微落後中、英語,而這也會成為海外企業的門檻,使他們較難進入日語的領域。

  除此之外,語音科技還有以機器區分人類語言與背景雜音(噪音等),進行消除雜音等處理、透過聲紋辨識個人等許許多多不同的技術。

  其中,我特別關注分析接收者行動的技術,換句話說就是分析「聽到的人有什麼反應」,這個領域雖然尚未開拓,但將來有機會大幅發展。如果將這個技術與語音分析結合,就能知道什麼樣的語音能夠影響聽者的行動,語音廣告的可能性就會變得更大。這麼一來,語音搜尋廣告或語音的「搜尋引擎最佳化」(SEO),也能像Google 在文字、圖片、影片領域的發展那樣成為可能。

  —本文摘自商周出版《聲音經濟:從語音助理、Podcast到智慧音箱,科技巨頭爭相搶進的新市場》

本網站使用相關技術提供更好的閱讀體驗,同時尊重使用者隱私,點這裡瞭解中央社隱私聲明當您關閉此視窗,代表您同意上述規範。
close-privacy