首頁／財經

聲音經濟

發稿時間：2022/04/15

聲音經濟

作者｜緒方憲太郎

譯者｜林詠純

出版社｜商周出版

出版日期｜2022/04/14

　　已有超過三分之一的美國人擁有智慧音箱；台灣每5人就有1人收聽Podcast；2021年Podcast廣告年收益已超過10億美元；Spotify美國Podcast聽眾人數在2023年將成長至3,750萬，聲音經濟是繼智慧型手機後的下一場科技革命。

　　聲音經濟改變人們的溝通方式，使我們不再被「螢幕」綁架，已成為備受關注、充滿潛力與商機的全新藍海市場。聲音經濟的崛起，Podcast的風潮只是一個開端，聲音的無窮潛力受到全球的關注，Google、Apple、Facebook、Amazon等跨國企業積極投入聲音市場，是現今商業界最受矚目的焦點。隨著語音辨識、深度學習等聲音科技的發展，讓人們從被螢幕綁架的現況中解放，大幅改變人與資訊的互動方式。

文章節錄

　　每當新的介面誕生，多數人都會覺得「應該不會有更進一步的發展了吧」。譬如電腦出現、普及的時候，多數人都在無意識中深信這就是傳遞、接收資訊所發展出來的終極形式。

　　如果深陷於這樣的想法，那麼接下來出現的智慧型手機，看起來也只是電腦的延伸，不過就是電腦的縮小版。我們在智慧型手機登場的時候，想必已經看過許多企業受限於眼前慣用的介面，沒有趕上席捲世界的新潮流。

　　電腦在30年前登場，智慧型手機在10年前登場。但介面變化的間隔愈來愈短，智慧型手機不可能過了10年之後依然獨領風騷。

　　智慧型手機登場的時候，許多日本企業準備從原本以電腦為中心的商業模式轉型，卻因為慢了一步而陷入苦戰。現在可能又會發生同樣的狀況，新的介面又再度被GAFA等海外企業掌控也無所謂嗎？

　　資訊大致可以分成兩種：分別是文字、圖片、影片等「用手製作，用眼睛接收的資訊」，以及語音這種「用嘴巴製作，用耳朵接收的資訊」。Google 透過自動抓取（利用機器讀取收集）網路上的內容，一口氣掌控了前者；但後者尚未被任何人掌控。語音領域的霸主到底會是誰呢？

　　文字、圖片、影片的時代、智慧型手機的時代還會再持續一陣子，但為什麼語音科技革命會在現在這個時間點到來？

　　這場革命當然不是突然發生的。微小的潮流從好幾年前就開始持續，新的潮流一點一滴往這裡匯聚，涓滴細流逐漸壯大，現在即將成為一條大河。在漫長的助跑期間，科技逐漸進步、內容變得充實、裝置陸續登場、人們聆聽的習慣發生改變，因此眼前終於展開一片廣大的藍海。

　　到處都出現預兆，但儘管已經看見萌芽的兆頭，語音領域依然只有一小部分轉換成收益，日本也尚未誕生多少殺手級內容。語音領域仍是未開發的市場，成長的可能性極大。

▍科技進步帶來革命

　　為什麼現在終於迎來改變的時代呢？關鍵就在於「語音科技的進步」、「裝置的普及」與「『聆聽』習慣的擴大」。

　　分析技術在語音科技的進步中尤其特別重要。

　　其實語音的數位化早在很久以前就已經實現了，從使用唱片或錄音帶錄音的類比時代，轉變成將聲音以數位檔案保存、傳送、接收的時代，不是這一、兩天的事情。

　　但從前數位化的聲音，只是以數位檔案蓄音，儲存震動的高低，檔案裡只有成堆的數據。除非開啟檔案實際聆聽，否則不會知道裡面儲存了哪些語音或資訊。

　　不過，分析語音的技術在這幾年飛躍性地提升，機器逐漸能夠理解數位語音檔案的內容。而這項的技術進步，正是Apple 的Siri、Google 的Google 助理等語音助理誕生的背景。

　　現在網路上累積了龐大的資訊，提供幫助電腦進行深度學習（機器學習）所需的豐富素材，再加上能夠取得具備分析所需處理能力的電腦，這樣的技術才得以實現。

　　話說回來，無法得知語音檔案內容的狀態到底有什麼問題呢？

　　直截了當地說，就是無法轉換成收益。語音檔案如果有辦法進行機器化分析，就能夠搜尋，廣告的可能性也會擴大，成為收益化的泉源。

　　回顧1990到2000年代初期網路上的文字資訊應該就會很清楚，從前寫在紙上的資訊變成數據，開始能夠利用機器進行分析，所以也能夠搜尋或推薦，進一步創造出金流。於是網路上的廣告收益，有好長一段時間超過了報紙、雜誌、電視等大眾媒體。

　　最具代表性的語音科技，就是將語音當成文字辨識的技術。如果沒有將人類說出的語言傳換成文字的語音辨識技術，就無法發展出Siri 或Google 助理等語音助理。這項技術對語言的依賴性大，因此中、英語領域的進展地特別快速。

　深度學習需要大數據，使用人口多的中、英語必然具備優勢。另一方面，使用這個語言的人口規模直接就能轉換成市場規模，因此使用人口多的語言，參與的企業也多。

　　日語因為語言的特殊性，使用人口相對較少，語音辨識稍微落後中、英語，而這也會成為海外企業的門檻，使他們較難進入日語的領域。

　　除此之外，語音科技還有以機器區分人類語言與背景雜音（噪音等），進行消除雜音等處理、透過聲紋辨識個人等許許多多不同的技術。

　　其中，我特別關注分析接收者行動的技術，換句話說就是分析「聽到的人有什麼反應」，這個領域雖然尚未開拓，但將來有機會大幅發展。如果將這個技術與語音分析結合，就能知道什麼樣的語音能夠影響聽者的行動，語音廣告的可能性就會變得更大。這麼一來，語音搜尋廣告或語音的「搜尋引擎最佳化」（SEO），也能像Google 在文字、圖片、影片領域的發展那樣成為可能。

　　—本文摘自商周出版《聲音經濟：從語音助理、Podcast到智慧音箱，科技巨頭爭相搶進的新市場》

本週選書

熱門選書

本網站使用相關技術提供更好的閱讀體驗，同時尊重使用者隱私，點這裡瞭解中央社隱私聲明。當您關閉此視窗，代表您同意上述規範。