大數據助攻 台劇創作掀開新頁

影視製作導入大數據是近年國際趨勢,2016年《我們與惡的距離》首次為台劇點了第一把火,如今星火燎原。
2021/3/13
文:葉冠吟/攝影:徐肇昌(方夢貞)、裴禛(徐毓良)/圖片提供:公視、大慕影藝

21歲到30歲的年輕人最關心什麼?

分齡統整2019年Google關鍵字搜索:21歲是生日與禮物;22到24歲,在乎自己是否還能長高;大學、研究所畢業後的25到28歲,開始在意存款;到了29、30歲,煩惱如泉湧,從婚姻、轉職、薪水、存款到健康檢查……一連串議題,多到連表格都寫不下。

「30歲最痛苦,煩惱一堆」,資策會數位服務創新研究所副主任徐毓良,指著投影幕上的數據感慨說道。

這是公共電視迷你劇集《大債時代》劇本設定的輔助數據資料,也是資策會服創所團隊繼金鐘獎台劇《我們與惡的距離》後,第二度與公視合作,以大數據分析協作劇本開發。

探討青年負債議題的《大債時代》,由張書豪、林柏宏、李霈瑜(大霈)主演,三人飾演高中死黨,畢業後各奔前程,分別成為公司負責人、斜槓創業家與銀行債務催收員。但32歲那年,張書豪跳樓輕生,兩位好友替張書豪解決所留鉅額債務的同時,也得各自面對沉重的生活壓力。

探討青年負債議題的《大債時代》,由李霈瑜(左)、林柏宏(中)主演,兩人協助已故好友的遺孀解決債務問題。(圖片提供:公視)

徐毓良回憶2019年,自己與《大債時代》製作人方夢貞初次開會,對方滿腹疑惑地問:「年輕人到底關心什麼?我們筆下的年輕人可以代表整個世代嗎?」

《大債時代》故事發想,源於方夢貞觀察身邊許多年輕人,一畢業就負債,生活過得苦,便以青年學貸問題作核心,寫出故事大綱與一集劇本後,成功通過公視劇集徵選。

用力拍電影公司監製方夢貞,觀察身邊年輕人一畢業就背債,動念創作《大債時代》。(攝影:徐肇昌)

只不過方夢貞與編劇團隊在撰寫劇本階段就遇到瓶頸。方夢貞表示,主角群原本設定為25、26歲的社會新鮮人,除了買不起房子、積欠卡債之外,上班的公司也出現掏空弊案。面對種種問題,有人選擇逃避、甚至沉迷毒品。

故事編排愈加豐富之際,方夢貞卻發現劇情矛盾叢生,更不知從何處修改。所幸在公視搭橋之下,《大債時代》編劇團隊找上資策會服創所,期盼利用大數據替劇本設定「除蟲」,驗證是否貼合現實。

編劇的大數據門診 處方來自PTT

「年輕人碰到債會躲起來嗎?」「買毒品的年齡層?在哪買?」「年輕人最常見的債務是什麼?」「30歲受薪階級的平均月薪是多少?」「企業掏空案到底要掏要多少錢才算多?」「黑道討債和銀行債權管理的差異?」

一如有著十萬個為什麼,方夢貞形容與資策會合作的過程,就像跟醫生定期門診,只是處方來自扎實的數據資料。

《大債時代》製作人方夢貞在劇本創作期間數度遇到瓶頸,一直擔心劇中角色是否能代表這個世代的年輕人。(攝影:徐肇昌)

徐毓良指出,《大債時代》與《我們與惡的距離》兩者提出的數據輔助需求不同,前者已有故事大綱和人物設定架構,後者則是在「無差別殺人事件」主題的資訊海中,撈出劇本線索。

徐毓良認為合作的方向很明確,就是回答方夢貞提出的問題,並判斷劇本可能需要的數據內容,分類後,再利用文字探勘的方式取得資料。

首先當然是以「債」、「年輕世代」相關內容為關鍵字,從PTT(批踢踢實業坊)、臉書、新聞網站、網路論壇,挑選出網友評論度、分享轉貼數量高的文章,搜集符合主題及需求的內容。同時,也就不同個案問題爬梳法院判決書,甚或是外送的菜單。

徐毓良指出,藉由PTT上的資訊,很容易就可找到各職業的個案。「30歲左右的人,會在職涯版分享工作經驗和過程。」團隊就從中找到銀行、行銷、高科技等各行業的年輕人個案,觀察他們對於生活、薪水、職場、房貸等看法與抱怨,或覺得哪些工作比較好賺錢。

資策會服創所副主任徐毓良利用大數據,協助《大債時代》開發劇本。(攝影:裴禛)

鑑於《我們與惡的距離》資料過於龐雜,導致編劇呂蒔媛難以消化,徐毓良面對《大債時代》,將上萬筆資料刪減、統整成100筆,再轉譯成方夢貞團隊能理解閱讀的形式:例如文字雲、表格、關鍵字等,同時也將資料匯集成小型資料庫,供編劇日後查詢參考。

徐毓良的團隊以「債」為關鍵字,從社群平台、PTT搜集相關數據,消化分析,最終化成易於運用的文字雲。(攝影:裴禛)

大數據反覆驗證 戲劇縮影現實人生

經歷4個月反覆驗證,方夢貞與《大債時代》編劇團隊藉由大數據資料,調整故事情節與人物設定。她苦笑:「來回修改的過程是辛苦的,但改完後就不會心虛虛的,確實符合現狀」。

《大債時代》人物設定,隨著大數據資料調整,以期更貼近觀眾生活。像是林柏宏的角色,從揭發公司弊案的員工,變成斜槓創業家兼YouTuber。(圖片提供:公視)

方夢貞透露,原本規劃林柏宏的角色是要揭發公司的掏空弊案,但經由數據考證才驚覺,這是公司少數人才可能接觸的案件。「20多歲的人,不論職等或資歷都不大可能接觸到這麼機密的事,況且大部分年輕人連租房、買房都有困難,甚至吃飽都成問題,更在意尋找自我價值的認同。」最後,只好將這條支線刪除。

另一條放棄的劇情線,是「年輕上班族因壓力吸毒」。徐毓良分享,團隊爬梳500多篇法院判決書和文獻,發這個年齡層根本不大會接觸毒品。「20、30歲這群人,生活壓力都喘不過來,根本沒錢買毒品,經濟寬裕的中年人與家庭富裕的孩子,反而才是主要使用者。」

方夢貞分享,編劇團隊除了刪除不合現實的設定,也從數據中找到先前未注意的職業,掌握年輕人在意的趨勢,從而豐富了劇中角色的內容。(攝影:徐肇昌)

編劇團隊刪除不符現實的劇情之外,也藉由數據增添人物角色豐富度:例如主角年齡提高了5歲,變成30多歲。方夢貞解釋:「剛畢業的新鮮人,面臨的壓力還沒那麼明顯,大概工作8、9年有些存款後,家裡與社會對你比較有期待,而30歲世代就是被夾在中間,最痛苦的那一層。」

徐毓良團隊在PTT利用自動索引程式「爬蟲」發現的「銀行債權催收員」一職,最終也成為了女主角的職業。劇本原先設定女主角是公務員,為賺錢買房兼職家教,與「債」的距離較遠,沒想到後來發現,在民間貸款機構與非法討債集團之外,還有銀行債權管理部門這樣的催收工作。

為了讓女主角李霈瑜(左)飾演的詠晴跟「債」更有連結性,編劇團隊將她的職業從公務員,改為數據資料中發現的「銀行債權催收員」。(圖片提供:公視)

在編劇把女主角年齡拉高,變成銀行債權管理部門的小主管後,副業也改為時下流行的外送員,讓工作性質和內容更符合劇情走向,角色更加立體。

徐毓良指出,大數據並非左右編劇創作,反而是個輔助,幫助編劇找出田野調查過程被遺漏、未被看見的資訊。方夢貞也附議,「數據是趨勢,田調是細節」,兩者相輔相成,提升了編劇設定劇本大方向的效率,也撈出有趣的趨勢議題。

橫跨機器與編劇語言 徐毓良讀數據定乾坤

《大債時代》播出後,許多觀眾都說在戲裡看到了自己與親友:「99%的我們都是詠晴,即使房價再高、也要硬咬著牙買房。」「大債時代就是目前年輕人的縮影。」

方夢貞在宣傳《大債時代》時,也特別感謝徐毓良團隊的協助,讓劇本真實呈現當代青年面對生存困境的無奈,講出新世代心聲。

攤開4個月的合作過程,其實《大債時代》與資策會團隊僅開了7次會。這意味必須在短期內精準理解、回應劇組的問題。方夢貞本來得知要與資策會共事時,擔心雙方會有溝通障礙,「沒想到他們對影視術語不陌生,還會舉出歐美劇中的類似情節跟我們分享」。

徐毓良強調與編劇溝通最重要的關鍵,就是「聽懂客戶問題」,否則電腦技術再強,也無法解決客戶需求。(攝影:裴禛)

徐毓良笑言自己做的事,就是簡單三步驟:聽懂客戶問題;翻譯給機器;最後再把機器產出的結果,轉譯回客戶。「如果聽不懂客戶需求,有再高的技術、再強的敏銳度都沒用,解決問題才是關鍵。」

但是這翻譯機的建立,可不簡單!

徐毓良在2016年結束《我們與惡的距離》的合作之後,投入2年時間,以實驗性質免費與影視工作者合作,除了精進數據技術,也學習瞭解編劇到底需要什麼,編劇是如何思考,熱心的編劇友人,還替徐毓良開了一長串書單。

「全部都看完了,但沒有看很細啦!」徐毓良的辦公桌放滿密密麻麻的參考書,從創作經典《場景設定創意辭海》、《故事的解剖》、《暢銷書密碼》,到沒書皮、被拆成方便攜帶的無名書。

為理解編劇的思考邏輯,徐毓良資策會的辦公桌放滿參考書。他笑說:「還有很多被同事借走了。」(攝影:裴禛)

與編劇溝通之路沒有捷徑,只有涓滴累積。尤其資策會執行劇本開發的團隊,包含徐毓良在內,僅有3個人,偶爾加個0.5,請工程師協助「爬蟲」。徐毓良坦言,沒有政府的專案支持下,單仰賴大數據協助劇本開發,無法養活整個部門。「太新的事情,要人掏錢不容易。」

萬般設定起頭難 照世明燈大數據

目前徐毓良的團隊,有5、6個案子正在進行,從剖析年輕女性的感情觀、年輕人大學畢業後的出路,掌握世代價值觀差異、協助國外IP轉化成本土共感元素,還有運用司法文本與社群數據找到犯罪手法,驗證背景設定等等。

徐毓良認為,在許許多多的戲劇類型中,大數據最能提供協助的有兩種:一是「有開放資料文本的」,二是「劇情觀點多元且混亂的」,像《我們與惡的距離》就是在探討社會對隨機殺人事件的不同觀感。

《我們與惡的距離》是徐毓良首部以大數據開發劇本的案子,過去沒人知道他在做什麼,直到劇紅了,才陸續有劇組上門詢問。(《我們與惡的距離》翻攝臉書)

徐毓良指出,每個人看資料,下意識只會看喜歡的東西,自動過濾不熟悉的內容,「尤其政治特別明顯,綠的就喜歡看綠的,藍的喜歡看藍,看到另一黨就會生氣,可是事實應是把藍綠白拼起來後,中間那塊才較接近真實,而我們就是試圖還原。」

不過大數據也非萬能,「有數據是基礎,數據量夠大才是大數據」,徐毓良解釋,像刻畫台灣工地百態的《做工的人》,或以消防員為主題的《火神的眼淚》,這類網路資料量較少的職業,還是得仰賴編劇的田野調查與實際探訪職場職人。

《做工的人》改編自林立青著作,是台灣首部以大型工地實景拍攝的工人題材影集。(圖片提供:大慕影藝)
5月將播出的職人劇《火神的眼淚》,刻畫消防員的工作、家庭百態。(圖片提供:公視)

大數據對於歷史、神怪題材,也較難提供協助。徐毓良分享,曾有人想請他協助調查國共內戰後,被國民黨留下或被帶回台灣的華僑老兵資料,想寫成劇本,但徐毓良只能婉拒。「你在Google查到的內容,就是我能做的,這比較適合問歷史、民俗專家」。

但徐毓良特別想打破一個迷思,不是只有「寫實劇」能用大數據輔助,「科幻」類型也是有所助益,「我可以做出未來年表」。

2002年,由湯姆克魯斯主演的電影《關鍵報告》(Minority Report)中,未來世界的警察已可透過犯罪預示系統,事先埋伏、逮捕嫌犯。片中展現的擴增實境(AR)、觸控螢幕、電子紙到無人車等,已經出現在我們生活周遭。

徐毓良指出,藉由政府法規以及科學雜誌等數據,替劇組寫出「未來年表」不是不可能。(攝影:裴禛)

徐毓良表示,只要從各國政府法規以及科學雜誌、年鑑等各種資料,就能推敲出從哪年起全世界都是電動車,或者量子電腦何時可出現,這些或許能成為預言神準的科幻作品。

說到底,徐毓良目前的成績,歸功於資策會服務14年所累積的專案經驗,再加上自己一顆旺盛的好奇心。所有人丟出來的劇情問題,對他來說都是充實自己的題庫,也惟有如此,才能繼續當編劇導演們的「徐」伯溫,以資料庫為影視產業卜一個未來。

要數據還是編劇 準確與套路的兩難

大數據能完全取代編劇嗎?

2015年成立的比利時人工智慧公司ScriptBook,專攻劇本分析。只要上傳劇本至ScriptBook系統,6分鐘內就能完成分析、獲得詳細數據,包含角色魅力量表、目標族群預測、觀眾滿意度指數等。ScriptBook也曾用演算法預測過去兩年上映電影的國際票房收益,準確率高達86%,相當驚人。

專攻劇本分析的比利時人工智慧公司ScriptBook,只要上傳劇本至他們的系統,6分鐘內就能完成分析、獲得詳細數據。(ScriptBook 官網截圖)

ScriptBook另一階段的目標是故事自動生成,在內建30萬份劇本資料的寫作系統中,編劇只需輸入關鍵字與主題,選擇長度並選定角色特徵,系統就會填補剩下空白。他們認為人類與AI共同寫作,未來將成常態。

早在4、5年前,中國影視圈也已利用大數據分析,整合影視劇、演藝人員資訊,預測市場反應,協助資方利用AI選擇演員,預測選角組合對票房的影響。

徐毓良笑言,在中國工作的編劇友人曾告訴他,每個人電腦都有一個劇本分析器,稿子寫完,就丟進去驗證哪些地方需要加強,才能成為「爆款劇」。「但我朋友就不願意,因為劇本就會長得很套路。」

嘲諷這種套路,也被中國玩成另類自娛。

「資深遊戲玩家老張意外穿越到自己玩了10年的『武林爭霸』遊戲世界中,從此擁有所向披靡的強大力量,但他在穿越之初,就因誤會成為武林公敵,隨之而來的是一連串的圍剿和陰謀……」

以上內容,是由中國數據視覺化團隊DATAMUSE開發的自動劇本生成器「國產爛劇製造廠」所產製的內容,只要選取故事類型,輸入兩位主角名字,就能即時生成劇情介紹。

中國數據視覺化團隊DATAMUSE開發的自動劇本生成器「國產爛劇製造廠」中,只要選取故事類型,輸入兩位主角名字,就能即時生成劇情介紹。(DATAMUSE自動劇本生成器 頁面截圖)

DATAMUSE表示,自動劇本生成器的製作初衷,是在思考為何中國拍攝技術越來越好時,低分國產劇卻越來越多。他們爬梳6000多部中國戲劇作品,從導演、劇情、演員多角度挖掘數據規律,設計出這個自動劇本生成器。

DATAMUSE感慨,當編劇想推展劇情時,就喜歡以「昏迷、搬家、出軌、流產和精神病等橋段,反覆填充」,這意味著編劇缺乏想像力。

藍色數據海  我想要一個未來

《大債時代》是方夢貞首部利用大數據開發的作品,雙方合作愉快,也替劇組扣緊時事議題。(攝影:徐肇昌)

數據的科技藍海,投影在方夢貞工作室的白牆上,她站在牆前,程式語言交織在臉上。

《大債時代》是方夢貞首部利用大數據開發的作品,合作經驗愉快,也替劇組扣緊時事議題。徐毓良團隊既是觀眾又是數據分析者,能客觀提供意見,也能精簡資訊,「光從1、2萬筆資料,變成100、200筆,閱讀量直接少100倍。」

方夢貞坦言,過去創作像土法煉鋼,沒有科技協助,寫劇本找演員全靠「直覺跟猜」,雖然盡力閱讀相關報導與案例,最終主創團隊只能以經驗值輔助,嗅出時下議題或趨勢。

但是把作品丟回市場,能不能引起觀眾共鳴?方夢貞笑回:「跟判斷一個人會不會紅一樣,這個行業都帶著一點點賭的成分。」就像當初劇組選擇林柏宏飾演創業屢次失敗、油而卻不令人厭的楊大器。

「柏宏一坐下來,聊沒多久,聽他講小時候爸媽做生意、到處賣東西的故事。角色身上那亟欲成功,賺錢讓家裡過好生活的心情,他完全理解。那是我從沒聽過的柏宏,那時我就在他身上看到大器的影子。」

或許這就是大數據無法看到的細節,方夢貞幽默地聳聳肩,「但你可以用數據知道,6成觀眾都覺得這個人很帥,那紅的機率確實比較高。」

對於大數據與影視的關係,方夢貞既樂觀也保守,雖不否認大數據可能扼殺創意,但若有機會再使用大數據分析、開發劇本,會以輔助形式來尋找線索或驗證疑問。

不過方夢貞認為,全然依賴大數據會有些可惜,因為戲劇動人之處,就是因為外於常人的生活。(攝影:徐肇昌)

「若全然依賴大數據,我會覺得有些可惜,有些戲劇能打動人、吸引人,是因為它超乎一般人的生活。如果只看一般人注意的,就不會看到有趣的點。」方夢貞眼裡閃著光,或許也有那麼幾部電影、戲劇,是帶著觀眾的想像,飛到更遙遠之處。

大數據是能幫你快速抓住大方向、推你一把。不過更遠的路,或許情感、直覺、創意更是有用。方夢貞調皮的說:「連大方向都抓不到,再多小細節都沒有用啦!」

主題照:資策會服創所副主任徐毓良利用Google關鍵字,協助《大債時代》劇組了解20到30歲青年的苦惱,加深劇本與觀眾的共鳴。(攝影:裴禛)
聯絡我們
services@mail.cna.com.tw
地址:台北市松江路209號
客服專線:0800-256-688