感謝IC之音採訪

生活中少不了「搜尋」這件事情,每天要做什麼事情之前,可能先上網搜尋一下,看看要買的東西、要去的地方、各式各樣的資訊,在過去的習慣裡搜尋是文字式,但隨著技術的進步,影像辨識將成為下一代搜索方式,除了幫助找尋資料,其在未來的商務方面有非常多應用的可能性,到底它有哪些未來的想像呢?很高興邀請到創意引晴的創新策略長Polo來聊聊,未來影像辨識在商務上的應用。
Q:創意引晴最近受到從中國、新加坡、南韓等海外的技術肯定,影像在未來數位環境中將會是一個非常重要的元素,請Polo來聊聊從過去的廣告行銷到數位化環境裡,怎麼看待未來影像的發展潛力?

A:在搜尋的部分,從最早的文字搜尋,到Apple推出Siri或是Google的影音搜尋等技術,我們很關注於未來搜尋的下一步會是什麼?像行動上網、智慧型手機的開始普及,消費者拿手機拍照已經變成很正常的事情,甚至拿手機拍照的時間比講電話的時間還要久。在影像這塊,過去很早就有人在研究這方面,一直到最近智慧型裝置的蓬勃興起與普及後,手機的計算能力、鏡頭的解析度都開始提升,影像的技術才開始被注意到。過去在行動行銷這塊,通常是拍QRcode、上網搜尋等等,我們認為未來「透過影像辨識來搜尋」這件事情會越來越普及。另外,現代人生活在電視、平板、電腦、手機等多螢幕當中,然而什麼樣的東西可以貫穿這些不同的平台?在商務上或行銷上的應用,可以達到另一個新的境界,這也是我們目前專注的方向。

Q:國外的大型網路公司對於影像有不同的途徑,有些從製作影音內容的方式,或者有些會買一些影像的平台,就像很多網友說的:有圖有真相。視覺這件事情絕對會在未來商務應用環境裡有很大的可能性。從台灣的環境來看,好像電商是一個比較熱門的話題,那影像辨識跟電商會能產生什麼樣的火花呢?

A:電商確實最近在台灣很夯,每個品牌都要做電商,每個店商都要做跨境,無處不電商,我們在台灣也跟很多的電商有合作,當消費者在實體通路看到一件喜歡商品時,都會想立刻拿出手機查查看網路上的價格,這樣的情境也是我們目前提供的一項服務之一,只要消費者拿起手機拍照商品,就會顯示出這件商品在不同的網路商城或電商的價格是多少,提供一個快速的比價查價功能。或者是說你在書店裡看到一本書,你很想知道作者、內容及網路上的評價如何,也可以透過手機拍照書的封面,來得知這本書的相關背景資訊。我們希望可以培養消費者的一個買東西之前先拍照比價或查詢更多資料的習慣。

Q:我想到另一個情境可能是出國買東西時,很容易失心瘋,但如果透過這個比價查詢的方式,可能就會發現在當地買並沒有比較便宜,這的確有很多應用的可能性,而創意引晴不僅在電商,是否還有其他的應用可能性可以分享?

A:影像辨識其實是透過圖形的特徵值辨識來比對,然後了解這個圖背後的意涵是什麼,之前我們也幫很多的文物展、書法展或是博物館的展覽做影像辨識的服務。尤其像書法展,許多人可能會看不懂甲骨文寫的到底是什麼意思,我們的技術就可以去辨識這些書畫也可以帶出其背後的意涵;比方說外國人來看中國的傳統文化時,他們不能夠理解,我們就可透過影像辨識的方式把藝術品轉換成文字或語音,讓參觀者更方便理解。

之前我們做過一個很有趣的應用,當外國人來到台灣走到士林夜市時想點一盤蚵仔煎,但是他可能不知道英文該怎麼說,我們的技術就去辨識夜市的招牌和菜單,然後翻譯成英文甚至發音出來,告訴外國旅客說這個中文該怎麼講。

最近還有個案子是我們和智慧眼鏡的廠商合作,在展覽中帶上智慧眼鏡,走到作品前利用影像辨識的技術就可以知道這件作品的歷史背景介紹,所以影像辨識也可以應用在類似的導覽情境上。

Q:不論在電商或展覽,影像辨識都有很多應用的情境,講到電商,相對來講在台灣很活躍,目前看起來是2B應用較多,但是未來很大的市場應該是在2C地應用。請聊一聊創意引晴在2C的部分好像也在中國大陸開始嘗試一些不一樣的做法?

A:是的,2C的部分目前我們在中國大陸有微信上的帳號,目的是讓消費者透過微信去體驗拍照搜尋或影像辨識這樣的技術,我們也做了許多測試及消費者體驗,比方說我們會出題目和消費大眾做互動,像是請問你現在用什麼牌子的面膜?然後使用者可以把面膜拍照上傳,看我們的系統是否能辨識出來,這樣的作法其實有兩個目的:第一個我們希望蒐集更多的影像,要保持後端的辨識率需要大量的圖資;第二個我們希望了解消費者平常在使用影像辨識或拍照辨識時,他們的消費者行為或是consumer insight等等,讓後端的工程師可以去調整,更符合消費者需求,也提升影像辨識的精準度。

這背後其實是一個有點類似人工智慧的大引擎,每天不斷搜尋世界上各種商品的影像,希望提升辨識率,也期望在未來影像辨識可以成為人類的替代眼睛,比方說機器人技術中,是否看得見很重要,看的見還不算什麼,重點是看見並理解這個東西是什麼物件,未來有很多的可能性。
目前在大陸的部份,我們會已針對一般消費者的應用情境為主,也希望透過2C的平台知道消費者每天看到什麼東西、喜歡什麼東西,蒐集越多的消費者資料也對影像辨識的未來辨識率及精準度將有大幅度的提升。

Q:我們很好奇要怎麼達到辨識成功?是搭配了什麼樣的技術可以讓辨識的準確率提高?

A:我們有幾個專利技術,包含辨識產品的形狀、顏色、文字、或者是影像上的特徵點,尤其是美妝品有外盒內盒,這些都要建在影像資料庫裡面。那如何在龐大的資料庫裡快速的找到或是要正確地辨識,背後有我們的專利演算法幫產品做分類,找到相對應的商品或相似的商品,帶出影像搜尋的結果。

Q:台灣在這方面的技術上還蠻受到肯定,我們也看到創意引晴在許多比賽中獲獎,請介紹一下創意引晴為什麼會想要切入這一塊市場?是有什麼特別的機緣?台灣做這塊有特別優勢嗎?

A:其實也是誤打誤撞,當年推出了文字辨識以及剛剛所提的夜市招牌辨識,我們發現其實影像辨識的領域很有趣,持續鑽研下去後發現這裡面的技術非常的深,牽扯到大運算、大數據、大資料的部分,我們開始去找一些教授並鑽研技術希望有所突破,隨著行動裝置的運算能力提升,我們在技術上也有突破性的發展。但是通常在做影像辨識都是很大的公司如Google 、Microsoft,台灣在這塊上的規模很難競爭,但是我們在專利技術上或影像辨識的關鍵技術上,尤其是辨識速度,是完全可以和主流的廠商來競爭的,這也是很多客戶選擇我們的原因。比方說在辨識日本雜誌型錄時,對方要8秒我們只需0.5秒,我們會在各個不同的面向上去不斷優化,持續有好的技術保持競爭優勢。

Q:如之前創辦人黃俊傑先生所說,影像辨識裡的技術難度很高,我們知道Google Glass很重要的一部份也在影像辨識上的技術處理,對於台灣的業者來說也是卡到一個蠻好的位置。想請教Polo你們自己怎麼看在未來這塊商業模式的可能性?

A:以目前來講,剛剛提到說電商的應用範圍很廣,在未來我們希望能切入物聯網IOT的領域。舉例來講,如果有一天你的電冰箱智慧化了而且有鏡頭,它或許就能告訴使用者冰箱裡可能有番茄和蛋,並且可以組合出什麼樣的食譜比如番茄炒蛋,那如果沒有蛋的話冰箱也可以幫你訂購,也許三小時後送到家中,下班回家時就可以來做番茄炒蛋。

在物聯網的應用範圍還很廣,還有智慧型家電、智慧型機器人,影像辨識都是後面重要的一項關鍵技術,我們也在積極地往這方面發展,希望有一天影像辨識能夠幫助人的眼睛取代文字或是語音搜尋的技術,成為一種新的服務。

就如Polo所講,冰箱中的辨識應用場景對職業婦女應該是個期待,像最近的電影《大英雄天團》中的杯麵機器人,它也能夠透過辨識去了解人體的健康跡象。創意引晴非常積極努力在各種影像辨識的應用及技術上,也非常歡迎任何對這方面有興趣的合作提案,讓台灣的技術被世界看到。