感谢IC之音采访

生活中少不了「搜寻」这件事情,每天要做什麽事情之前,可能先上网搜寻一下,看看要买的东西丶要去的地方丶各式各样的资讯,在过去的习惯里搜寻是文字式,但随着技术的进步,影像辨识将成为下一代搜索方式,除了帮助找寻资料,其在未来的商务方面有非常多应用的可能性,到底它有哪些未来的想像呢?很高兴邀请到创意引晴的创新策略长Polo来聊聊,未来影像辨识在商务上的应用。
Q:创意引晴最近受到从中国丶新加坡丶南韩等海外的技术肯定,影像在未来数位环境中将会是一个非常重要的元素,请Polo来聊聊从过去的广告行销到数位化环境里,怎麽看待未来影像的发展潜力?

A:在搜寻的部分,从最早的文字搜寻,到Apple推出Siri或是Google的影音搜寻等技术,我们很关注於未来搜寻的下一步会是什麽?像行动上网丶智慧型手机的开始普及,消费者拿手机拍照已经变成很正常的事情,甚至拿手机拍照的时间比讲电话的时间还要久。在影像这块,过去很早就有人在研究这方面,一直到最近智慧型装置的蓬勃兴起与普及後,手机的计算能力丶镜头的解析度都开始提升,影像的技术才开始被注意到。过去在行动行销这块,通常是拍QRcode丶上网搜寻等等,我们认为未来「透过影像辨识来搜寻」这件事情会越来越普及。另外,现代人生活在电视丶平板丶电脑丶手机等多萤幕当中,然而什麽样的东西可以贯穿这些不同的平台?在商务上或行销上的应用,可以达到另一个新的境界,这也是我们目前专注的方向。

Q:国外的大型网路公司对於影像有不同的途径,有些从制作影音内容的方式,或者有些会买一些影像的平台,就像很多网友说的:有图有真相。视觉这件事情绝对会在未来商务应用环境里有很大的可能性。从台湾的环境来看,好像电商是一个比较热门的话题,那影像辨识跟电商会能产生什麽样的火花呢?

A:电商确实最近在台湾很夯,每个品牌都要做电商,每个店商都要做跨境,无处不电商,我们在台湾也跟很多的电商有合作,当消费者在实体通路看到一件喜欢商品时,都会想立刻拿出手机查查看网路上的价格,这样的情境也是我们目前提供的一项服务之一,只要消费者拿起手机拍照商品,就会显示出这件商品在不同的网路商城或电商的价格是多少,提供一个快速的比价查价功能。或者是说你在书店里看到一本书,你很想知道作者丶内容及网路上的评价如何,也可以透过手机拍照书的封面,来得知这本书的相关背景资讯。我们希望可以培养消费者的一个买东西之前先拍照比价或查询更多资料的习惯

Q:我想到另一个情境可能是出国买东西时,很容易失心疯,但如果透过这个比价查询的方式,可能就会发现在当地买并没有比较便宜,这的确有很多应用的可能性,而创意引晴不仅在电商,是否还有其他的应用可能性可以分享?

A:影像辨识其实是透过图形的特徵值辨识来比对,然後了解这个图背後的意涵是什麽,之前我们也帮很多的文物展丶书法展或是博物馆的展览做影像辨识的服务。尤其像书法展,许多人可能会看不懂甲骨文写的到底是什麽意思,我们的技术就可以去辨识这些书画也可以带出其背後的意涵;比方说外国人来看中国的传统文化时,他们不能够理解,我们就可透过影像辨识的方式把艺术品转换成文字或语音,让参观者更方便理解。

之前我们做过一个很有趣的应用,当外国人来到台湾走到士林夜市时想点一盘蚵仔煎,但是他可能不知道英文该怎麽说,我们的技术就去辨识夜市的招牌和菜单,然後翻译成英文甚至发音出来,告诉外国旅客说这个中文该怎麽讲。

最近还有个案子是我们和智慧眼镜的厂商合作,在展览中带上智慧眼镜,走到作品前利用影像辨识的技术就可以知道这件作品的历史背景介绍,所以影像辨识也可以应用在类似的导览情境上。

Q:不论在电商或展览,影像辨识都有很多应用的情境,讲到电商,相对来讲在台湾很活跃,目前看起来是2B应用较多,但是未来很大的市场应该是在2C地应用。请聊一聊创意引晴在2C的部分好像也在中国大陆开始尝试一些不一样的做法

A:是的,2C的部分目前我们在中国大陆有微信上的帐号,目的是让消费者透过微信去体验拍照搜寻或影像辨识这样的技术,我们也做了许多测试及消费者体验,比方说我们会出题目和消费大众做互动,像是请问你现在用什麽牌子的面膜?然後使用者可以把面膜拍照上传,看我们的系统是否能辨识出来,这样的作法其实有两个目的:第一个我们希望搜集更多的影像,要保持後端的辨识率需要大量的图资;第二个我们希望了解消费者平常在使用影像辨识或拍照辨识时,他们的消费者行为或是consumer insight等等,让後端的工程师可以去调整,更符合消费者需求,也提升影像辨识的精准度

这背後其实是一个有点类似人工智慧的大引擎,每天不断搜寻世界上各种商品的影像,希望提升辨识率,也期望在未来影像辨识可以成为人类的替代眼睛,比方说机器人技术中,是否看得见很重要,看的见还不算什麽,重点是看见并理解这个东西是什麽物件,未来有很多的可能性。
目前在大陆的部份,我们会已针对一般消费者的应用情境为主,也希望透过2C的平台知道消费者每天看到什麽东西丶喜欢什麽东西,搜集越多的消费者资料也对影像辨识的未来辨识率及精准度将有大幅度的提升

Q:我们很好奇要怎麽达到辨识成功?是搭配了什麽样的技术可以让辨识的准确率提高?

A:我们有几个专利技术,包含辨识产品的形状丶颜色丶文字丶或者是影像上的特徵点,尤其是美妆品有外盒内盒,这些都要建在影像资料库里面。那如何在庞大的资料库里快速的找到或是要正确地辨识,背後有我们的专利演算法帮产品做分类,找到相对应的商品或相似的商品,带出影像搜寻的结果。

Q:台湾在这方面的技术上还蛮受到肯定,我们也看到创意引晴在许多比赛中获奖,请介绍一下创意引晴为什麽会想要切入这一块市场?是有什麽特别的机缘?台湾做这块有特别优势吗?

A:其实也是误打误撞,当年推出了文字辨识以及刚刚所提的夜市招牌辨识,我们发现其实影像辨识的领域很有趣,持续钻研下去後发现这里面的技术非常的深,牵扯到大运算丶大数据丶大资料的部分,我们开始去找一些教授并钻研技术希望有所突破,随着行动装置的运算能力提升,我们在技术上也有突破性的发展。但是通常在做影像辨识都是很大的公司如Google 丶Microsoft,台湾在这块上的规模很难竞争,但是我们在专利技术上或影像辨识的关键技术上,尤其是辨识速度,是完全可以和主流的厂商来竞争的,这也是很多客户选择我们的原因。比方说在辨识日本杂志型录时,对方要8秒我们只需0.5秒,我们会在各个不同的面向上去不断优化,持续有好的技术保持竞争优势。

Q:如之前创办人黄俊杰先生所说,影像辨识里的技术难度很高,我们知道Google Glass很重要的一部份也在影像辨识上的技术处理,对於台湾的业者来说也是卡到一个蛮好的位置。想请教Polo你们自己怎麽看在未来这块商业模式的可能性?

A:以目前来讲,刚刚提到说电商的应用范围很广,在未来我们希望能切入物联网IOT的领域。举例来讲,如果有一天你的电冰箱智慧化了而且有镜头,它或许就能告诉使用者冰箱里可能有番茄和蛋,并且可以组合出什麽样的食谱比如番茄炒蛋,那如果没有蛋的话冰箱也可以帮你订购,也许三小时後送到家中,下班回家时就可以来做番茄炒蛋。

在物联网的应用范围还很广,还有智慧型家电丶智慧型机器人,影像辨识都是後面重要的一项关键技术,我们也在积极地往这方面发展,希望有一天影像辨识能够帮助人的眼睛取代文字或是语音搜寻的技术,成为一种新的服务

就如Polo所讲,冰箱中的辨识应用场景对职业妇女应该是个期待,像最近的电影《大英雄天团》中的杯面机器人,它也能够透过辨识去了解人体的健康迹象。创意引晴非常积极努力在各种影像辨识的应用及技术上,也非常欢迎任何对这方面有兴趣的合作提案,让台湾的技术被世界看到。