在第四次工業(yè)革命中,人工智能(AI)、5G、6G和機(jī)器人等下一代技術(shù),一直在各個(gè)方面加速對(duì)人們?nèi)粘I畹母淖,包括交通、金融甚至健身領(lǐng)域。
三星很早就意識(shí)到先進(jìn)技術(shù)的重要性,并一直在這些領(lǐng)域積極創(chuàng)新。為更好迎接未來(lái)挑戰(zhàn),三星研究院14個(gè)研發(fā)中心和7個(gè)全球AI中心的專(zhuān)家級(jí)研發(fā)人員正努力工作,開(kāi)創(chuàng)下一代技術(shù)和服務(wù),為用戶(hù)帶來(lái)創(chuàng)新體驗(yàn)。
今天我們一起走進(jìn)三星烏克蘭研發(fā)中心(SRK)的視覺(jué)智能團(tuán)隊(duì),來(lái)看看他們開(kāi)展的開(kāi)創(chuàng)性工作有哪些。
01關(guān)于三星烏克蘭研發(fā)中心
自2009年成立以來(lái),SRK一直專(zhuān)注于人工智能(AI)、增強(qiáng)現(xiàn)實(shí)(AR)/虛擬現(xiàn)實(shí)(VR)和安全領(lǐng)域,并擁有深厚的專(zhuān)業(yè)知識(shí)。SRK由杰出的行業(yè)專(zhuān)家組成,目前致力于智能安全、計(jì)算機(jī)視覺(jué)、情境感知智能服務(wù)等方面的研究。此外,作為產(chǎn)學(xué)合作計(jì)劃的一部分,SRK積極與當(dāng)?shù)馗咝:蛯W(xué)校開(kāi)展合作。
02視覺(jué)智能團(tuán)隊(duì)目前正在開(kāi)展什么工作?
目前,SRK正在進(jìn)行人工智能、計(jì)算機(jī)視覺(jué)和計(jì)算機(jī)圖形領(lǐng)域的基礎(chǔ)研究,主要任務(wù)是將研究進(jìn)展轉(zhuǎn)化為整體用戶(hù)體驗(yàn),提升人們的生活質(zhì)量,簡(jiǎn)化其日常工作,并提供積極的情感和沉浸式體驗(yàn)。
為此,我們正與其他國(guó)家的各類(lèi)團(tuán)隊(duì)密切合作,在重點(diǎn)領(lǐng)域開(kāi)展前沿研究,并與不同的業(yè)務(wù)部門(mén)合作,將核心技術(shù)應(yīng)用在各類(lèi)三星產(chǎn)品上。
03如何將所關(guān)注領(lǐng)域的關(guān)鍵技術(shù)融入項(xiàng)目中?
用AR眼鏡舉例,SRK正著手前沿研發(fā),以解決AR眼鏡在計(jì)算機(jī)視覺(jué)和圖形領(lǐng)域所面臨的主要挑戰(zhàn)。在視覺(jué)方面,我們正研究AR所需的基本解決方案,包括同步定位和映射(SLAM)、深度估計(jì)、環(huán)境理解和人機(jī)交互(HCI)。在圖形方面,我們正研究用于AR和游戲性能優(yōu)化的低延遲渲染。
▲ 三星烏克蘭研究中心視覺(jué)智能團(tuán)隊(duì)
04S Pen技術(shù)研發(fā)背景是怎樣?
我們的重點(diǎn)研發(fā)領(lǐng)域和核心解決方案之一,是支持S Pen設(shè)備的手寫(xiě)識(shí)別技術(shù),它已被應(yīng)用并拓展至Galaxy系列產(chǎn)品。在研究手寫(xiě)識(shí)別解決方案的同時(shí),我們還獲得了豐富的專(zhuān)利組合,從而為三星的核心技術(shù)開(kāi)發(fā)做出了貢獻(xiàn)。
05將在哪些方面豐富用戶(hù)的設(shè)備體驗(yàn)?
Samsung Galaxy Z Fold3是一款非常獨(dú)特的產(chǎn)品。它的顯示屏大而靈活,拓寬了視野,開(kāi)辟了新的用戶(hù)體驗(yàn),成為人們?cè)谏虅?wù)和教育方面真正具有生產(chǎn)力的“伴侶”。在這兩種使用場(chǎng)景下,S Pen和手寫(xiě)識(shí)別以及低延遲變得至關(guān)重要,我們希望在數(shù)字屏幕上也能提供類(lèi)似于筆在紙上書(shū)寫(xiě)的體驗(yàn)。
06那又是如何提升用戶(hù)的生活質(zhì)量呢?
我們采用了基于AI的點(diǎn)預(yù)測(cè)解決方案,以盡可能減少S Pen的輸入延遲,從而使書(shū)寫(xiě)、繪畫(huà)體驗(yàn)更像紙和筆的感覺(jué)。此外,手寫(xiě)識(shí)別技術(shù)讓書(shū)寫(xiě)更智能、更輕松、更有趣。用戶(hù)可將筆記內(nèi)容轉(zhuǎn)化為打印文件、表格、圖標(biāo)、插入鏈接解決數(shù)學(xué)問(wèn)題等等,操作比以往更簡(jiǎn)單。
07您認(rèn)為當(dāng)前技術(shù)發(fā)展的趨勢(shì)是什么?
現(xiàn)在,我們認(rèn)識(shí)到視覺(jué)模態(tài)(Visual Modality)是未來(lái)趨勢(shì):如何將筆記轉(zhuǎn)化為智能筆記,如何將視頻制作為智能視頻,以及我們能從這些過(guò)程中提取多少有用的上下文信息。對(duì)于視覺(jué)模態(tài),AR技術(shù)為我們提供了諸多可能性的同時(shí),還有許多亟待解決的問(wèn)題。比如“數(shù)字眼睛(Digital Eyes)”,能為用戶(hù)全面探索環(huán)境,并提供組織良好的上下文信息,可徹底改變我們的生活。
另一個(gè)技術(shù)發(fā)展趨勢(shì)則是人機(jī)交互(HCI)。我們認(rèn)為,作為人機(jī)交互關(guān)鍵部分的多模態(tài)交互將是必不可少的。多模態(tài)交互是用戶(hù)與機(jī)器的互動(dòng),它囊括了視覺(jué)、語(yǔ)言和知識(shí),可幫助三星設(shè)備理解其所處的世界。
08
與語(yǔ)言相關(guān)的技術(shù)對(duì)創(chuàng)新體驗(yàn)做出了哪些貢獻(xiàn)?
自然語(yǔ)言處理(NLP)是極具挑戰(zhàn)性的研究領(lǐng)域之一。我們真誠(chéng)希望全球每個(gè)人都能使用和體驗(yàn)到我們的解決方案,想要實(shí)現(xiàn)這一目標(biāo),語(yǔ)言的擴(kuò)展和支持至關(guān)重要。在S Pen手寫(xiě)識(shí)別方面,我們正不斷努力擴(kuò)大語(yǔ)言覆蓋面。目前,我們已支持超過(guò)80種語(yǔ)言,更多語(yǔ)言也正在開(kāi)發(fā)中。
觸屏版電腦版