不出戶，越四季，游四海｜vivo運用AI打造更懂用戶的人像技術(shù)

2023-08-01 20:11:04 來源: 騰訊網(wǎng)

不出戶，越四季，游四海｜vivo運用AI打造更懂用戶的人像技術(shù)

2020年，vivo牽手FIRST青年影展，到今年已是第四年，但這卻是我頭一次到現(xiàn)場感受這場別致的影展，真是大開眼界。特別令我開心的事情是，今年這屆影展的超短片單元，有近60%的作品是由手機完成，且最年輕的創(chuàng)作者只有14歲。我曾說過：“這是一個美好的時代，因為手機影像的普及，讓每個人都擁有揮灑自己創(chuàng)意的機會”，在這次影展上是實實在在感受到了。但作為消費電子行業(yè)的媒體人，對于本次影展的關(guān)注還是要落腳到7月30日下午的影像盛典特別活動，在這次活動上，vivo再次壯大了自己的影像技術(shù)矩陣……

(資料圖)

AIGC和人像技術(shù)的融合

今年FIRST青年影展的活動是從7月23日開始的，而本次vivo影像技術(shù)的特別活動早在7月18日就在重慶拉開了帷幕。在這一天，我頭一次來到了位于重慶南岸區(qū)的vivo智能工廠，vivo動（作）捕（捉）實驗室就在這里。這次行程對我來說還挺意外的，這家工廠布局于2014年，于2017年竣工投產(chǎn)，在vivo產(chǎn)品陣列中占據(jù)重要位置的S系列就在這里生產(chǎn)，但我怎么也沒想到vivo動捕實驗室居然坐落在廠區(qū)之中，一系列vivo面向未來的AI影像技術(shù)也在這里開發(fā)預(yù)研。

我們能看到的vivo動捕實驗室的具體形象，主要是由多達175臺單反相機（174臺負責(zé)影像捕捉，1臺用于監(jiān)控）和數(shù)十枚LED閃光燈組成的環(huán)形暗室，以及用于處理暗室捕捉信息處理、算力強大的服務(wù)器陣列組成。短短數(shù)秒的成像之后，再經(jīng)過40分鐘左右的建模運算，現(xiàn)實世界中的實體就能被數(shù)字化為3D模型，從而就可進行各種靈活的圖形處理。官方宣稱這套模型可以重建出“毛孔級”的高精度3D人體模型，可以支持在虛擬環(huán)境下實現(xiàn)極具真實感的渲染視效。現(xiàn)場有媒體老師自告奮勇參與了建模實驗，從最后呈現(xiàn)在大屏幕上的結(jié)果來看，“毛孔級”三個字的形容毫不夸張，尤其是面部、衣服等表面細節(jié)的保留非常全面。

除了這些能看到的內(nèi)容，在FIRST影展特別活動之后，與vivo影像副總裁于猛、vivo影像產(chǎn)品高級總監(jiān)李卓、vivo影像認知產(chǎn)品總經(jīng)理湯青良等藍廠高層的面對面交流中，于猛還提到了vivo動捕實驗室令人咋舌的“軟件”配置：這家實驗室是2022年，vivo與位于美國圣地亞哥的加州大學(xué)聯(lián)合建立的，同等形制配置的實驗室在大洋彼岸也有一套，都專注于AI和3D兩個層面技術(shù)的預(yù)研。位于重慶實驗室目前有100多人，學(xué)歷都偏博士向，規(guī)格非常高。

相信看到這里，很多朋友都非常疑惑：動捕實驗室那套東西如此龐大，3D建模時間又如此之長，其成果要如何轉(zhuǎn)化到小小的手機中？對比服務(wù)器陣營強悍的算力，手機芯片的算力又如何能保證實現(xiàn)的效果呢？這一點實驗室的工程師解釋得非常清楚，他們所做的工作，主要是為vivo儲備人臉、人體和手勢為核心的三大人像3D感知算法能力，實現(xiàn)對人臉面部表情、人體姿態(tài)動作以及手勢交互感知的精準捕捉和驅(qū)動。換言之，實驗室后最交付到手機軟件端的也會是一套適應(yīng)手機應(yīng)用場景的軟件模型，在手機芯片的算力驅(qū)動下，實現(xiàn)最接近實驗室的運行效果，套用那句經(jīng)典的廣告詞：實驗室“知其道”，手機終端“用其妙”。

人像3D感知能力之于vivo影像所擅長的人像賽道相當重要。比如vivo X系列手機后置影像模組人像模式中的蔡司鏡頭風(fēng)格模擬、虛擬景深等算法，就必須依賴人像3D感知算法的能力，同樣，S系列的前置自拍功能也需要這套算法的能力。特別是被我們稱為“死亡空洞”的小縫隙、發(fā)絲等弱紋理邊緣的摳像效果，過去總是不盡如人意，而vivo動捕實驗室給出的結(jié)果顯示，在其構(gòu)建的算法體系下，過去那些看起來“一眼假”的“翻車” 場景將被極大的弱化。更重要的是，因為有動捕實驗室提供的基礎(chǔ)模型保駕護航，就算是不運用多目方案，采用單攝像頭方案也能實現(xiàn)非常好的空間捕捉能力——不開玩笑，Google相機早就給我們呈現(xiàn)了算法的威力。

細心的朋友肯定注意到動捕實驗室那上百臺相機旁邊還有總計數(shù)十枚LED燈，只需要3秒鐘時間，這些LED補光燈就能模擬各種角度的補光效果并由相機捕捉下來——這就是智能補光（重打光）算法的基礎(chǔ)，相信很多人都還記得伴隨iPhone推出人像模式時那數(shù)種模擬燈光效果吧，殊途同歸。它的基礎(chǔ)應(yīng)用還是為人像模式提供更有空間感、氛圍感和質(zhì)感的照片，這一點很容易理解，但它更深層次的應(yīng)用，則是動捕實驗室為vivo影像開辟的未來賽道：通過與AIGC（生成式AI）算法結(jié)合，探索高品質(zhì)虛擬內(nèi)容創(chuàng)作技術(shù)在人像拍攝場景的有效應(yīng)用，比如這次特別活動上展示的：將建模的3D人像置于不同實景之中，足不出戶便可穿越四季、云游四海，且合成的照片真實程度極高，妙趣橫生。

但是，這種將摳像出來的3D模型置于實景中合成的照片，想要“毫無PS痕跡”，最重要的就是需要將實景的光線條件合理地打在3D人像模型上，才能實現(xiàn)理想的效果。vivo動捕實驗室的影棚中，補光燈與捕捉相機的位置一一對應(yīng)，自然能在3D建模的同時，也將光線信息一并納入其中。重要的是，這些AIGC算法的運行，全部基于端側(cè)的模型算力，這是出于vivo保護用戶數(shù)據(jù)隱私的底線來進行的。

于猛特別提到：vivo布局動捕實驗室，一方面是為現(xiàn)在競爭激烈的常規(guī)影像賽道服務(wù)，其產(chǎn)生的3D建模算法，能為vivo標志性的影像功能服務(wù)，另一方面則是布局未來的第二賽道，盡管端側(cè)AIGC能為傳統(tǒng)影像帶來哪些殺手級的應(yīng)用尚不明確，但現(xiàn)階段vivo影像團隊必須要有勇于試錯的勇氣，只有這樣才能為未來技術(shù)的產(chǎn)品化做好儲備。

劍指百分移動影像

第一個章節(jié)的內(nèi)容，從屬于本次影像盛典特別活動中的“超感人像系統(tǒng)”技術(shù)家族。除了這項兼具現(xiàn)在與未來的技術(shù)之外，還有其他很多新技術(shù)在會上被提及，它們的出現(xiàn)，讓影像技術(shù)矩陣的規(guī)模再次被壯大。受制于場合，這些技術(shù)的介紹都有些蜻蜓點水的味道，但它們都無一例外劍指下半年就要推出的下一代影像旗艦。本來對X系列寄予厚望的消費者就不在少數(shù)，在這次技術(shù)發(fā)布之后，期待值又是上升了一大截。

其中我最感興趣的就是蔡司宣布專門為vivo設(shè)計的全新標準“Vario-APO-Sonnar”長焦鏡頭。Vario，意為蔡司變焦鏡頭；APO，復(fù)消色差，長焦鏡頭中這項技術(shù)不可或缺，被首次運用于移動影像領(lǐng)域；Sonnar，蔡司用于其中長焦鏡頭的結(jié)構(gòu)，結(jié)合起來看，就是蔡司為vivo專門設(shè)計了用于移動影像的中長焦變焦鏡頭。再加上運用了浮動鏡組技術(shù)，讓這一支鏡頭可以涵蓋中長焦風(fēng)光、微距和人像等多個場景。在vivo X90 Pro+上，藍廠運用計算光學(xué)技術(shù)讓6400萬像素傳感器的長焦模組煥發(fā)了第二春，相信這枚鏡頭在未來會讓X系列擁有更強的影像表現(xiàn)，畢竟于猛也說長焦和視頻會是vivo接下來將要發(fā)力的賽道。

說到視頻，當然就要提到vivo全新的影像協(xié)處理器V3。這次發(fā)布會上只是簡單透露了些許參數(shù)，比如6nm制程，AI-ISP架構(gòu)等，在它的算力加持下，vivo新的影像旗艦不僅可以支持4K@60幀的電影級視頻錄制，還能在錄制完成后進行焦點、虛化等后處理操作——將這一系列特性放在FIRST影展這個場合宣布，vivo顯然是想要表明在視頻生產(chǎn)力方面，其對專業(yè)創(chuàng)作者也同樣有吸引力，大家不一定非要去用iPhone。在會上，vivo也提到將會支持索尼雙層晶體管像素(2-Layer Transistor Pixel)技術(shù)，考慮到李卓在會后專訪中提到與索尼定制的VSC仿生光譜傳感器，說不定在這項新技術(shù)上，vivo也同樣會進行定制。

之于普通消費者，除了全新的超感人像系統(tǒng)是福音之外，包括全景模式在內(nèi)的全焦段夜景能力又是另外一個好消息。新的“蒼穹夜景系統(tǒng)”能在夜景拍攝這個典型場景下，讓vivo手機的用戶更輕松地拍攝出華麗清晰的照片來。為了讓手機鏡頭能有更好的發(fā)揮，會上也宣布蔡司T*鍍膜將運用Multi-ALD技術(shù)，將鏡片組之間的中心反射率從之前的0.2%降低至0.1%，進一步減輕復(fù)雜光線條件下的炫光和鬼影。

寫在最后

從2017年開始，在AI加持下的移動影像產(chǎn)生了躍遷式的大發(fā)展，即使在這個過程中，有過“畫月亮”的爭議，但到了今天，相信所有人都已經(jīng)高度接受了這項技術(shù)的存在。正如于猛所說，在傳統(tǒng)移動影像的技術(shù)發(fā)展越來越體現(xiàn)出平臺期的特征時，盡早著手下一個賽道的預(yù)研刻不容緩。比如3D人像建模與AIGC的結(jié)合，借助手機算力即可產(chǎn)生可以類比電影工業(yè)級特效的結(jié)果，那么無論是對創(chuàng)業(yè)者，還是普通消費者，不又是一個值得期待的未來么？

關(guān)鍵詞：

不出戶，越四季，游四海｜vivo運用AI打造更懂用戶的人像技術(shù)

不出戶，越四季，游四海｜vivo運用AI打造更懂用戶的人像技術(shù)

您可能也感興趣:

今日熱點

強富美優(yōu)看淄博民營經(jīng)濟新活力 | 華浩陶瓷：科技賦能綠色轉(zhuǎn)型

天問1000中小學(xué)生挑戰(zhàn)賽｜超千道中小學(xué)生科學(xué)知識題上新

洪江市工信局幫106家中小企業(yè)完成“信易貸”注冊認證

更多

更多

排行

最近更新

今日要聞

不出戶，越四季，游四海｜vivo運用AI打造更懂用戶的人像技術(shù)

不出戶，越四季，游四海｜vivo運用AI打造更懂用戶的人像技術(shù)

您可能也感興趣:

今日熱點

強富美優(yōu)看淄博 民營經(jīng)濟新活力 | 華浩陶瓷：科技賦能 綠色轉(zhuǎn)型

天問1000中小學(xué)生挑戰(zhàn)賽｜超千道中小學(xué)生科學(xué)知識題上新

洪江市工信局幫106家中小企業(yè)完成“信易貸”注冊認證

為您推薦

宜安科技：公司材料涵蓋液態(tài)金屬、鎂合金、鋁合金、醫(yī)療材料、高分子材料

加蘭：我們需要加強身體素質(zhì) 大家對球隊現(xiàn)狀感到興奮

俄羅斯莫斯科機場最新消息 突發(fā)襲擊 莫斯科一機場一度關(guān)閉 基本情況講解

北京豐臺區(qū)防汛辦：永定河開閘泄洪 盧溝新橋已封閉

更多

更多

排行

最近更新

今日要聞

不出戶，越四季，游四海｜vivo運用AI打造更懂用戶的人像技術(shù)

不出戶，越四季，游四海｜vivo運用AI打造更懂用戶的人像技術(shù)

強富美優(yōu)看淄博民營經(jīng)濟新活力 | 華浩陶瓷：科技賦能綠色轉(zhuǎn)型

宜安科技：公司材料涵蓋液態(tài)金屬、鎂合金、鋁合金、醫(yī)療材料、高分子材料

俄羅斯莫斯科機場最新消息突發(fā)襲擊莫斯科一機場一度關(guān)閉基本情況講解

北京豐臺區(qū)防汛辦：永定河開閘泄洪盧溝新橋已封閉