2024年7月24-26日,由中國圖象圖形學學會(CSIG)、中國計算機學會(CCF)主辦,CSIG多媒體專業(yè)委員會、CCF多媒體技術專業(yè)委員會承辦,北方民族大學聯(lián)合承辦,寧夏大學、寧夏師范學院協(xié)辦的「中國多媒體大會(ChinaMM 2024)」在寧夏回族自治區(qū)銀川市召開。
北京博雅睿視科技有限公司作為大會唯一鉆石贊助商,成功組織召開了「面向視覺智算的關鍵技術與應用」論壇會議。
會議由北京博雅睿視科技有限公司創(chuàng)始人王苫社董事長及北京博雅睿視科技有限公司聯(lián)合創(chuàng)始人、韓巍總經(jīng)理組織召集。
視覺智算概念由北京博雅睿視于長江論道上首次提出,當前,人類已邁入視覺信息占主導地位的時代,AI計算正呈指數(shù)級增長,成為主要的計算需求,視覺智算的核心是讓機器基于AI算法,高效、安全地處理以視頻數(shù)據(jù)為核心的多媒體信息,以產(chǎn)生各種各樣的專業(yè)特色智能體,并可實現(xiàn)這些特色智能體之間的互聯(lián)。
韓巍總經(jīng)理主持會議,來自視覺智算領域的學術專家、行業(yè)大咖、企業(yè)管理者齊集一堂,共同探討以算力基建化為主體、以算法服務化為引領、以服務智件化為依托的視覺智算解決之道。
田原 | 智算中心建設經(jīng)驗分享及視頻領域解決方案介紹
來自中通服咨詢設計研究院通信規(guī)劃設計院田原院長,分享了智算中心建設經(jīng)驗、視頻領域解決方案及低空領域實踐探索。
田原院長首先介紹了中通服咨詢設計研究院的發(fā)展史、愿景及定位和資質榮譽,其次就算力發(fā)展的政策環(huán)境、近年全國算力發(fā)展規(guī)模、算力中心整體架構進行分析,并展示了中通服咨詢設計研究院通信院算力能力體系、算力產(chǎn)品體系、算力服務體系,然后就“東數(shù)西算”工程等優(yōu)秀案例進行分享。
在視頻監(jiān)控領域,田原院長詳細分享了電信運營商的視頻解決方案和案例。就低空經(jīng)濟領域,田原院長著重從國家政策銜接、戰(zhàn)新產(chǎn)業(yè)布局、新一輪新興技術發(fā)展角度分析了入局低空賽道、搶占低空經(jīng)濟戰(zhàn)略制高點、卡位產(chǎn)業(yè)鏈優(yōu)勢生態(tài)位的必要性, 此外分享了近期中通服咨詢設計研究院發(fā)布的國內首個《空地一體5G增強低空網(wǎng)絡白皮書》、國內首部《蘇州市低空空中交通規(guī)則(試行)》及低空基礎設施規(guī)劃、低空實驗室打造等成果,并深切表達期望攜手各界,打造低空合作共贏新生態(tài)。
梅迪 | 開放的生態(tài)-國產(chǎn)算力發(fā)展之路
來自廣州希姆半導體科技有限公司創(chuàng)始人、CEO梅迪分享了「開放的生態(tài)-國產(chǎn)算力發(fā)展之路」
近年來,隨著全球對芯片自主可控需求的增長以及物聯(lián)網(wǎng)、邊緣計算等領域的需求不斷擴大,RISC-V得到了廣泛關注和應用,逐漸成為第三大指令集架構。在AI時代,RISC-V更是迎來爆發(fā)的新機遇,從物聯(lián)網(wǎng)設備、邊緣計算逐漸邁向AI計算、高性能計算等領域。
今年以來,我國企業(yè)在RISC-V+AI開源技術體系上更多地成為主力貢獻者,成為全球化開放共享的主導力量。這已經(jīng)變成了一個國家戰(zhàn)略。用開源打破生態(tài)壟斷,降低企業(yè)擁有核心技術的門檻,讓每個企業(yè)都能低成本地做自己的芯片,形成智能芯片的汪洋大海,滿足無處不在的智能需求。
王斌 | 道合聲遠 菁彩未來",超高清產(chǎn)業(yè)生態(tài)發(fā)展
世界超高清視頻產(chǎn)業(yè)聯(lián)盟產(chǎn)業(yè)研究總監(jiān)王斌分享了「"道合聲遠 菁彩未來",超高清產(chǎn)業(yè)生態(tài)發(fā)展」
超高清技術已經(jīng)在個人、家庭、車載、體育賽事以及包括醫(yī)療,工業(yè)等各領域廣泛應用。超高清根技術從六維度擴展到3D,XR,元宇宙。在最近兩年,隨著超高清在公眾娛樂,入戶,車載等場景逐漸深入,以及AI技術的快速發(fā)展,超高清和AI 在內容制作,終端,傳輸放映各領域不斷深入。
王斌詳細介紹了超高清最新熱點,超高清根技術標準的制定及生態(tài)進展以及對未來發(fā)展的展望。
范益波 | xkISP:開源ISP處理器及應用
復旦大學微電子學院范益波教授分享了「xkISP:開源ISP處理器及應用」
圖像信號處理器(ISP)是視頻采集、機器視覺的最前端核心模塊,主要負責對傳感器輸出的原始RAW信號做計算成像,實現(xiàn)傳感器輸出高畫質的RGB或YUV信息。ISP 的性能直接影響到圖像和視頻的質量。一個優(yōu)秀的 ISP 能夠讓設備在各種復雜的環(huán)境和條件下拍攝出令人滿意的圖像, 為用戶帶來更好的視覺體驗。同時,也為圖像識別、計算機視覺等技術的應用提供了高質量的數(shù)據(jù)基礎。
范益波教授就其團隊開發(fā)的開源ISP處理器—xkISP做了詳細介紹,具體包括如下幾個部分:1)xkISP的全棧算法與開源處理器架構;2)基于AI的ISP Tuning框架;3)AI-ISP的架構探索與挑戰(zhàn);4)xkISP的改進與應用展望。
余世兵 | 視覺智能2.0”時代對算力挑戰(zhàn)的思考和實踐
近期快手可靈爆火,普通用戶實實在在體驗到了文生視頻大模型帶來的震撼,視覺智能正在從“人臉識別1.0”到“智能可用2.0”加速升級和落地。視覺 AI 2.0時代,視頻內容生產(chǎn)、理解、分發(fā)和互動的技術鏈路;視覺智能對算力、技術底座的需求都將提出全新挑戰(zhàn)。
“來自凌川科技有限公司解決方案負責人余世兵分享了[“視覺智能2.0”對算力挑戰(zhàn)的思考和實踐]”
余世兵基于凌川科技團隊多年來圍繞智能視頻處理方向持續(xù)開展核心技術攻關和應用落地探索的經(jīng)驗,對視覺AI2.0時代對算力挑戰(zhàn)的思考和實踐經(jīng)驗進行了分享。
李俊 | 用“芯”構建可信可進化的視覺智算解決方案
視覺主導的信息時代,信息的處理由計算邁入智算,AVS視覺智算芯片的問世、數(shù)字視網(wǎng)膜的演進、大模型的出圈及落地,為算據(jù)積累、算法優(yōu)化及算力協(xié)同提供了新的解決思路,使得基于高質量窄帶智算、高并發(fā)可信互聯(lián)、分布式端測推理的視覺智算解決方案觸手可及。
李俊基于博雅睿視在視覺前沿技術的研究,共同探索構建看得全、識得準、自進化、有依據(jù)的可信視覺智算解決方案。
李俊認為數(shù)字中國的下半場是智算中國,未來的視覺智算絕不是簡單AI+,也不是AGI,而應該是特定領域的極客專業(yè)特色智能體,李俊介紹了博雅睿視創(chuàng)新性應用VCM視頻智算、數(shù)字視網(wǎng)膜、AI視覺大模型技術,正在著力創(chuàng)建一種“自主先進、可伸縮、可成長、可進化”的行業(yè)特色智能體解決方案, 方案的構建將過去的“追趕技術”,提升到“規(guī)劃技術”層次,于專業(yè)場景下,與生態(tài)合作伙伴一道通過算據(jù)積累、算法優(yōu)化、算力協(xié)同,以喚醒沉睡的知識、信息、數(shù)據(jù)等新生產(chǎn)要素,打造可信可進化的視覺智算行業(yè)應用領域的專業(yè)特色智能體。