PRCV 2023 | 合合信息智能文檔處理技術(shù)賦能文檔與圖像內(nèi)容安全

2023-10-17 22:28:39來(lái)源:威易網(wǎng)作者:

今年8月,合合信息獲得了文檔分析與識(shí)別國(guó)際會(huì)議(ICDAR 2023)“文本篡改檢測(cè)”賽道冠軍。合合信息技術(shù)團(tuán)隊(duì)提出的方案能夠在保持低誤檢率的同時(shí),準(zhǔn)確識(shí)別并定位圖片中文本的篡改行為,從而有效保障文本信息的真實(shí)性。

 近期,2023年中國(guó)模式識(shí)別與計(jì)算機(jī)視覺(jué)大會(huì)(PRCV)在廈門成功舉行。大會(huì)由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)、中國(guó)自動(dòng)化學(xué)會(huì)(CAA)、中國(guó)圖象圖形學(xué)學(xué)會(huì)(CSIG)和中國(guó)人工智能學(xué)會(huì)(CAAI)聯(lián)合主辦,多媒體可信感知與高效計(jì)算教育部重點(diǎn)實(shí)驗(yàn)室、廈門大學(xué)人工智能研究院、廈門大學(xué)信息學(xué)院承辦,是國(guó)內(nèi)模式識(shí)別和計(jì)算機(jī)視覺(jué)領(lǐng)域的學(xué)術(shù)盛會(huì)。

本次大會(huì)通過(guò)聚焦中國(guó)模式識(shí)別與計(jì)算機(jī)視覺(jué)領(lǐng)域的最新理論和技術(shù)成果解讀、分享,進(jìn)一步加強(qiáng)產(chǎn)學(xué)研領(lǐng)域的學(xué)術(shù)交流和技術(shù)碰撞,促進(jìn)模式識(shí)別與計(jì)算機(jī)視覺(jué)領(lǐng)域的協(xié)同合作與融合創(chuàng)新。大會(huì)邀請(qǐng)了徐宗本院士、張艷寧教授、李樹(shù)濤教授、黃鐵軍教授、胡事民教授作主旨報(bào)告;參會(huì)人員包括來(lái)自清華大學(xué)、廈門大學(xué)、浙江大學(xué)、華中科技大學(xué)等高校的科研工作者,以及騰訊、美團(tuán)、合合信息等科技企業(yè)的技術(shù)專家。

智能文檔處理技術(shù)是學(xué)術(shù)界重點(diǎn)關(guān)注的領(lǐng)域,而隨著信息渠道的多樣化發(fā)展,異構(gòu)化、跨模態(tài)的數(shù)據(jù)層出不窮。文檔圖像是文字與圖片領(lǐng)域的交集點(diǎn),天然具備多模態(tài)屬性。在《視言碰撞:語(yǔ)言模型與視覺(jué)生態(tài)協(xié)同論壇》上,合合信息圖像算法研發(fā)總監(jiān)郭豐俊博士就文檔圖像前沿技術(shù)熱點(diǎn)話題進(jìn)行了分享。郭豐俊表示,多模態(tài)技術(shù)可充分利用文檔圖像的視覺(jué)和語(yǔ)言屬性,并借助語(yǔ)言大模型已取得的優(yōu)異性能和技術(shù)積累,正逐漸成為文檔圖像處理領(lǐng)域的熱門研究方向。

 \

   合合信息圖像算法研發(fā)總監(jiān)郭豐俊博士進(jìn)行《文檔圖像前沿技術(shù)探索——多模態(tài)及圖像安全》主題分享


“從目前評(píng)測(cè)的情況來(lái)看,已知的多模態(tài)預(yù)訓(xùn)練系統(tǒng)在文檔圖像識(shí)別準(zhǔn)確率上還遜于最先進(jìn)的OCR識(shí)別系統(tǒng)。”郭豐俊提到,合合信息-華南理工大學(xué)文檔圖像分析識(shí)別與理解聯(lián)合實(shí)驗(yàn)室對(duì)該方向展開(kāi)了研究,并在數(shù)據(jù)高效利用及垂直領(lǐng)域識(shí)別項(xiàng)目中取得了階段性成果。

大模型技術(shù)的突破讓生成式AI擁有了更廣泛的落地空間,也讓圖片偽造的門檻變得更低,給了不法分子可乘之機(jī)。大會(huì)現(xiàn)場(chǎng),郭豐俊對(duì)合合信息在AI圖像安全方面的工作進(jìn)行了分享。據(jù)介紹,合合信息智能文檔處理技術(shù)覆蓋了圖像預(yù)處理、解析識(shí)別到AI安全等文檔圖像處理全生命周期,圖像篡改檢測(cè)技術(shù)不僅能夠應(yīng)用于自然場(chǎng)景,還能應(yīng)用于資質(zhì)證書、文檔合同、銀行保單等截圖的鑒別上。針對(duì)圖片生成式造假,合合信息基于空域與頻域關(guān)系建模,利用多維度特征來(lái)分辨真實(shí)圖片和生成式圖片的細(xì)微差異,判斷圖片是否由AI生成。

今年8月,合合信息獲得了文檔分析與識(shí)別國(guó)際會(huì)議(ICDAR 2023)“文本篡改檢測(cè)”賽道冠軍。合合信息技術(shù)團(tuán)隊(duì)提出的方案能夠在保持低誤檢率的同時(shí),準(zhǔn)確識(shí)別并定位圖片中文本的篡改行為,從而有效保障文本信息的真實(shí)性。相關(guān)方案已在銀行、證券、保險(xiǎn)多個(gè)場(chǎng)景中應(yīng)用。

“目前,圖像篡改檢測(cè)技術(shù)的應(yīng)用也面臨著篡改手段不斷變化、場(chǎng)景復(fù)雜等系列挑戰(zhàn),不斷提升檢測(cè)系統(tǒng)的魯棒性和泛化能力,是學(xué)術(shù)界與企業(yè)界需要深入合作的重要方向。”郭豐俊表示,合合信息已聯(lián)合中國(guó)信通院,發(fā)起了《文本圖像篡改檢測(cè)系統(tǒng)技術(shù)規(guī)范》標(biāo)準(zhǔn)制定,希望持續(xù)推動(dòng)AI技術(shù)在圖像安全領(lǐng)域的廣泛應(yīng)用,帶給用戶更加安全、高效的工作和生活體驗(yàn)。
 
關(guān)鍵詞:合合信息