6月18日-20日,2025中國(guó)國(guó)際金融展在上海世博展覽館召開(kāi)。作為金融行業(yè)的頂級(jí)盛會(huì),本屆展會(huì)以“開(kāi)放創(chuàng)新·科技賦能·共創(chuàng)金融新未來(lái)”為主題,來(lái)自監(jiān)管部門、金融基礎(chǔ)設(shè)施單位及國(guó)內(nèi)外金融機(jī)構(gòu)的代表濟(jì)濟(jì)一堂,共同展示中國(guó)金融改革創(chuàng)新所取得的豐碩成果。
易道博識(shí)攜其創(chuàng)新的“大模型+小模型”智能文檔處理方案亮相,為行業(yè)提供了新的解題思路,吸引眾多參會(huì)嘉賓駐足參觀。
金融業(yè)數(shù)字化浪潮中,海量文檔的智能處理能力,已成為衡量機(jī)構(gòu)效率與風(fēng)控水平的關(guān)鍵指標(biāo)。
一方面,身份證、發(fā)票等標(biāo)準(zhǔn)化文檔要求極致的處理速度與準(zhǔn)確率;另一方面,合同、理賠文檔等非標(biāo)文檔版式各異,傳統(tǒng)依賴模板的OCR技術(shù)泛化能力不足,導(dǎo)致開(kāi)發(fā)與維護(hù)成本高昂,制約了業(yè)務(wù)敏捷性。
如何平衡并滿足這兩類場(chǎng)景的差異化需求,是業(yè)界面臨的難題。
易道博識(shí)專用模型(小模型),是針對(duì)特定場(chǎng)景深度優(yōu)化的小模型,已覆蓋7大類、超60種標(biāo)準(zhǔn)識(shí)別,卡證、票據(jù)類的識(shí)別速度低于300毫秒,同時(shí)準(zhǔn)確率超99.5%。
為滿足不同企業(yè)需求,易道博識(shí)提供私有化部署、移動(dòng)端SDK及云服務(wù)API等靈活部署方式,為機(jī)構(gòu)文檔處理提供強(qiáng)有力的技術(shù)保障。
針對(duì)非標(biāo)、低頻的文檔的處理,可使用自研的GIE(General Information Extraction)通用文檔信息抽取大模型。該OCR大模型基于海量金融文檔訓(xùn)練,可理解文檔版式與語(yǔ)義,不再依賴固定文檔版式抽取。
以往,適配一種新版式文檔往往需要經(jīng)歷需求分析、數(shù)據(jù)標(biāo)注、模型訓(xùn)練和測(cè)試部署等漫長(zhǎng)流程。
采用GIE大模型后,業(yè)務(wù)人員僅需輸入提示詞(Prompt)即可配置字段抽取任務(wù),將以往需要數(shù)周乃至數(shù)月的業(yè)務(wù)上線周期,顛覆性地縮短至最快幾小時(shí)內(nèi),極大提升了業(yè)務(wù)的敏捷性以及降低模型部署成本。
這一大小模型協(xié)同新范式實(shí)現(xiàn)了金融全場(chǎng)景的覆蓋,并通過(guò)優(yōu)化資源配置,顯著降低了金融機(jī)構(gòu)實(shí)現(xiàn)文檔處理的技術(shù)門檻與成本。
專用模型(小模型): 處理版式固定、業(yè)務(wù)高頻的結(jié)構(gòu)化文檔,保障最高的識(shí)別效率、精度和最低的資源消耗。
通用模型(大模型): 處理版式復(fù)雜、半結(jié)構(gòu)及非結(jié)構(gòu)化的文檔,以強(qiáng)大的泛化學(xué)習(xí)能力,提供更全面的文檔處理能力和可擴(kuò)展性。
更重要的是,易道博識(shí)已全面適配國(guó)產(chǎn)信創(chuàng)體系,能夠與主流國(guó)產(chǎn)芯片、服務(wù)器、操作系統(tǒng)及數(shù)據(jù)庫(kù)深度融合,確保了智能文檔處理方案在金融信創(chuàng)環(huán)境下的高安全性和高可靠性。
做好科技金融、綠色金融、普惠金融、養(yǎng)老金融、數(shù)字金融“五篇大文章”,是推動(dòng)金融高質(zhì)量發(fā)展的戰(zhàn)略方向。而高效、智能、安全的文檔與數(shù)據(jù)處理能力,正是寫好這五篇文章的“數(shù)字筆墨”。易道博識(shí)相信,“大小模型協(xié)同”的文檔處理新范式,作為新一代的數(shù)字基礎(chǔ)設(shè)施,將為金融機(jī)構(gòu)的業(yè)務(wù)創(chuàng)新與戰(zhàn)略落地提供堅(jiān)實(shí)支撐。