易道博識(shí)掌握具有自主知識(shí)產(chǎn)權(quán)的核心算法,覆蓋文字識(shí)別、文檔處理、圖像處理、自然語言處理,結(jié)合領(lǐng)域模型學(xué)習(xí)能力,駕馭算力資源,不斷實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)下的模型升級(jí),持續(xù)打造更強(qiáng)大的AI能力。
文字識(shí)別
表格識(shí)別
印章識(shí)別
勾選識(shí)別
簽名比對(duì)
印刷、手寫、中文、英文、數(shù)字識(shí)別
基于深度學(xué)習(xí)全新DeepOCR識(shí)別流程,大幅提升識(shí)別速度及精度,
卡證類< 300ms,單張發(fā)票< 1s,A4幅面票據(jù)混掃< 3s,
漢字字符識(shí)別率> 99.5%,數(shù)字字符識(shí)別率> 99.9%,
英文字符識(shí)別率> 99.7%,手寫整行識(shí)別率> 95.2%
有線、無線、列位偏移、多列重疊
多形狀、多方向、曲線行、模糊、遮擋
重疊 、小印章
符號(hào)檢測(cè)、內(nèi)容識(shí)別
簽名檢測(cè)、簽名比對(duì)
版面分析:標(biāo)題、段落、表格、印章、簽名、信息塊、圖表
文檔分類:固定格式、非固定格式、富格式文檔、長(zhǎng)文本文檔
文檔抽取:實(shí)體、關(guān)系、表格、印章、簽名
文檔比對(duì):關(guān)鍵信息、段落、表格、結(jié)構(gòu)
圖像檢測(cè)、圖像分割
圖像質(zhì)檢:模糊、反光、拍屏、水印、復(fù)印、篡改、變形、切邊、遠(yuǎn)距離、遮擋
噪聲和干擾去除:圖像噪聲、水印、陰影、印章、痕跡去除
文本分析:分詞、詞向量表示、依存句法分析、命名體識(shí)別、文本相似度
語言理解:文本分類、信息抽取、情感分析
依托GPT、BERT等大規(guī)模語言模型,基于海量文本語料自動(dòng)學(xué)習(xí),具備更好的文本理解和文本生成能力。
基于LayoutLM、ERNIE等大規(guī)模文檔版式預(yù)訓(xùn)練模型,利用大量文檔樣本自監(jiān)督學(xué)習(xí),更好地理解各種文檔結(jié)構(gòu)、內(nèi)容和語義。
以大規(guī)模語言模型和版式預(yù)訓(xùn)練模型為基礎(chǔ)結(jié)合領(lǐng)域數(shù)據(jù),通過下游任務(wù)學(xué)習(xí),快速生成領(lǐng)域中小規(guī)模模型,并輸出場(chǎng)景AI能力。
針對(duì)本地化、私有化等生產(chǎn)部署場(chǎng)景,利用知識(shí)蒸餾等模型輕量化技術(shù),解決算力局限性問題實(shí)現(xiàn)業(yè)務(wù)場(chǎng)景深度融合。