文檔是知識(shí)傳遞的載體,無論是大模型應(yīng)用發(fā)展,還是與產(chǎn)業(yè)數(shù)字化息息相關(guān)的高質(zhì)量數(shù)據(jù)庫(kù)的建立,都離不開對(duì)于文檔數(shù)據(jù)的處理和分析。目前,越來越多的開發(fā)者開始關(guān)注文檔數(shù)據(jù)處理背后的“文檔解析”技術(shù),用以實(shí)現(xiàn)自動(dòng)化數(shù)據(jù)提取、優(yōu)化大模型訓(xùn)練、開發(fā)智能文檔處理應(yīng)用。近期,第五屆長(zhǎng)沙·中國(guó)1024程序員節(jié)在湖南長(zhǎng)沙舉行。大會(huì)由湖南省工