大模型驅動數據分析范式重構,騰訊云Data+AI實踐亮相2025數據智能大會
在6月18日中國通信標準化協會主辦的2025數據智能大會上,騰訊云大數據TBDS產品中心總經理徐曉敏發表主題演講,系統闡釋了大模型(LLM)對數據分析范式的深刻變革,并分享了騰訊云在Data+AI融合方向的最新實踐。他表示,大模型正重塑數據處理架構、分析方法、治理需求與運維模式,騰訊云已構建起覆蓋底層存儲到上層應用的完整Data+AI技術體系。
進入LLM時代,數據處理和分析正加速演進。計算從CPU走向CPU+GPU混合,治理對象從結構化數據拓展到文本、圖像、音視頻等多模態數據,分析方式從規則建模向語義理解驅動的智能分析轉變,運維從人工修復邁向自動化響應。資源管理正依托動態優化,交互方式從SQL遷移到自然語言,人機協作也從工單驅動進化為智能聯動。
應對這些變化,騰訊云構建了以統一元數據視圖為核心的堅實底座。通過TBDS-Catalog,平臺打通了Hive、Iceberg、MPP數倉等結構化源與圖像、音視頻、模型等非結構數據,實現統一的元數據視圖和權限管理。該服務兼容Hive Metastore,便于承接歷史資產,并通過高性能JDBC優化大表處理效率。面向AI場景, TBDS-Catalog可統一管理模型文件和訓練數據,保障非結構數據高效可控。
在架構層,騰訊云基于Lakehouse構建了支持批處理、流計算、交互式查詢和AI訓練的統一平臺,靈活調度Spark、Flink、StarRocks等計算引擎。Wedata開發平臺融合DataOps與MLOps,支持結構化與非結構化數據資產的統一開發、編排與治理。
為降低使用門檻,騰訊云推出了自然語言驅動的ChatBI。用戶無需掌握SQL,只需通過自然語言提問,即可獲取實時數據結果。系統還能自動解讀數據、識別波動并進行歸因分析,大幅提升業務響應效率。
在非結構化數據分析方面,騰訊云推出AI-Search平臺(騰訊云ES),打造覆蓋語義理解、向量化、檢索和生成的一站式RAG平臺。該系統支持復雜文檔解析與混合搜索,已廣泛應用于“ 微信 讀書AI問書”、“ima工作臺”等場景,借助ES-RAG技術實現生成式回答和問題推薦。騰訊云也是首個通過信通院《檢索增強生成技術要求》標準認證的企業。
在運維治理上,騰訊云通過“大數據智能管家”構建了閉環自治體系,覆蓋從數據采集、異常診斷到資源優化的全鏈條。系統通過智能模型提升資源利用率達60%,并支持故障自愈和策略自動演進,顯著降低運維成本。
這些能力已在騰訊內外全面落地。目前,騰訊云大數據已服務2000多家政企客戶,節點規模超10萬。騰訊云將持續推動Data+AI融合,為行業釋放更大數據智能價值。