近年来,ChatBI(聊天式商业智能)成为AI时代数据分析的重要方向。其核心是通过自然语言处理(NLP)技术,将用户的提问转化为数据查询(如SQL),以此来降低数据分析门槛。然而,其技术路线和应用效果存在非常明显差异。
为了理清主流技术趋势和市场发展现状,ITPUB特发起专项白皮书调研活动,通过对ChatBI主流厂商的深度沟通,探索数据分析在AI时代的进化路径。
目前,主流产品形态有三种,包括:独立对话框模式、插件式Copilot和 IM集成机器人模模式。大多数厂商可以同时支持三种模式,但也有部分企业只支持其中的一种。
从用户体验来看,ChatBI又有很多细分赛道。虽然,从产品的名字上看,都叫智能问数,但在服务体验上会有明显区别,比如:交互式分析,主要服务于基础问数场景(如查询客户数量),无需依赖传统BI;假设性分析,模拟变量影响(如原材料价格波动对成本的影响),需借助模型计算和传统BI能力;预测性分析,包括销售预测、库存优化等,结合历史数据与外部趋势;专家经验性分析,利用非结构化数据打标签,辅助战略决策。
从技术路线来看,最重要的包含 Text2DSL(自然语言到领域特定语言)、Text2Code(自然语言到代码)以及最为广泛采用的 Text2SQL(自然语言到结构化查询语言)。每种方式都有其适用场景和局限性,在构建对话式数据分析工具ChatBI的过程中,如何将用户的自然语言问题转化为可执行的数据分析指令,是系统模块设计的核心挑战之一。围绕这一目标,大家都进行不同程度的技术路线优化。
第一阵营:互联网大厂。这类企业产品的特点是,矩阵完备,生态驱动布局。很多互联网行业头部企业,如腾讯、阿里、火山引擎、网易、百度等。这一些企业在AI和大数据技术方面拥有深厚积累,并具备完整的产品生态体系。他们以产品矩阵丰富、功能齐全取胜。
第三阵营:数据领域新兴势力。这类企业是智能问数的特殊参与者。比如:艾体宝(原来的虹科,提供数据存储、数据智能、安全合规、网络监控与优化等服务)、数新智能(大数据和AI基础设施服务提供商),它们并非传统意义上的BI厂商,也不属于互联网大公司,而是来自于数据产业链的上下游企业,他们围绕大数据和人工智能提供基础设施服务,包括指标平台、数据中台、数据编织等。他们在完成底层数据建设后,亟需一个能够将数据“用起来”的工具,而不单单是“建起来”,这就催生了他们对ChatBI能力的强烈需求。
第四阵营:原生ChatBI厂商。像北极九章这样的原生ChatBI厂商,主要专注垂直赛道,从零构建智能分析能力。这类公司从成立之初就专注于对话式数据分析领域,致力于通过自然语言处理、NL2SQL、RAG、多轮对话等核心技术,打造真正意义上的“人机对话即分析”的智能数据分析平台。原生ChatBI厂商的优点是聚焦垂直场景、技术架构先进、使用者真实的体验极致。他们不需要背负历史包袱,能快速响应市场需求,专注于打磨自然语言理解、复杂查询生成、上下文管理等核心能力,从而在细分市场中占据领头羊。