上传者: zhuanxiangyat
|
上传时间: 2025-04-10 18:18:25
|
文件大小: 16KB
|
文件类型: TXT
在大模型角度来讲,下游业务足够丰富。长期而言,开源必然会更加灵活、成本更加低,能够更加普惠使用。闭源模型更多会走向高效果、高价值、高效率三个方向。未来,开源模型会逐步成为应用主流,而闭源模型会在特殊领域和行业当中所体现。
什么是大模型的数据工程?现在大家去做GPT模型或者BERT等模型,都会有两个方向。第一个是以模型为中心,不怎么关注数据,不断地优化模型的结构;第二个是以数据为中心(Data-Driven),也是目前做算法的一个共识,算法本质上是在做数据,核心是说模型不变,通过改进数据质量来提升模型效果,不断提升训练数据的质量。
在数据处理层面,大模型可以帮助传统的ETL过程简化难度,提高实时交互效率。在数据分析层面,大模型可以替代拖拽交互方式,让业务用户用更简单、更高效的方式以自然语言形式与底层数据交互,来构建需要的报表和看板。
在行业应用层面,大模型可以真正发挥对行业知识的理解能力,与具体数据结合,形成具针对客户、特定项目、指标体系的输出,再加上数据准备,可能直接输出标准化的项目成果。接下来会这三个层面依次展开,分别对大模型能力进行讲解。