度小满首席架构师李丰:平台能力建设是大模型落地成败的关键

21世纪经济报道记者 边万莉 北京报道 11月21日,由21世纪经济报道主办的“2023首席科技官思享会(闭门会)”在北京成功举行,聚焦大模型的热点话题,金融机构、金融科技公司等资深人士进行了深入研讨。

度小满首席架构师李丰表示,智能化技术在金融领域的经历了经典学习算法、深度学习、AGI/LLM(大语言模型)的三个阶段。通用人工智能可以看作是一个新的浪潮,在深度学习基础上有更多的理解和推理能力。大模型可能是生产工具级别的升级,最终会带来生产力的提升。

“寄希望于大模型短期带来应用层面快速爆发或者场景突破,不是很现实。”李丰认为,这不是大模型擅长的场景,它擅长的是知识库压缩、推理、问题拆解、问题解答等底层能力。真正体现大模型价值,一定是与场景结合,这个进程不会那么快,尤其是金融场景的新技术应用必须经过反复验证,确定效果才能上线。

李丰表示,任何技术的发展都会有火热的阶段,价值体现是慢慢地渗透,渗透到每一个环节的方方面面,最终会达到质的飞跃,这是大模型价值释放的方式。

据他介绍,通用大模型需要巨大的人力财力投入,度小满选择基于成熟通用基座模型,专注于打造金融领域大模型。基于通用大模型来做金融领域大模型,要在高质量金融数据基础上进行调优,同时要保证部署和使用方式的灵活性,才能满足金融机构的情况。度小满“轩辕”大模型内部使用中,在一些应用场景和知识问答等方面体现了比较好的效果,主要价值是基于特有场景的调优,才能更有利于产生对业务的直接贡献。

“平台能力建设是大模型落地成败的关键,没有一个很好的平台很难在生态应用场景层面发力。”李丰说,大模型落地到场景需要跨越的鸿沟主要有三个方面:服务可靠性(并发/延迟/稳定/降级/容灾)、服务可控性(权限/安全/隐私/合规)、服务易用性(会话/通用能力/API/提示词工程/灵活切换)。

度小满首席架构师李丰:平台能力建设是大模型落地成败的关键

在他看来,大模型的应用可以先内后外,先从企业内部做提质增效的实验,然后再推到更广阔的应用场景。一方面,内部验证风险更低;另一方面,把内部用户的认知和能力打磨之后,会为后续更广泛应用打下很好的基础;此外,内部应用会加快加深对技术的认可,获取更多的资源支持。任何一个新技术都有风险,大模型也不例外,不能把它看作是必然的东西。

“做好前面这几步,才能真正面向场景。”李丰表示,大模型在应用场景中做的是底层支撑,真正做好应用是非常工程化的事情,需要进行一些探索。比如,营销活动GPT,可以作为从需求、设计、到评估、实现,端到端的营销活动智能助手;对话式金融服务机器人,能够做到真正千人千面、按需实时共建的服务流程;智能客服,比肩金牌业务员,服务效率提升25%。

您可以还会对下面的文章感兴趣:

使用微信扫描二维码后

点击右上角发送给好友