大模型有哪些-要成为「生产力」,大模型还得跨过哪些「坎」?_80楼网赚论坛|80楼网创
“AI大模型第一波交卷时间到了——不能实际提供生产力的‘花瓶’,恐怕很难及格。” 作者 | 董子博 编辑 | 岑 峰 2023年的AI大模型,已经从Q1火到了Q2。 国内,从大厂到新创,纷纷下场试水,几个月过去,已经有了不少大模型产品“交卷”受评,颇有“乱花渐欲迷人眼”的架势。 看客只识AI大模型百花齐放,但除了一场热闹以外,却也开始有人问出了这个问题: “AI大模型这么厉害,但它有啥用呢?” 诚然,市场上不少公布的大模型,还并未开发到完全程度——甚至距离“可用”、“好用”还差着一些距离。 在一些AI大模型产品,仍旧在“胡说八道”、场景落地难、语义理解能力弱等问题中徘徊时,OpenAI 首先看到了落地的痛点,和微软合作推出 Copilot,主打在办公领域提升工作效率,打响了大模型向生产力进军的发令枪。 在人们的想象中,AI 应该可以帮助处理机械、重复的日常工作,提供独特的分析视点、创作灵感,在特定的领域——比如教育、医疗、法律——给出独特的建议和帮助,让工作和生活更轻松、便捷,让每个人都能够享受更贴心细致的服务。 而什么样的AI大模型,才能真正地帮助使用者“干活”?让日常办公、生产的效率得到更大提升?什么样的大模型,才真正算得上生产力工具?要满足生产力工具的要求,大模型需要有哪些秘密武器? 对于业界来说大模型有哪些,这些问题如果得不到解答,那么或早或晚,都会遇上市场的瓶颈;而越早能够为市场提供效率提升的大模型产品,也就能够越早地占领先机。 01 理解&记忆:大模型生产力的分水岭 记忆和理解能力,对于当下如同雨后春笋的大模型产品来说,说得上是最硬核的实力比拼。 模型的理解能力,根植于对自然语言的处理能力,能够清晰地辨别语义,尤其是一些根植于本地语言语境中的俗语、幽默,对于理解用户想要什么,进而完成文本生成和创作,至关重要。 而模型的记忆能力——也就是多轮对话能力——越强,使用者就能更详细地对需求进行描述,进而利用 AI 完成更加复杂的工作任务; 大模型比拼中最“硬”的两个科目,也是大模型提供生产力的关键保证。不仅如此,不如说,要大模型能够真正帮人“干活”,记忆和理解能力,都要满足更高的要求。 但无论是“理解”还是“记忆”,都是大模型在当下的能力提升的攻关难点。一方面是市场的巨大痛点,一方面是技术上难攻不落的“高墙”,这对矛盾不解决,AI 的生产力就始终面临着一个艰难的瓶颈。 首先,要解决 AI 语义理解能力差的问题,昆仑万维和奇点智源的 AI 科学家们想到了一种另辟蹊径的方法——蒙特卡洛树搜索算法。 蒙特卡洛树搜索算法,简单来说一种基于随机模拟的强化学习算法。对 AI 不甚了解的人可能并不知道它的名字,但它却是AlphaGo能打败李世石、柯洁等一众围棋高手的秘密武器。而蒙特卡洛树搜索的核心,就是通过一个树状结构,在每个节点进行随机搜索,并找到最优决策的方式。 在昆仑万维和奇点智源联合发布的AI大语言模型——“天工”中,蒙特卡洛树搜索可以让AI“三思而后行”——AI 会基于过去用户的对话记录以及当前用户的输入生成候选大量回复,并结合NLP技术,选取最佳的回复方案反馈给用户。 通过把蒙特卡洛树搜索算法,和自然语言处理相结合,让Decoder的安全性和准确性获得了极大的增强,也让天工在相对复杂的任务和场景中,能够快速且准确地响应指令,输出高质量回答。 为了测试天工的语义理解能力,雷峰网向天工提问:“什么是蒙特卡洛树搜索算法?”天工的回答还比较清楚,令人满意: 把蒙特卡洛树搜索应用到 AI 对话机器人中,另一个优势,是AI能够理解如何在对话中转换话题,并提出问题,引导用户完善自己的Prompt,以得到更好的回复结果。 比如,雷峰网故意问出了一个十分宽泛、难以回答的问题。天工则并没有落入这个“陷阱”,通过主动提问,缩小问题的范围:...