编辑:周大军
近期,在腾讯科技和梅花创投联合举办的《GPT开放麦》活动上,腾讯新闻创作者、甲骨易AI翻译平台LanguageX负责人李光华,现场展开一张ChatGPT的“全景图”,从技术、产品和市场等角度解析ChatGPT带来的机会和思考。核心观点:①关于吴军“ChatGPT不算技术革命”的回应:吴军所熟悉的NLP领域的中间任务和部分传统方法已经逐渐消失。目前的神经网络与传统的N-Gram概率计算方法已经有了很大的差距,不能再同日而语。②关于ChatGPT的评价:它是产品和工程的胜利,比如他们选择语言作为AGI的切入点,语言对人类至关重要,它是人类思维的边界。③关于ChatGPT技术:尽管OpenAI的成功主要归功于其工程能力,但仍有三个核心技术值得一提——情境学习、思维链、人类反馈强化学习。④关于ChatGPT的几点建议:一旦技术门槛降低,其影响力会变得非常巨大,且会带来深远的生产力革命,同时也带来了危机:机器智能可能是人类最后一项伟大发明,但我们不能依赖它。以下为现场实录整理:在GPT-3之前,谷歌和OpenAI都在开展相关研究,但尚未充分展示其威力,外界尚未意识到大模型的威力,去年11月30日之前,因为我们做自然语言处理、神经机器翻译相关工作,在ChatGPT问世后,我们第一时间尝试了GPT-3,并在短时间内对产品方向进行了调整。如今,我们专注于模型平台、翻译模型大语言翻译模型及相关应用。现在我们感觉每天都在学习,到了“疯魔FOMO”的程度,生怕漏掉一些信息,我将从以下几个方面来介绍ChatGPT:背景、技术、产品以及一些建议。01
缘起:关于吴军“ChatGPT不算一次技术革命”的看法前两天,吴军老师在得到直播上回答了一些问题,认为“ChatGPT不算一次技术革命”,引发业内争议。我非常敬重吴军老师,但我们在一些重要的形式判断上的观点可能是相反的。我在此表示敬意,也指出一些观点差异。
02
ChatGPT是工程和产品的胜利看这张图,才过两个月ChatGPT的用户已经破亿,并且我们我使用它的频次很高,我自己每天至少花两三个小时用ChatGPT做辅助工作,国内外的大公司都在研究这些模型,亚马逊也加入了这个领域。



03
ChatGPT的三个核心技术:
情境学习、思维链、人类反馈强化学习接下来,我们简要介绍了ChatGPT的技术基础,从算法、算力和数据三个方面进行宏观了解。首先,在算法层面,连接主义取得了胜利。然而在过去,连接主义曾经是一种信仰。人工智能之父马文·明斯基是符号学派的代表,当时深度学习的论文难以发表,连接主义者在主流圈子的会议上也没有发表论文的机会。在算力的发展中,Transformer技术取得了巨大的进步。从商业角度来看,与微软合作是因为训练这类模型非常耗费资金。据估计,训练一个模型的成本在500万至1200万美元之间,而这还不是一次性的费用,因为过程中可能会出现问题。至于推理成本,即模型部署到服务器并响应指令的成本,我们很难按次数计算。不过,根据GPU租金计算,每天的成本大约为35万美元。在数据方面,英语占据了92%的份额。而中文在GPT-3中的占比仅为0.99%。我们在国内的训练主要还是用中文。尽管如此,中文的影响力在全球范围内可能仍处于较低水平。此外,这些语料库基本上都是公开的,几乎所有的语料都被使用了。尽管我们把OpenAI的成功主要归功于其工程能力和产品胜利,但仍有三个核心技术值得一提值得关注。首先是情境学习(In-context Learning),这意味着模型能够根据上下文来学习和适应。左边是论文标题,右边是Fine-tuning模式,我们之前做模型的方式就是右边的说法,所以模型出来之后我们要拿数据来训练,给他一个例子,如果给出一个法语翻译任务,模型可以根据提供的示例来进行翻译。同样,在情感分类任务中,模型能够学会根据评论内容判断情感倾向。


RECOMMEND
推荐关注