Open-AI 刚刚(gāng)公布了其(qí)大型语言模型的最新版本 ——GPT-4。
GPT-4 可以更准确地解决你(nǐ)的难题,多(duō)模(mó)态的 GPT-4 还可以(yǐ)生(shēng)成、编辑具有创意性或技(jì)术性的文章,在(zài)高级推理方面的表现(xiàn)超过其前辈(当前公开版(bǎn) ChatGPT 基于(yú) GPT-3.5)。当然,正(zhèng)如大家所猜测的那样,微软 New Bing 的聊天功能确实基于 GPT-4。
此外,该(gāi)公司正在与合作伙伴 Be My Eyes 一起测试(shì) GPT-4 的(de)图像输入(rù)能力(注:Be My Eyes 是一款即将推出的智能手机 App,可以识别(bié)场(chǎng)景(jǐng)并对其进行描述,类似于(yú)大(dà)家常见的 AI 识图的加(jiā)强版(bǎn))。
除了介绍网站,OpenAI 还(hái)提供了描述(shù) GPT-4 功能的技(jì)术性论文,以及详细(xì)描述其局限性的系(xì)统模型 Card。

OpenAI 计划通(tōng)过 ChatGPT 及其(qí)商业 API 为用户提供 GPT-4 的文本功能支持,但(dàn)目前还需要等待。IT之家这里(lǐ)需要提醒(xǐng)一下(xià),GPT4 目前仅 ChatGPT plus 账号可用(yòng),可选 GPT4 模式进(jìn)行对话,每(měi) 4 小(xiǎo)时限(xiàn)制发送 100 条消息。
收费方(fāng)面,大约(yuē) 750 个单词的提示收取(qǔ)约 3 美分的(de)费用,约(yuē) 750 个单词(cí)的(de)响应则收取 6 美(měi)分(fèn)(就(jiù)是问(wèn)和答的区别)。

据(jù)介(jiè)绍,GPT-4 比以前的版本“更大”,这意(yì)味着它已经借助比前辈(bèi)更(gèng)多(duō)的数据进行了训练,并且在模(mó)型文件中有(yǒu)更多的权重,从(cóng)而使得它的运行成本更高(gāo)。
就任务而言,GPT-4 的表现比前辈更好(hǎo),它可以遵循自然(rán)语言的复杂指(zhǐ)令并生成技(jì)术或(huò)创意内容,而且它可以还更深入地做到这一(yī)点:它(tā)支(zhī)持(chí)生(shēng)成和处理(lǐ)多(duō)达(dá) 32768 个标记(jì)(约(yuē) 25000 个文本(běn)单词),从而(ér)实现(xiàn)比前辈更长的内容创建或文本分析。
OpenAI 表示,GPT-4 错误答案更少,而(ér)且(qiě)也会减少(shǎo)偏离话题的可能,也(yě)尽可能不会(huì)再谈论禁忌话(huà)题,甚至在(zài)许多标准(zhǔn)化测试中比人类表现得都要更好一些。
例(lì)如,GPT-4 在模拟律师(shī)考试的成绩在考生(shēng)中排名前(qián) 10% 左右,在 SAT 阅读考试中排名前 7% 左右,在 SAT 数学考(kǎo)试中(zhōng)排名前 11% 左右。相比(bǐ)之(zhī)下,GPT-3.5 在律师考试中(zhōng)的得分一般都(dōu)是倒数 10% 左右。当然,它们考个研究生(shēng)还(hái)是没问题的。

当然,AI 毕竟是 AI,OpenAI 也表示目(mù)前 GPT-4 并不完美(měi),它在很(hěn)多(duō)场(chǎng)景(jǐng)下的能(néng)力都不如(rú)人类。
据称,该模型(xíng)仍然存在“幻觉”或编造事实的问题,并且在事实方(fāng)面也不一定(dìng)总是可靠的(de),“它倾向于坚持(chí)认为它是正确的,即使它错(cuò)了(le)”。OpenAI 表(biǎo)示,GPT-4 正在努(nǔ)力解(jiě)决其局限性,例如社会偏见、幻觉(jiào)和对(duì)抗性提示。