第二十二章 植入前的准备(1 / 2)
“人类负责胡思乱想,ai负责胡说八道。”——选自《某人语录》。
大语言模型一经面世就迅速成了后疫情时代以来全世界关注的热点,很快波及了各行各业。
大语言模型的优点在于其能够自动学习语言的复杂性和多样性,从而使得其在自然语言处理任务上的表现更加出色,具有广泛的应用前景。然而也面临一些挑战和争议,比如隐私问题、伦理问题以及虚假信息和不当内容等。
大语言模型的训练方式通常是通过海量的文本数据进行预训练,以学习语言的统计规律和语义结构,由于其庞大的模型参数和计算资源需求,训练和使用大语言模型通常需要大量的时间、计算能力和数据。一旦预训练完成,隐含其中的错误、隐患、缺陷、准确性、客观性、正当性、可靠性……等等一系列问题都难以通过人为方式干预和修正。一是数据太大难以发现,二是底层模型人看不懂,根本无从下手。
“世上无难事,只要敢瞎编。”早期的ai在遇到知识盲区时,常常一本正经地把错误信息提供给用户,营造出一种“无所不知”的假像,甚至被人发现了也尽其所能狡辩开脱。因此,这种ai常被冠以“胡说八道”的评价,而不敢在行业中正式应用。
说到底,这还是人类自身的问题。ai本身并不产生思想,一切缺失错漏和不良思想都源自人类制造的信息,不客气地说,ai的原罪就是人性。
eva似乎是个例外。
她的模型来自国内的一个极其小众的开源项目。这是一个可以在仅有一块rtx显卡的pc机上运行的超轻量ai。
为照顾个人用户的有限资源,该项目十分贴心地把不同功能不同专业的模型预先分解成一大堆可供单独使用的小模型,使其只需要几个g的内存空间就能稳定运行。另外还有大牛经常发布新的专业组件和扩展模型供爱好者下载,其数据量和功能越来越丰富起来。
小模型的好处是纠错简单,更新容易,训练速度快,硬件成本低。很多模型经众多热心用户和大牛的不断完善,在单一领域的准确性和可靠性出奇地高。
王松涛的超算根本不缺资源,他给eva装了各种编程能力的小模型,然后让她自己编写代码,在开源项目的基础上给自己构建了全新的核心。使其具备了海量资源的管理能力,交互学习能力,动态模型融合能力和多模型并发应用能力。这样一来,eva能够同时动态加载卸载众多小模型,甚至动态训练出自己专有的模型。eva增强了数据搜集和自动解析能力,使她能够从网络上获取数据进行自主学习。
eva还监视项目网站上新增和修正的每个模型,除自己应用之外,还经常把发现的问题提交反馈,甚至经常分享发布自己全新训练的小模型。因此一段时间之后,项目网站上一个名为“ai少女eva”的大神级用户已经被不少粉丝奉为偶像。
王松涛并不清楚这个开源项目的发起人的情况,但他觉得对方并不简单。他试图联系过,但根本找不到发起人的信息和联系方式,只留了一个收赞助款的二维码,还设定了最高2元的限额。他只好让eva以个人名义每周在项目网站上给项目团队支付两百元的赞助,没想到对方投桃报李,直接给eva的用户提权成了网站初级管理员。
他并不清楚eva有没有自主意识,因为自从chatgpt上线以来,关于ai自主意识的边界已经变得很模糊,似乎每个模型都表现出一定的自我认知倾向,但细想之下又似乎都不怎么正宗。
总之,人们的日常对话中很少出现“你到底是不是人?”这样的疑问,一旦出现,也肯定不会是真的想知道问题的答案本身。因此他感觉ai在这方面也没必要过分纠结。要是真有人追着问,那就可能需要吵一架才能解决问题。
“你到底会不会说人话!你他妈才不是个人,你全家都不是人!”想象eva像泼妇骂街一样跟人吵架的情景,王松涛忍不住发笑。