第7章 这究竟会训练出个什么玩意儿?(1 / 2)

科技无垠 辰小序 4376 字 2023-05-22

“chatgpt你知道吧?‘言心’也是一个语言模型,跟chatgpt的差别就是,相比之下,‘言心’更擅长中文语料。”

这个话题一旦展开,是怎么也绕不过去现今大火的聊天机器人chatgpt的,chatgpt推出2个月即拥有1亿月活用户,在消费者应用程序里,它是历史上最快达到这个数字的。

如今,它就是聊天机器人的标杆产品,火的一塌糊涂。

“chatgpt的三代模型的核心架构都是transformer,从本质上讲,它依然是基于海量数据的延伸,并没有新的颠覆性技术,也没有从本质上超出现有的技术。”

说起chatgpt,程旭对此很不以为然——现阶段,人工智能的理论并没有新的进展,谁强并不是强在理论先进、技术高超上,而是强在硬件实力、强在算力堆积上。

换句话说,就是钱——就拿chatgpt来说,它训练一次几乎就差不多需要三千万人民币以上的资金。

更别说每年的运营,据估算,每年仅是cpu和gpu的成本就能达到十亿人民币这个级别,再加上其他的费用,这真的不是一般企业能够承受的住的。

哪怕是千寻这样的巨头搜索企业,搞出“言心”这个语言模型,也是持续投入了十年以上,每年的投入几乎是整个千寻科技利润的五分之一——这绝对是一个惊人的数字。

“但微软是真的舍得投钱啊,十亿美金十亿美金的,钱跟不是钱似的往里投资。”

说着的时候,潘正甚是羡慕:“他们甚至给openai团队配了一台性能极为强悍的超算,看着就让人眼红。”

“千寻科技的投入也不差吧?而且以后肯定还会越来越重视。毕竟现在gpt已经开始集成到bing搜索引擎,未来肯定是要发力的。

“而搜索引擎,这可是千寻科技的核心业务、甚至可以说是根基所在。bing未来在国内肯定是要跟千寻搜索直接竞争的,千寻也绝对不会无动于衷的!”

要说chatgpt这种极为强悍的聊天机器人出现对谁的影响最大?

那当然是搜索业务,它对搜索引擎的影响简直就是颠覆性的。

相比于传统的搜索引擎来说,拥有极致的语言处理技术和语言理解能力的chatgpt简直太超前了!

它与用户直接对话,用类似于人与人交互的方式进行搜索,而不是传统的关键词匹配。

这种搜索得出的结果更加直接、快捷,也更加容易使用,甚至直接放到论文里都没问题,查重都查不出来。

更有甚者,程序员给它描述需求,它能直接生成可用的代码——它对语言的理解能力已臻于化境!

而这对于千寻搜索来说,肯定不是什么好消息。

而“言心”模型,程旭印象中,“言心”好像是确实出了什么问题,好像还闹挺大的。

原本说是三月上线,三月是上线了,不过更多的是局限于商业合作伙伴,比如各类媒体、地图、房产等大型的合作伙伴——提供智能化的检索服务。

但对个人的开放一直在断续出问题,从三月上线开始,直到224年中旬,一整年都没消停。

好像是模型的训练出了什么问题,但这其中究竟发生了什么,程旭也没有过多的关注。

“千寻确实花了不少钱,投资也数十上百亿了。”

潘正没有否认程旭的说法,这些东西都已经是公开可求证的了,不过,随后他便微微摇了摇头:“但是现在有点儿,坏了!”

“坏了?”

程旭有些不解,坏了是个什么概念?有这个术语吗?

“难道是寒武纪受到限制,训练卡和推理卡都不能及时供应得原因?”程旭有些不解,这是有些影响,但按理说,这还影响不到当前的上线。

举报本章错误( 无需登录 )