第(2/3)页 搜索就是千寻根基性的业务,是真正的命脉,搜索完了,千寻也就完了。 以前不管遇到什么样的危机,罗伯特李其实都没有真正特别害怕过,因为搜索这个领域的护城河太宽太深了。 都说做社交通讯的藤讯护城河深,实际上,很多新兴社交软件都有潜力对藤讯构成威胁,只不过藤讯一直应对得当,敢于自我革命,所以才没掉队。 淘猫更是如此,线上购物更是不存在什么护城河,不用说狗东的步步紧逼,只说现在下沉市场又出来一个并夕夕,就足以让淘猫提高警惕。 而搜索不是,这个行业的护城河太宽了,宽到没有任何一个对手能够跨过,哪怕千寻不去做任何革新,只要搜索这个行业还存在,他就倒不了! 以前罗伯特李真正担心的,是突然出现一个跟搜索完全不搭边的新行业,但这个新行业却降维打击,把整个搜索行业都干没了。 但只要是这个行业、这个赛道之内,无论是什么720搜索、搜苟、必赢……甚至即使古狗回归大周,都不可能对千寻构成真正的威胁。 资源积累所带来的搜索质量差异是一道近乎无从跨越的天堑! 直到一个月前Y搜的出现。 现在千寻已经基本搞清楚了Y搜的原理,发现Y搜根本就没有去尝试跨越天堑,它是从天上飞过去的! 用只需要千寻百分之一的资源,就实现了远超千寻的搜索效果。 这就是获得AI赋能后各个行业的进化吗? 罗伯特李知道AI的重要性,更知道AI真正发展起来后会颠覆多少行业,所以他才坚定不移的投资AI。 但他怎么也没想到,搜索居然是第一个被AI颠覆的行业,更没有想到,AI的实用化居然来的这么快! 柚子科技对AI的应用已经开始实用化了吗? 一个月前,刚刚接触到Y搜的罗伯特李,就感觉到了刺骨的寒冷。 现在看上去千寻的营收与市占还没有受到太大的影响,公司内部仍旧是一片歌舞升平,舞照跳马照跑,绝大部分中层和普通员工仍旧沉浸在自己在互联网大厂打工的梦幻中。 但罗伯特李明白,如果不把Y搜,不,是如果不把柚子科技彻底解决,千寻极有可能一两年内就会暴毙! 因此,月初,在罗伯特李的推动之下,千寻秘密收购了数家专门从事数据业务的公司,又用这些公司,给柚子科技提供了一大批隐含了“特定倾向性”的微调数据。 这些微调数据隐藏的都非常好,而且数量很少,只是非常重复,很容易就能让受训大模型打上“思想钢印”。 只要柚子科技用这批数据对大模型展开训练,那么就会影响到大模型在特定条件下所回答问题的“价值观”。 这些是千寻在橘子大模型1.99的微调训练上已经得到验证的。 就算目前发布的橘子大模型2.5S版本有了更多的进化,但大模型的训练原理不可能有太大变化。 而只要橘子大模型对某些问题做出了“错误价值观”的回答,那千寻强大的公关机器就会全面开动,动用一切力量钉死柚子科技! 就算钉不死,也能通过各种场外招数,拖慢柚子科技的发展速度,一来为千寻争取更多时间,二来逼迫柚子科技退出搜索行业或千寻强行收购Y搜! 毕竟对于很多人来说,已经稳定发展了十几年的千寻,远远比刚刚崭露头角的柚子科技更可信! 尽管这种逼迫方案有可能付出极大的代价,即使强逼柚子科技卖出Y搜,罗伯特李估计最终谈成的方案也不会低于1:2换股。 相当于用四分之一的千寻股份置换Y搜的所有权! 罗伯特李明白,这些只是自己的计划,成功率完全就是未知数,但如果不这么干,千寻就一定会死! “罗伯特,会不会是他们还没有使用这部分数据进行微调训练?目前发布的模型版本是此前迭代的版本?” 新任搜索业务高级副总裁盛斌推了推眼镜,小心翼翼道。 罗伯特李闻言,脸上的肌肉不由得跳了两跳,这的确是一个可能性,如果是这样,说明柚子科技的技术储备已经不知道向前走了多少代。 这无疑是一个更坏的答案。 AI实验室主任黄浩文皱眉摇了摇头:“不可能,他们一定使用了这批数据,我们根据数据集中隐藏的测试项对她们刚刚更新的橘子大模型2.5N版本进行了测试,特定性回答与数据集中的数据相一致。” “这几批数据都是非公开的私有数据集,特征非常明显,他们一定已经使用这批数据进行了2.5N的微调训练,不会判断错。” “目前唯一的问题是,为什么其他的数据都被学习了,但‘加料’的这部分数据却没有。” “如果说他们已经判断出哪部分是‘加料’数据,我是不相信的,在几个G的数据中找出这部分数据,是不可能完成的任务。” “唯一的可能性就是,他们采用了有监督学习的模式,针对于有问题的‘价值观’进行了调整,但有监督学习需要针对数据进行手动标记,效率我们大家都很清楚,不可能这么快完成。” 半夜十二点多,几个人你一言我一语,罗伯特李听得头疼不已,用手按了按自己的太阳穴。 第(2/3)页