“看到一个苹果的图片,能说出它的味道、营养、种植方法;读到一段代码,能自动生成可视化界面;听到一段音乐,能分析出情感基调和和弦走向。”
“这……这需要多少数据?”
一个年轻工程师忍不住问道。
“数据不是关键,架构才是。”
陈阳目光落在他身上,继续道:
“传统的多模态模型,是把不同模态的数据强行拼接在一起训练。我要的架构,是让不同模态的编码器、解码器、中间表示,自然融合成一个统一的‘认知空间’。”
“在这个空间里,文本、图像、语音,都是同一个事物的不同表达方式。”
他调出一张架构图——那是一个立体的、多层次的神经网络,每一层对应一种认知能力,从底层的感知、识别,到中层的理解、推理,再到高层的创造、规划。
不同模态的数据在这个网络中自由流动、相互增强。
“这就是‘开天’的最终形态。”
陈阳的声音在实验室里回荡。
“不是一个工具,而是一个‘伙伴’。它能理解你的需求,能预测你的意图,能创造你想象不到的东西。”
“它不只会回答问题,还会提出问题;不只会执行命令,还会提出建议;不只会学习知识,还会创造知识。”
“我们要做的,不是又一个ChatGPT,不是又一个MidiOUrney。”
“我们要做的,是第一个真正意义上的‘通用人工智能’。它的能力不限于某个领域,不限于某种任务,它可以做任何人类智力能做的事——而且做得更快、更好、更深刻。”
实验室里,所有人的呼吸都急促起来。
他们加入清阳科技,加入“开天”项目,就是为了这个梦想——创造真正的智能。
而现在,他们看到了实现的可能。
“陈总,那接下来……”
陈昊激动地问。
“分三步走。”陈阳竖起三根手指。
“第一,完善‘情境自适应注意力’算法,在三个月的迭代中,将模型效率再提升50%。”
“第二,启动‘跨模态预训练’,用我们自有的数据——清阳金融的金融数据,腾盛娱乐的数据,仙香阁的消费数据,加上公开的互联网数据,训练一个10万亿参数的基座模型。”