昆仑万维方汉:大模型的技365买球在线术红利在消退商业模式创新者将成赢家
发布时间:2024-12-30 21:44:10点击:
买球官网买球官网诚如大家所看到的那样,即便是OpenAI这样的“顶流”刚发布了Sora,也未能对其他视频生成模型造成碾压性的冲击。
但遥想最初ChatGPT发布之际,不仅在全球范围内掀起一股技术新浪潮,更是吃了足足一年半以上的技术红利。
而就在前不久的MEET 2025智能未来大会中,昆仑万维董事长兼CEO方汉便针对这个问题给出了他的答案:
AI大模型SOTA(State of the Art)的技术红利变得越来越短暂,也将逐渐消退。AI大模型产品需要关注“新”与“好”,商业模式能够创新者将成为真正的赢家。
在现场,方汉基于昆仑万维自身发展和入局大模型多年的经验,以《智能边界:AI大模型如何推动应用创新》为主题分享了他的所见所闻、所思所想。
MEET 2025智能未来大会是由量子位主办的行业峰会,20余位产业代表与会讨论。线+,线万+,获得了主流媒体的广泛关注与报道。
各位尊敬的来宾,大家好,我是昆仑万维的方汉,今天我来跟大家分享一下,我们公司在AI大模型这一波浪潮中间,从技术到产品,我们的动作和我们对产品的思考。
昆仑万维公司2008年成立,主要在中国做网络游戏的研发,2015年上市之后开始转型做出海互联网平台。
从2015年到2020年,主要是把国外老的互联网厂牌通过中国人强大的运营能力做大做强,其中包括全世界第三大浏览器Opera,还有海外的K歌软件StarMaker等,都取得了很好的成绩。
从2020年开始,我们开始做AI方向的大模型研发。2022年12月,我们发布了国内开源的第一个13B的中文预训练大模型。
目前我们有三大业务板块,AGI与AIGC业务、信息分发与元宇宙业务、投资业务。
我们在全球大概有4亿月活跃用户,海外收入占比89.7%。在全世界100多个国家和地区都有业务,在20多个国家有我们的办公室。
我们从硬件算力层到模型层到应用层都有投入,其实我们最关注的还是模型层与应用层。
在模型层,我们有语言大模型、多模态大模型、3D大模型、视频大模型、音乐大模型。
目前技术指标最好的是音乐大模型,这是国内目前唯一一家能够跟国外音乐大模型Suno相媲美的音乐生成大模型365买球在线。
2022年12月我们在开源了13B的中文预训练大模型之后,2023年4月发布了一个千亿的天工1.0大模型。
2024年4月,我们发布了天工3.0,其中音乐大模型取得了行业SOTA。
2024年11月20日,我们发布了天工4.0 4o版和端到端的实时语音对线。我们的天工4.0 4o版本,端到端实时语音对话系统,主要是把语音对话模型的时延从原来外挂式的400毫秒降到100毫秒,这个对于C端应用是至关重要的。
天工4.0 o1版本是国内第一款具有中文逻辑推理能力的o1模型,其中一个系列也
这是我们的业务矩阵,在国内主要做AI搜索业务,在海外有AI游戏、AI音乐、AI短剧和AI社交等业务。
,它是全球首个集成视频大模型与3D大模型的平台。值得注意的是,Sora已经正式对外发布了,但是你们可以看到,Sora本身还是一个生成式模型。
国内的生成式模型有一个问题,用它来做实际作品的时候,要有一个很经典的动作,术语叫
,就是同一个场景要用同一个prompt可能要生成10个甚至上百个视频,从中间抽出一个可用的视频。也就是说,可控性是一个非常亟待解决的问题。我们走的路线D大模型进行生成,再通过视频大模型进行转绘,这样可以做到
,这个对于视频创作者来说把可控性大大提高了,不仅能够极大降低用户的使用成本,甚至还能极大地降作时间。
AI音乐的大模型使用的数据量将近2000万首训练数据,众所周知,人类有史以来总共才有4000万首音乐,我们大概用了一半的数据量365买球在线。
目前我们在海外有面向C端的流媒体音乐平台Melodio和面向B端的创作平台
因为我们在海外做的业务非常多,现在全世界的AI创新企业只有中国和美国是最多的,但是中国的AI创业企业能够拿到的融资与美国同行相比,少非常多。
可以看到,海外AI创业公司还有一大部分在做基础架构,它们的B端应用,在医疗健康、法律、金融等方向比较多,中国企业反而可能2C、2B都比较多。
此外,Scaling Law到底有没有放缓?争论点非常多。但我觉得能够看到一个很明显的事实。
GPT3.5出来之后震惊全球,它的红利至少持续一年半以上,但是像Sora正式发布后,我看到很多评测对其提出了批评意见,比如,图生图做得比较差、人脸都生成不出来、文生图的可控性不好。
也就是说,Sora在正式发布之后,并没有表现出对同类的其他一些视频生成模型的碾压式的技术优势,这样导致了Sora的技术红利能不能像ChatGPT3.5那样持续很长时间?或者像Dalle3那样压根没有吃到红利?
在文生图时代,做得最好的是OpenAI的Dalle3,但是由于种种原因,最后市场上吃到红利的其实是Midjourney和Stable Difussion。
中国的AI企业,除了拿不到更多投资,还存在一个问题,在算力上受到极大限制。我们能拿到硬件的算力是比较有限的。这样会倒逼两点。
首先,中国企业在算法迭代上有极大的动机和投入,例如,Sora第一版本训练用了将近5000—8000张卡,到中国第一个可用的视频生成模型算力是花了不到1000张卡,最新的一个开源生成模型可能只花了256张卡。
中国团队在算法的优化和迭代上所花的精力应该是美国同行的很多倍,因为没有办法,没有卡,
同时,中国企业还有一个巨大问题,生存压力特别大。一部分AI企业得不到更多资金,另一部分AI企业即便能拿到资金,投资人对企业盈利的时间点和商业模式都有极高要求,
大家可以看到,现在在全球市场上疯狂买量的AI企业一定是中国企业,因为所有的中国企业都在拼命地打磨自己的产品的盈利模式,而不是像美国同行一样有充足的资金去做更深层的工作。
还是以Sora发布为例,大家可以看到,Sora有一篇PR稿件标题叫《尼日利亚的Minna》,这是一个KOL,他用Sora创造了一个质量很好的视频。
正巧我也在尼日利亚待过很长时间,据我了解,在尼日利亚拍摄一部电影的平均成本大概是10万美金,不到100万人民币,这样导致尼日利亚当地根本没有能力创造出与美国电影,不要说美国电影,甚至连印度电影都比不上的一个高质量的内容。
所以像尼日利亚这样的亚非拉国家,他们能看的电影只有美国大片,为什么?因为美国大片平均的制作成本在1亿美金以上。
那么,中国的大片什么时候能与美国大片正面PK?何时赶上美国?中国的电影,票房上10亿之后、单部拍摄成本上亿之后,中国的电影才可以正面与美国电影PK。
到《流浪地球》这个级别,它的视听效果与美国相比已经没有差别了。这一切本质上都是用资金换来的。全球其他国家如果没有这个资金,就只能看强势文化的电影。
但是有了AIGC之后,包括内容生成,我相信以后单部大片的投资,从1亿美金的制作成本很快可以降到几百万人民币,甚至几十万、几千元人民币,这都是非常有可能的。
这样的结果导致所有国家、所有弱势文化地区都可以用AI技术来制作本国的内容。
与TikTok一样,全世界人民都是用手机创作属于自己的内容文化。我们认为AIGC技术的进步会极大降低所有人创作内容的门槛和所有人创作内容的成本。
这样全球创作者的规模,包括电影创作者、音乐创作者、电视创作者、短剧创作者都会急剧扩大,这对中国平台型企业而言一定是非常大的优势,这个过程中也会涌现下一代内容平台。
大家知道,去年AI公司里薪酬最高的是算法工程师,这个与我们最早进入互联网时代的时候一模一样,1995年一个程序员会写HTML,每个月可以挣一辆奥迪出来。
但是今天一个程序员只会HTML,每个月连一个车轮子都挣不出来,这就是技术的迅速弱化。
中国互联网最后真正赚到钱或者成长为巨头的企业,大部分都是靠商业模式创新取得了成功。
对于用户,他们根本不关心你的内容是AI做的还是人做的,只关心两个点,内容要么新,要么好。
例如,众所周知《黑神话》,这个游戏的质量非常高,花了几亿元人民币的成本、工业化的生产,创造出全世界一流的内容,这就是“好”。
对于其他没有这么多资金投入的企业来说,你的内容用户怎么会买单?那就要“新”。
再举一个例子,同样是游戏领域,像重庆有一家公司,5个人,100多万投入,最后做了一个戴森球计划,卖了8亿,就是在内容的形式上进行了创新。
要关注你产品的形态是“新”还是“好”,这样用户才会买单。对于大多数AI创业企业来说,产品形式上的创新才是击中用户的根本点,而不是说是不是AI、AI用了百分之多少。
对于所有AI创业企业来说,当下都处在比技术、比指标的阶段。我觉得绝大多数AI产品都是偏工具类的软件。在打造工具类产品时,一定要思考整个产品的宗旨是什么。
例如,在手机刚刚出现的时候,有很多企业做了很多视频工具、美颜工具,其中有一家做工具类产品的公司,最后成长为中国的一个短视频的巨头,他的产品叫“GIF快手”,就是把视频可以转成动画Gif,好在论坛上、聊天上去传播。
基本上对于所有AI公司都一样,要么去卷通用人工智能,要么通过AIGC为消费者创作更好的内容,让消费者可以通过AI降低创作内容的门槛和创作内容的成本,更好地塑造和表达自我。
4岁小女孩在医院大厅角落,静静等待上厕所的爸爸,然而,直至去世,她都未等到
运动员吴柳芳账号被禁言365买球在线,抖音集团副总裁李亮回应:分歧很大,根据相关法律法规与指导要求执行好
乌媒:拜登就俄方对乌发动“圣诞袭击”发声,指示五角大楼继续扩大对乌武器供应
LOL-德杯:“积分王”Hope火力全开,AL 3-1击败WBG晋级决赛