网站首页
有图版
精简版
剪贴板
新剪贴板
找剪切板
文章分类
知乎盐选(4805)
微信公众号(142)
知乎问答(58)
知乎专栏(6)
历史资料(43)
Other(1)
其他(2)
按年份排列
在线云词
视频资源
股市复盘
食品资料
About
🔍 全站智能检索
×
准备就绪,请输入关键字开始检索...
您当前的位置:
首页
>
知乎问答
ChatGPT 有多高的技术壁垒?国内外除了 OpenAI 还有谁可以做到类似程度?
知乎问答
2023年02月14日
318 次阅读
阅读原文
正在统计字数...
核心导读
我师弟印象很深的一件事情
我师弟印象很深的一件事情:当时在阿里做NLP的时候,BERT刚出来,参数规模base版本的1亿多一点,大家都觉得可以搞,然后弄得不错。后来没俩月同规模的GPT-1也出来了,当时就说能根据命令生成文本,所有人都觉得是扯淡,而且效果确实拉。后来几个月,参数规模越来越大,大家都觉得堆参数是想拟合全宇宙吧,肯定没卵用,于是所有人都只弄1亿多规模的模型。不去做更大的模型有很大一部分原因是当时的显卡显存也就12G,1亿参数刚好能弄个十几二十batch的数据开始训练,模型再大就爆显存了。当时看着那些发布的几十亿参数的模型,第一反应就是:人家有TPU。所以脖子应该是更早做汉芯的时候就卡住了。几十年急功近利追求弯道超车,其实弯道的时候翻车更多。甚至可能被卡的更早。在国内国际显卡技术差异不大的年代,那时候显卡主要用来打游戏,结果一纸《电子海洛因》的禁令让国内显卡行业陷入停滞,等发现显卡能用来加速深度学习这个”严肃“的应用场景时,再追赶已经晚了。总之,你对市场的干预和限制越多,市场给你的惊喜就越少,经济学规律是公平的。我再补充一点和游戏有关的。现在自动驾驶的一个卡点在于仿真数据生成,目前的仿真大多还是回溯和搜索真实路测记录的数据,为什么不直接根据障碍物和车辆的参数生成呢?因为担心这种方式生成的数据,其中P图的痕迹会被模型学进去。但特斯拉最近是准备大力解决这个数据生成问题的,为此可能计划收购一家3D游戏公司。如果能够通过游戏引擎大量生成不同Corner case下的数据用于决策AI的训练,会让自动驾驶的迭代速度提升很多。这又是一个游戏反哺工业的例子。但在国内,有游戏公司敢花大力气做这种高成本游戏吗?版号批不下来血本无归怎么办?很多人认为我这个回答是说硬件是瓶颈/壁垒,其实我真正想表达的是,不必要的干预在前期所带来的某项成本的微小提升,可能会直接影响到技术路径的选择和演化,这个效应不断被放大,最后造成天壤之别的结果。很多人理解的研发过程:算力有瓶颈,我们研究软件架构的优化,2年左右出成果。实际的研发过程:18年预训练模型方兴未艾,我们加大参数,看一下效果怎么样。结果发现算力是个瓶颈,A公司因为有免费的硬件资源,稍微加了一点算力(比如评论区有人提到微软早期对openai的投资是发放了azure几亿美元的使用券),出了一版结果,B公司还得找采购新增预算(大公司里预算需要在前一年年底申请,中间增加手续非常麻烦,而且经常不给批),不如换个方向尝试。实际上18年预训练模型方兴未艾的时候,那个时间点大家都在堆硬件。A公司和C公司堆完硬件,效果都很差,然后开始改进语料质量。A公司能获得的语料本身质量没那么差,加一点人力一点点优化了,B公司因为在某个国家,语料质量很差,信息密度低,不是废话就是要上下文才能理解的越南。A公司发现改进语料质量后,模型效果略有一点点提升,于是继续,C公司发现改进语料这件事本身成本比较高,这个方向未来前景还不明确,考虑到ROI,换到别的方向。因为语料质量的改进,A公司发现提高训练样本所带来的模型收益是递增的,为了解决更大样本的训练问题,开始单机多卡和多机多卡。D公司也开始这么搞,但因为用的云服务商不同,多卡的通讯效率跟不上,经常花很多钱,占了多张卡,每张卡的产能都不到一半,速度也没有提升,云服务商也不允许D公司进他们机房把多个GPU直接挂在一根总线上。D公司想想,还是用已有的技术积累去做别的了。A公司因为能始终看到模型效果的提升,对这个方向的信心更加坚定,开始考虑商业化的问题,为了提升ROI,开始投入人力优化软件架构,进一步增加了壁垒和护城河。A公司走到了最后,产品上线引起广泛关注,某国的B、C、D公司的集团SVP发话,要全力跟上,并表示在对应方向上其实早有布局。因为A公司已经蹚出了一条可行路径,所以软件架构优化、语料的筛选和清洗、硬件的提升都同步进行,高速协调了多个部门。一些创业公司也拿了一笔钱,准备进入这个赛道。这时候监管部门发文说所有相关服务都必须先审批,BCD都是很大的公司,有专门的政企关系GA部门,有法务做合规和兜底,创业公司只有几个会点技术的工程师,于是作罢。于是BCD很快也推出了相关服务,当然返回结果经常是“根据本国法规,请换个问题”。这时候监管部门正在开会调研“怎么反垄断,怎么释放初创公司的创新活力”。
赞赏本篇 (
16
)
核心标签:
经济
上一篇:
用智能手机的原始人
下一篇:
我在陆军工程大学的岁月(G,X,G) - 知乎
猜你喜欢
基于 4C 理论的亚马逊购物网营销策略研究
摘 要:随着互联网技术的发展,电子商务迅速发展,网络购物已经走进了千家...
资本家已经拥有大量资产了,为什么还要剥削无产阶级?
如果大家认为...
缅甸北部有多黑暗?
我被我的男朋友亲手送到了他们的缅北基地,在这里我仿佛看到了地狱。...
索罗斯做空中国要花多少钱?
可能再多的钱都不能实现这个想法了,...
你听过最毁三观的故事是哪个?
我一合租室友,26 岁小姑娘,特别漂亮,为了钱,竟然和 53 岁的房东...
财政的“钱”去哪了?
打开财政支出的黑箱...