新闻资讯

News

联系我们

Contact Us

 

电话: 0769-81700518-8019

传真: 0769-27200904   

邮箱: 8019@charetec.com

销售工程师: 安小姐 Anna

服务热线: 18098232339

香港总部: 香港九龙旺角道33号凯途发展大厦7-03

东莞分公司: 广东省东莞市石龙镇现代信息产业园3F-A07/08

 

您现在的位置: 首页 新闻资讯 行业资讯

行业资讯

力特TVS管, -微软和英伟达推出语言模型 MT-NLG

来源:    作者:    发布时间:2021-10-12 14:16    浏览量:17

保险丝,力特TVS管,自恢复保险丝,力特保险丝座,压敏电阻,ESD,数据线销售

东莞市长淞电子科技有限公司      咨询热线:0769-81700518
 
  10 月 12 日消息 语言模型(Language Model)简单来说就是一串词序列的概率分布,主要作用是为一个长度为 m 的文本确定一个概率分布 P,表示这段文本存在的可能性。
 
  大家之前可能或多或少听说过 GPT-3,OpenAI 最新的语言模型,堪称地表最强语言模型,也被认为是革命性的人工智能模型。除此之外还有 BERT、Switch Transformer 等重量级产品,而且业内其他企业也在努力推出自家的模型。
 
  微软和英伟达今天宣布了由 DeepSpeed 和 Megatron 驱动的 Megatron-Turing 自然语言生成模型(MT-NLG),这是迄今为止训练的最大和最强大的解码语言模型。
 
  作为 Turing NLG 17B 和 Megatron-LM 的继任者,这个模型包括 5300 亿个参数,而且 MT-NLG 的参数数量是同类现有最大模型 GPT-3 的 3 倍,并在一系列广泛的自然语言任务中展示了无与伦比的准确性,例如:
 
  完成预测
 
  阅读理解
 
  常识推理
 
  自然语言推理
 
  词义消歧
 
  105 层、基于转换器的 MT-NLG 在零、单和少样本设置中改进了先前最先进的模型,并为两个模型规模的大规模语言模型设定了新标准和质量。
 
  据悉,模型训练是在基于 NVIDIA DGX SuperPOD 的 Selene 超级计算机上以混合精度完成的,该超级计算机由 560 个 DGX A100 服务器提供支持,这些服务器以完整的胖树(FatTree)配置与 HDR InfiniBand 联网。每个 DGX A100 有 8 个 NVIDIA A100 80GB Tensor Core GPU,通过 NVLink 和 NVSwitch 相互完全连接。微软 Azure NDv4 云超级计算机使用了类似的参考架构。
【共有0条评论/我要评论】【收藏本页】【】【打印】【关闭
查看更多

最新评论

快速评论

标 题:
姓 名:
内 容:
(必填)

相关新闻

保险丝 保险丝座 汽车保险丝 插片保险丝 贴片保险丝 自恢复保险丝 力特tvs管 陶瓷管保险丝 保险丝盒 保险丝夹 汽车保险丝座 陶瓷气体放电管