Frontier¶
Collected by Jianan, 2022. 本章节会实时收录全球科技动态。部分文字从原文直接引用,如有侵权,立即删除。本文仅供个人参考学习,不作商业用途。
1216 Robotics Transformer¶
谷歌机器人团队等提出了 Robotics Transformer 1 (RT-1)
-
输入:相机中获取瞬时图像以及以自然语言表达的任务描述
-
输出: tokenized 动作
图像 tokenization。该团队通过在 ImageNet 上预训练的 EfficientNet-B3 模型传递图像,然后将生成的 9×9×512 空间特征图展平为 81 个 tokens。图像 tokenizer 以自然语言任务指令为条件,并使用初始化为身份的 FiLM 层在早期提取与任务相关的图像特征。
动作 tokenization。机器人的动作维度包括手臂运动的 7 个变量(x、y、z、翻转、俯仰、摇摆、打开夹具)、3 个基本运动变量(x、y、摇摆)以及一个在控制臂、控制 base 或终止 episode 三种模式之间切换的额外具体变量。每个动作维度被离散化为 256 个 bins。
1212 高性能Python编译器Codon开源¶
作为高性能 Python 编译器,Codon 可将 Python 代码编译为本机机器代码,而无需任何运行时开销。在单线程上,Python 的典型加速大约为 10-100 倍或更多。Codon 的性能通常与 C/C++ 的性能相当。
注意是类python的语言。codon编译的性质决定了python某些动态的功能无法被支持。
1214 LLNL实验室可控核聚变点火成功¶
目前的核聚变反应堆,通常使用以下两种方法来产生所需的热量:
- 磁约束反应堆(托卡马克环形反应堆),除了辅助热源外,还会使用磁铁来加热和容纳氢原子;
- 基于激光的系统,则使用大量的激光脉冲来轰击氢原子。
托卡马克装置的工作原理是,加热到超过1亿摄氏度时,会产生旋转的氢同位素等离子体,它们将会碰撞,而产生聚变反应。超级磁铁产生的磁场随后会将等离子体包含起来,以防止其破坏反应堆。
而两种反应堆的最大区别,在于聚变反应所需的时间。
磁反应堆可以使聚变过程持续更长时间,但需要更多的能量。
相比之下,基于激光的反应堆,可以让核聚变在很短的时间内发生,而且现在已经一定程度上跨过了净能量增益的门槛。
1203 PyTorch 2.0 发布,一行代码提速 30%¶
什么是 torch.compile?
- 是Pytorch的一个新特性,将 PyTorch 的部分实现从 C++ 中迁移到 Python 中。
如何使用 torch.compile ?
- 只需使用 torch.compile 对模型进行编译,就可以享受 PyTorch 2.0 给模型速度带来的极致提升,简单示例代码如下:
python
import torch
import torchvision.models as models
model = models.resnet18().cuda()
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)
compiled_model = torch.compile(model) # 关键一行
x = torch.randn(16, 3, 224, 224).cuda()
optimizer.zero_grad()out = compiled_model(x)
out.sum().backward()
optimizer.step()
-
运行效率如何?
-
PyTorch 团队在 163 个开源模型(包括图像分类、目标检测、图像生成等领域)进行验证,结论是模型在 NVIDIA A100 GPU 上的运行速度快了 43%。
0403 DARPA 可解释人工智能(XAI计划)的四年总结¶
可解释人工智能的概念最早来自于美国DARPA(美国防部高级研究计划局),2017年,为期4年的XAI研究计划启动。作者:David Gunning, Eric Vorm, Jennifer Yunyan Wang, Matt Turek
“可解释人工智能”(XAI)项目旨在创建一套机器学习技术:
- 产生更多可解释的模型,同时保持高水平的学习成绩(预测准确性);
- 使人类用户能够理解,适当地信任并有效地管理新一代人工智能合作伙伴。
该计划分为三个主要技术领域(technical areas,TAs),如图 1 所示:(1)开发新的 XAI 机器学习和可解释技术以产生有效的解释性;(2)通过总结、延伸和应用可解释心理学理论,来理解可解释心理;(3) 在两个挑战问题领域评估新的 XAI 技术:数据分析和自主性。
学习表现和可解释性之间似乎存在一种自然的矛盾关系。然而,在整个计划过程中,我们发现了可解释性可以提高性能(Kim et al. 2021, Watkins et al. 2021)。从直观的角度来看,训练系统以产生解释,通过额外的损失函数、训练数据或其他机制来提供额外的监督,以鼓励系统学习更有效的世界表征。虽然这可能并非在所有情况下都是正确的,并且在可解释的技术何时将具有更高性能时仍有大量工作要做,但它提供了希望,未来的 XAI 系统可以在满足用户解释需求的同时比当前系统具有更高的性能。
0107 Web 3.0¶
Web 1.0
Web 这个概念最早诞生于1989 年欧洲粒子物理研究所的一项研究中。当时,为了方便全球的研究人员能在不同计算机之间共享和更新信息,英国科学家Tim Berners-Lee提交了一项关于“在全球范围内建立超媒体信息检索系统”的提案,并将这个系统命名为World Wide Web(万维网)。其设想是,互联网上的资源可以在一个网页里比较直观的表示出来,而这些资源可以在网页上相互链接。但这些信息是静态的、只读的,用户只能是观众,并无法参与其中。
Web 2.0
Web 2 最早由信息架构咨询师Darcy DiNucci在1999年撰写的文章《Fragmented Future》中首次创造,在这篇文章中她提出:“我们现在所知道的 Web 基本上是以静态形式被加载到浏览器窗口中,但这只是未来 Web 的雏形。未来的网络不再只是满屏的文本,而是一种会产生实时交互的传输机制。Web 2.0是一种新的互联网方式,其模式将更以用户为中心,将允许用户作为内容的创建者,并通过社交媒体进行交互和协作。
Web 3.0
2014年,以太坊联合创始人Gavin Wood在自己的一篇博客《Insights into a Modern World》中首次明确提出了Web 3.0这个概念,提出了一种全新的互联网运行模式:信息将由用户自己发布、保管、不可追溯且永远不会泄露,用户的任何行为将不需要任何中间机构来帮助传递。
Web 3将是一个不会依赖任何中心组织、完全由用户掌控的时代。它的到来将彻底打破现在科技巨头的垄断,改写当前数字经济的运行方式,并引发大量自下而上的创新。随着数字货币、NFT、元宇宙等全面爆发,越来越多的人开始参与到去中心化、虚拟身份、加密货币的讨论之中,也顺势点燃了科技界和投资界对于Web 3的热情
元宇宙的本质就是一个不间断运行的、去中心化的虚拟社会系统,它的理念跟Web 3一脉相承,而Web 3就是元宇宙持续运行的基石。