会员中心     

量子位2022年十大前沿科技报告PDF

YUFASHAO
V 实名认证
内容提供者
热门搜索
量子 前沿科技
欧亿·体育(中国)有限公司大小:7760KB(压缩后)
文档格式:PDF
欧亿·体育(中国)有限公司语言:中文版/英文版/日文版
解压密码:m448
更新时间:2023/7/18(发布于辽宁)

类型:金牌欧亿·体育(中国)有限公司
积分:--
推荐:升级会员

   点此下载 ==>> 点击下载文档


“量子位2022年十大前沿科技报告PDF”第1页图片 “量子位2022年十大前沿科技报告PDF”第2页图片 图片预览结束,如需查阅完整内容,请下载文档!
文本描述
量子位
2022 十大前沿科技报告
引 言
前沿科技,不仅会带来时代级的变革,也为个体带来了提升自我定位、抢
跑未来增长的机遇。
但只有选准细分领域,才能顺利完成成果转化。
哪些技术能够变革底层,蕴藏着改写欧亿·体育(中国)有限公司的巨大能量?哪些赛道已经跨过
关键节点,身处潜力爆发前夕?哪些机构又将厚积薄发,成为明日之星?
为了解答这些问题,自 2021 年起,量子位智库启动了年度前沿技术趋势
的总结及展望计划,并以年度前沿科技报告的形式对外发布。
今年,基于自身对科技领域的长期跟踪,并结合对 70 余家合作初创公司、
研究院、投资机构的深度访谈,我们提名了 2022 年度十大前沿科技趋势。
从关键数据、技术突破、产业资本动向、重大催化剂等关键角度出发,我
们将在本份《2022 年度前沿科技报告》中对各趋势进行深入分析,并提名
代表机构。
通过《2022 年度前沿科技报告》,量子位智库期待能够从科研、投资、创
业、转化等不同角度,帮助每位更好地把握前沿科技的发展趋势,以及随
之而来的重大变革。
在此感谢深度参与此份报告的科技产业伙伴。此处按照首字母排名,优秀初创公司将在正文呈现。量子位
2022 十大前沿科技报告
目录 前言
01 趋势一
AIGC 技术价值验证:图像及视频生成大爆发
06 趋势二
AI for Science 开启新范式:数据驱动 + 机器猜想重塑多领域科研模式
10 趋势三
新型基因编辑落地:临床试验开启,进入罕见病治疗
15 趋势四
计算生物成为新引擎:医疗健康赛道迎来新型基础驱动力
21 趋势五
异构计算成为共识:新欧亿·体育(中国)有限公司标准明确现有算力最优解
24 趋势六
智能计算架构呼之欲出:新一代芯片探索颠覆冯诺依曼架构
28 趋势七
人形机器人站上硬科技创新高地:跨界思路降低商用门槛
31 趋势八
卫星互联网提速:打开商业航天新象限
33 趋势九
AR 产品消费级落地:提供 XR 和元宇宙增长新潜能
36 趋势十
量子计算落地临门一脚:软件硬件同步加速
其他技术提名
前沿科技投资观点 量子位
2022 十大前沿科技报告
趋 势 一
AIGC 技术价值验证:图像及视频生成大爆发
2022 年被称为“AI 绘画”之年,包括 DALL·E 2、Imagen、Midjourney 在内的多款模型 / 软件证明了基于文字提示得到生动图
画的可行性。随后,国内小冰公司、ZMO.ai、Tiamat、6Pen 等公司受到关注。2022 年中下旬,Imagen Video、Phenaki 等多个
文字生成视频的模型横空出世,再次助推了大众对 AIGC 价值的想象。从文字版本的 GPT-3,到图画版本的 DALL·E 2,再到视频
版本的 Make-a-Video, AIGC 的技术边界正被不断拓展,大众关于其代替人工进行艺术创作的讨论也愈加热烈。
技术原理
AIGC 全称为 AI-Generated Content ,指基于生成式对抗网络 GAN 、大型预训练模型等 AI 技术生成相
关内容。在模态上可划分为文本、音频、图像、视频、策略和跨模态生成等。在量子位智库的《 AIGC
深度产业报告》中,我们认为“生成”和“内容”都应该采取更为广泛的概念。例如,“生成”中应当
包含基于关键词的部分生成、完全自主生成和基于底稿的优化生成。而“生成”的对象,应当不仅包括
常见的图像、文本、音频等显性内容,还包括策略、剧情、训练数据等内在逻辑内容。
《AIGC 深度产业报告》
以下为我们近期重点关注的三类单模态生成技术。请扫描二维码
AI 作曲可以理解为“以 Transformer 等语言模型为中介,通过 MIDI 等转化路径对音乐数据进行双向转化”。
AI 编曲则指对 AI 基于主旋律和创作者个人的偏好,生成不同乐器的对应和弦,完成整体编配。在这部分中,各乐器模
乐 / 歌曲生成型将通过无监督模型学习主旋律和特定要素间的映射关系,从而基于主旋律生成自身所需和弦。
GAN:Generative Adversarial Nets,生成式对抗网络。
扩散模型 Diffusion Model:首先增加噪声破坏训练数据,随后由 AI 寻找如何逆转噪声过程以恢复原始图像。一旦经
过训练,扩散模型就可以应用这些去噪方法从随机输入中合成新的“干净”数据。知名模型包括 Guide Diffusion、
Disco Diffusion、DALL·E2
图像生成
神经辐射场模型 NeRF:将场景表示为隐式的神经辐射场,渲染时 AI 将通过神经网络来查询各位置上的场景信息,进
而生成新视角图像。从效果来说,NeRF 利用深度学习完成了计算机图形学中的3D 渲染任务。
其原理本质与图像生成类似。区别在于视频生成会先将视频切割成帧,再对每一帧的图像进行处理,最后将各帧对应
的合成数据进行整合,并进行整体调试,以确保每一帧之间的流程度及真实度
视频生成
1量子位量子位
2022 十大前沿科技报告 2022 十大前沿科技报告
基于对场景的理解,我们将 AIGC 适用的业务场景整理如下:
由 OpenAI 推出,CLIP 模型+Diffusion 模型
DALL·E 2 相对于第一版 DALL·E 整体绘画水平有明显提升,画质提升为之前的四倍,并支持
更细粒度的文本—图像生成功能(类似部分 P 图),渲染时间从数小时提升到了不
足一分钟
Imagen AI 由谷歌推出,基于纯语言模型(T5-XXL)开发,由图像生成模型完成文本到图像的
转换工作。在写实场景上似乎表现更为出色
百度文心能够基于中文输入产生中国风等不同风格画作,即将开放高级自定义功能
能生成1280*768 分辨率、每秒 24 帧的视频片段,在demo 中仅需两分钟就能够基
Imagen Video于几百个单词组成视频。还能够理解并生成不同艺术风格的作品、理解物体 3d 结构、 在延展领域的应用中,量子位最为看好的是个性化内容营销领域。该部分主要是指由 AI 生成系统与底层的客户数据系统 / 营销效
仅靠简单描述产生各类创意动画等 果反馈系统进行数据联通,实时根据相关数据调整生成需求,有助于实现营销材料的实时更新和超个性化。代表性机构包括图像
领域的 Rosebud.ai 和 Generated Photos,以及文本领域的 Persado、Rephrase.ai 等
Phenaki特点在于逻辑能力强,能根据 200 个词左右的提示语生成 2 分钟以上的长镜头,讲
述一个完整的故事
我们会觉得 AIGC 未来是会进入辅助兴趣社交的领域。AI 能够帮助对兴趣基础不同,但是同样有兴趣的人,在同样的门槛上去进行交流。另外一个,
我们希望 AI 做的事情并不是直接生成出来大量的内容,去和现在的存量内容做各种各样的抗争。我们觉得更重要的还是 AIGC 是要帮助每一个人根据
Transformer 架构的跨界应用开启了跨模态学习,而 CLIP 模型,由于能够测定图片与文本描述贴切程度,已经通过和其他模型的 他自身的经历,根据他自身的想法去探索,这个是最大的价值。
结合成为目前跨模态生成的核心工具之一。以 Disco Diffusion 为例,该模型将 CLIP 模型和用于生成图像的 Diffusion 模型进行了 ——Deepmusic 灵动音科技
关联。CLIP 模型将持续计算 Diffusion 模型随机生成噪声与文本表征的相似度,持续迭代修改,直至生成可达到要求的图像。
跨模态大型预训练模型的代表包括:微软亚洲研究院 NUWA-Infinity、阿里巴巴达摩院 Modelscope ,百度文心 ERNIE-ViLG 2.0、
中科院“紫东太初”等等。 在图像这个领域上, 实际上还有很多待解决的技术问题与工作流程的问题, 以游戏欧亿·体育(中国)有限公司举例 , 实际上欧亿·体育(中国)有限公司中需要的图像质量与现在流通甚广的大模型
质量相差甚远 , 而美术部门真正需要的可解释和设计复杂程度也非单独大模型可以解决 , 甚至于欧亿·体育(中国)有限公司客户自身的需求与 AI 的能力也是高度耦合的 , 需
要一同磨合打磨出真实可用的 AI 工作流程 , 才能嵌入产业链当中, 实际上满足客户需求。
本质上讲, AIGC 的兴起要归结于大模型(预训练模型)技术的出现。以 GPT-3 为代表的模型,由于是闭源的,国内外多家机构进行了不同规模的复现, ——Tiamat
也有少量复现出来的模型进行了开源,让公众能够有机会接触到这项技术。这种迁移学习技术推动了 NLP 发展,用基于预训练 + 微调的一套技术解
决不同的 NLP 任务。
但由于 GPT 的效果对模型规模有一定要求,导致虽然有了第三方开源的模型,也只有少数有一定技术实力的公司能够基于它进行产品化研发。首 未来发展
先,和 GPT-3,或者 DALL-E 和 Imagen 这样的文图模型相比,Stable Diffusion 这个模型一开始就选择了开源,让所有人都有机会接触到。其次,
这个模型的规模相比于 GPT-3 小很多,能够在消费级显卡甚至手机上运行。这两个因素让它迅速破圈,进入到商业美术从业者的视野。由于 Stable 我们认为以下要素,都将成为推动 AIGC 产业落地的要点:
Diffusion 几乎“零槛”,宛如核弹图纸和材料一下子变得触手可及,让商业美术的格局发生了巨大变化,相关 AIGC 的产品竞争直接进入白热化阶段。 o AIGC 技术能力的成熟
——澜舟科技 o 产品形态的成熟:包括低代码 / 零代码等低门槛要求、符合创作者的使用习惯等,例如,能够中途及时介入修改、多重形式
的 prompt、有充足的介入接口
推荐理由 某些垂直领域模型的能力还有待提升,从而去优化 AIGC 在专业领域的专业技巧,以及优化 AIGC 的交互能力,比如在美术创作中如何更好的把握透
量子位智库将 AIGC 产业的价值归纳为以下五点。 视关系,在对话模型中如何让 AI 在交流是拥有记忆且运用这些记忆等等。此外从事 AIGC 的前沿技术公司需要和应用侧的公司紧密合作,真正进入到
AIGC 在产业应用层面的生产流程中去,更积极地了解应用领域的输入输出标准和质量要求,让技术能够更好的在实际生产过程中落地。以启元世界
o 降低内容创作门槛,增加 UGC 用户群体
o 为例,我们在做 AIGC 的的时候,都要求自己和业务方紧密合作,了解合作伙伴的生产流程、评价标准、需求支持,从“解决实际问题”的角度出发,
提升创作及反馈效率,铺垫线上实时互动让 AIGC 的技术更加落地。
o
基于海量数据得到强创造性和开放性,有

版权所有: 欧亿·体育(中国)有限公司©2025 客服电话: 0411-88895936 18842816135

欧亿·体育(中国)有限公司