生成式AI备忘

  |   0 评论   |   0 浏览

背景

Generative AI

2020年,生成式AI做为新增技术热点,首次被Gartner提出。

生成式AI是什么

[2]

对于生成式AI,Gartner这样定义:通过各种机器学习(ML)方法从数据中学习工件的组件(要素),进而生成全新的、完全原创的、真实的工件(一个产品或物品或任务),这些工件与训练数据保持相似,而不是复制。

简单理解,生成式AI就是利用现有文本、音频文件或图像创建新内容的技术。使用生成 AI,计算机检测与输入相关的基本模式并生成类似内容。

核心技术 GANs

[2]

生成式对抗网络(GANs, Generative Adversarial Networks ),是生成式AI的关键技术。其本质是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。

在原理上,生成式对抗网络使用两个神经网络相互对立,一个生成器和一个判别器。生成器或生成网络,负责生成类似于源数据的新数据或内容,判别器或判别网络则负责区分源数据和生成数据。经过交替周期训练,生成器不断学习生成更逼真的数据,判别器则更善于区分假数据和真实数据。可以把GANs想象成一个造假者和一个在猫捉老鼠游戏中的警察,造假者正在学习传递假币,而警察正在学习检测假币。渐渐地,双方在对抗中都不断完善。

应用

[2]

  • 生成图形:学习艺术品的风格,生成新的油画。
  • 生成照片:修正缺失/模糊/误导照片;照片超分;语义生成图像。
  • 生成音频:生成语音;生成音乐;生成视频、文本、字幕等。
  • 生成材料:通过3D打印、cRIspR等技术,生成假肢、有机分子或其他物品。

企业

[2]

  1. 迪士尼:借助生成式AI生成动画,只需通过文本描述某些活动,而不是注释数据和大量训练就能创建动画、电影剧本视频。
  2. Netflix:借助生成式AI抽取符合观影习惯和需求的画面,然后把这些图片制作成内容封面,以降低内容搜寻难度,提升视频制作效率。
  3. Unity:3D生成型AI的推动者。全球有超过一半的移动、PC 和主机游戏采用了其生成引擎来制作,其3D-AI技术也广泛应用于工业设计的3D模型搭建,VR/AR设备内容创作以及影视特效制作。
  4. Insilico Medicine(英科智能)的AI药物研发公司也是生成式AI的应用者。作为一家抗衰老及癌症治疗药物研发商,Insilico Medicine依托基因组学、医疗大数据及AI技术等技术手段,专注于癌症治疗、抗衰老药物的研发、生产及销售。同时该公司也是全球第一家应用GANs,2015年在全球范围内率先利用生成对抗网络(GANs)和强化学习(RL)技术,生成具有特定性质的药物分子结构。
  5. 影谱科技:2018年底便发布AGC智能影像生产引擎,这也是国内最早一批借助生成式AI开发的技术框架。

Gartner技术成熟度曲线

2022年

[4]

  • AI Engineering:5-10年

2021年

[3]

Gartner Artificial Intelligence Hype Cycle for 2021 describes AI-specific innovations that are in various phases of maturation, adoption and hype.

  • Generative AI: 2-5年

Organizations can apply generative AI that creates original media content, synthetic data and models of physical objects. For example, generative AI was used to create a drug to treat obsessive compulsive disorder (OCD) in less than 12 months. Gartner estimates that by 2025, more than 30% of new drugs and materials will be systematically discovered using generative AI techniques。

2020年

Gartner Hype Cycle for Artificial Intelligence, 2020.

沉浸式AI

关键技术

  • 去中心化身份:(Decentralized identity, DCI),允许实体(通常是人类用户)通过利用诸如区块链或其他分布式账本技术(dlt)以及数字钱包等技术来控制自己的数字身份。
  • 数字人类:(Digital humans),是交互式的、由人工智能驱动的表现形式,具有人类的一些特征、个性、知识和思维模式。
  • 内部人才市场(Internal talent marketplaces)在没有招聘人员参与的情况下,将内部员工(在某些情况下,还包括一些临时员工)与固定时间的项目和各种工作机会进行匹配。
  • 元宇宙(Metaverse)是一个集体的虚拟3D共享空间,由虚拟增强的物理和数字现实的融合创造。元宇宙是持久的,提供增强的沉浸式体验。
  • 不可替代代币(Non-fungible token ,简称NFT)是一种独特的、基于区块链的可编程数字项目,可公开证明数字资产的所有权,如数字艺术或音乐,或被代币化的物理资产,如房屋、汽车或文件。
  • 超级应用(Superapp)是一个复合移动应用,作为一个平台,提供模块化的微应用,用户可以激活个性化的应用体验。
  • Web3是一种新的技术栈,用于开发分散的web应用程序,使用户能够控制自己的身份和数据。

参考

  1. 阑夕@weibo
  2. 生成式AI位列2022重要战略之首,迪斯尼、影谱科技等率先发力
  3. The 4 Trends That Prevail on the Gartner Hype Cycle for AI, 2021
  4. What’s New in Artificial Intelligence from the 2022 Gartner Hype Cycle
  5. 2 Megatrends Dominate the Gartner Hype Cycle for Artificial Intelligence, 2020
  6. Gartner发布2022年的Hype Cycle,增加了25项新兴技术