生成式人工智能 (AI) 是一种使用计算机算法来创建文本、图像、音频和视频等新事物的技术。
该技术可以用于不同的行业,并且仍在研究它以了解其所有可能性。
生成式 AI 可以创建的一些示例包括:
生成书面文本,例如新闻文章,产品描述,甚至整本书创建图像,例如照片或数字艺术品生成音频,例如音乐或语音制作视频,例如动画甚至真人镜头事实上,您刚刚阅读的所有内容都是书面的由 AI — 但别担心,这篇文章现在又回到了人类手中。
让我们来看看一些例子,看看生成式 AI 技术已经可以创造什么,以及这些东西在哪里2023 年标题。
AI 几乎可以制作任何内容的视频
虽然 AI 图像生成器近年来变得流行(稍后会详细介绍),但 AI 系统正越来越多地被用于转换文本提示进入视频。
Google 表示其文本到图像模型 Imagen 可以创建具有“前所未有的逼真度和深层次的语言理解”的图像和视频。
Google Imagen AI 创建的视频
(视频已加速以减少加载时间)
'咖啡倒入杯子'
'营火在在白雪皑皑的森林中以星空为背景的夜晚”
谷歌研究院的 Jeff Dean 本月早些时候写道,该公司的一项研究挑战是创建能够“产生高分辨率、高质量,时间一致的视频具有高水平的可控性”。
“这是一个非常具有挑战性的领域,因为与图像不同,挑战是将图像的所需属性与生成的像素相匹配,而视频他说,还有一个额外的时间维度。
与其他框架保持一致。”
2022 年 9 月,Facebook 的母公司 Meta 透露了 Make-A-Video,它表示可以创建“异想天开的独一无二的视频只需几个单词或几行文本。
“系统从成对的文本图像数据中了解世界是什么样子,以及从没有关联文本的视频片段中了解世界如何移动, " 它的创作者说。
由 Meta 的 Make-A-Video AI 创建的视频
(视频eos 已被加速以减少加载时间)
'一对年轻夫妇在大雨中行走'
Make- A-Video 还可以使用现有视频或图像作为起点创建新视频。
以伦勃朗的这幅画为例......
… 在 AI 发挥其魔力后,它变成了动态图像。
AI 可以听到语音(或音乐)片段并继续播放
一个名为 AudioLM 的 Google 研究项目可以采用简短的音频提示并生成其自己的音频延续 — 无论是语音,还是甚至是钢琴。
它的创建者说该软件的创作“保留了说话人的身份、韵律、口音和录音条件”,同时还具有连贯的句法和语义。
点击或点击播放这些 Google AudioLM 示例
语音延续示例 1:
语音延续示例 2 :
AudioLM 的创建者表示该程序还可以“学习生成连贯的钢琴音乐延续”,尽管只接受钢琴音频而不是任何乐谱的训练。
钢琴延续示例1:
钢琴延续示例2:
微软的VALL-E研究项目也可以在保持语音合成的同时合成语音“说话者的情感和听觉环境”,它的创造者说。
这里有一些例子AI 使用简短的音频提示为不同的文本创建语音,同时保持特定的情绪或环境。
点击或单击以播放这些 Microsoft AI 音频示例
声学环境中的声音:
AI 使用三秒钟提示创建语音,然后阅读以下语句:
"Everything is由计算机运行,但你必须先知道如何思考,然后才能使用计算机。”
一个带有特殊情感的声音:
AI 使用三秒钟的提示来创建一个声音,然后用愤怒的语气阅读以下声明:
“我们必须减少塑料袋的数量。”< /p>
AI 可以将文本提示变成音乐
Google 的 MusicLM 系统仅在本周宣布,根据其创建者的说法,它可以“从文本描述中生成高保真音乐”。
该研究项目接受了 280,000 小时的音乐训练,以了解如何创造音乐的创作者说“非常复杂”。
点击或点击播放这些Google MusicLM示例
音乐生成示例1
文本提示:
节奏缓慢,贝司和鼓声主导的雷鬼歌曲。持续的电吉他。带有铃声的高音手鼓。人声轻松有悠闲的感觉,很有表现力。
音乐生成示例2
文字提示:
音乐生成示例2
p>这是一首 r&b/hip-hop 音乐作品。有一个男声说唱和一个女声以说唱的方式演唱。节拍由一架钢琴和电子鼓伴奏组成。
这首曲子的气氛俏皮而充满活力。这首曲子可以用在高中戏剧电影/电视节目的配乐中。它也可以在生日派对或海滩派对上播放。
MusicLM 的创建者表示他们不打算发布该软件,因为仍然存在“潜在风险”创意内容的盗用”。
近年来,人工智能系统被用于制作歌手声音和歌曲(无论他们是死是活)的深度伪造,这一点颇具争议。
< h2 class="YtLlr u5PGL r1bZO fMuGR fm7dv V2hL5 LS87j RDGP5 Z5947 _5pKBM HXgQg" data-component="Heading">AI 可以从一张图像中创造“无限自然”去年年底、Google 研究科学家 Noah Snavely 和 Zhengqi Li 介绍了一个名为 Infinite Nature 的项目。
“我们生活在一个充满自然美景的世界——雄伟的山脉、壮观的海景和宁静的森林, ”他们写道。
“想象一下,像鸟儿一样看到这种美景,飞过细节丰富的三维景观。
“可以计算机学习合成这种视觉体验?这种能力将为游戏和虚拟现实体验提供新型内容:例如,在无限自然场景的沉浸式飞行中放松身心。”
这对夫妇说他们他们的工作只使用了使用静止图像训练的系统,他们声称这是一项突破。
他们一直致力于生成“完整、逼真且一致的 3D 世界”。
输入提示,OpenAI 的 DALL·E 2 创建图像
文本到图像生成器 DALL·E 2 由旧金山公司 OpenAI 创建,自去年公开发布以来受到了很多关注。
它的创作有时很难区分来自人类插画师的作品。
这是我们使用 DALL·E 2 创作的一些图像,以及它们的文本提示。
'一个e拿着一个非常大的洋葱微笑的老年白人男性农民'
'罗马斗兽场的 18 世纪油画,人们坐着在前景中'
'机器人坐在温暖的咖啡馆里使用笔记本电脑的逼真图像'
'水彩画一只公鸡站着打鸣,背景五颜六色,全部采用柔和的颜色
DALL·E 2 等文本到图像生成器在最近几个月引起了争议,因为他们经常使用从互联网上获取的图像进行训练——包括艺术家创作的受版权保护的作品,通常未经他们的许可使用。
OpenAI 的病毒式聊天机器人 ChatGPT 可立即撰写论文、软件代码等
ChatGPT 是撰写本文大部分介绍的 AI。
它的受欢迎程度在最近几个月飙升,这要归功于它几乎可以立即创建从论文到电影剧本、软件代码、电子表格公式和 terrif 的一切内容ying short stories。
该软件已通过医学检查并被一些学校和大学禁止使用,但它已经被一些行业的工人用来快速创建有用的内容。
虽然事情并不总是正确的。
ChatGPT 的创建者 OpenAI 已经从微软获得了数十亿美元的投资“以加速人工智能的突破以确保这些好处能与世界广泛分享”,两家公司本周表示。
据报道,该合作伙伴关系正在开发基于 ChatGPT 的 Microsoft Bing 搜索引擎版本,而谷歌也在据说正在寻求推出自己的人工智能搜索聊天机器人。
人工智能研究人员预测“巨大收益”和随着技术进步的“可怕时刻”
生成式 AI 模型在 2022 年取得了巨大飞跃,但其中一些创作者表示,随着 2023 年及以后情况的进一步改善,我们可能会遇到一些问题。
Which这些艺术作品中有哪些是使用 AI 创作的?
我们将 AI 图像生成器和人类插画师正面交锋。
p>阅读更多内容
Google 的 Jeff Dean 说我们会看到“质量的进步和媒体生成本身的速度”,以及 AI 用户有更多创造性表达的机会。
但他担心更强大的 AI 模型也可能“引入关注的数量”。
“它们可能会生成各种有害内容,或者生成难以与现实区分的虚假图像或音频内容,”他说。
“在决定何时以及如何负责任地部署这些模型时,这些都是我们仔细考虑的问题。”
OpenAI 花时间研究了 ChatGPT 等语言模型如何被滥用于虚假信息活动。
“对于恶意行为者,这些语言模型带来了自动化创建令人信服和误导性文本以用于影响操作的承诺,”该公司在最近的一份报告中表示。
在澳大利亚工作场所使用 ChatGPT
虽然学校禁止使用 ChatGPT,但澳大利亚的工作场所已经在部署它和其他新的人工智能 (AI) 工具。以下是他们如何使用它们。
阅读更多OpenAI 首席执行官 Sam Altman 表示,随着我们越来越接近所谓的通用人工智能 (AGI),届时计算机系统将获得“可怕的时刻”和“重大中断”了解和/或像人类一样学习更复杂的智力任务。
“但好处可能如此惊人,因此值得克服巨大的挑战才能到达那里,”他在 Twitter 上说。< /p>
“特别是,随着时间的推移,OpenAI 技术的使用将会出现重大问题;我们将尽最大努力,但不会成功地预见到每一个问题。”
澳洲中文论坛热点
- 悉尼部份城铁将封闭一年,华人区受影响!只能乘巴士(组图)
- 据《逐日电讯报》报导,从明年年中开始,因为从Bankstown和Sydenham的城铁将因Metro South West革新名目而
- 联邦政客们具有多少房产?
- 据本月早些时分报导,绿党副首领、参议员Mehreen Faruqi已获准在Port Macquarie联系其房产并建造三栋投资联