摘要:【目的】探讨生成式 AI 浪潮下新一轮内容革命的动因、逻辑与路径。【方法】运用文献研究、理论思辨、对比分析等方法。【结果】人工智能技术的推广与使用,开启了新一轮的内容革命。从 ChatGPT、Sora 到 Genie,生成式 AI 成为开启智能互联时代内容革命的里程碑。【结论】新一轮内容革命以 AI 涌现为主线,其兼具的类人化和自主性属性是驱动新一轮内容革命的文化逻辑。生成式 AI 在助推内容生产主体转换、流程再造、海量内容涌现的同时,在主体性、透明度、可解释性、数据质量等方面提出了紧迫的新课题。
关键词:生成式 AI;内容革命;类人化;多模态交互生成;
DOI:10.19483/j.cnki.11-4653/n.2024.06.002
本文著录格式:雷晓艳,李子豪 . 生成式 AI 浪潮下的内容革命:动因、逻辑与路径 [J]. 中国传媒科技,2024,36(6):14-20.
作者简介:雷晓艳(1980—),女,湖南永州,博士研究生,湖南工业大学文学与新闻传播学院教授,研究方向为媒介融合、国际传播;李子豪(2001—),河北张家口,湖南工业大学文学与新闻传播学院 2023 级硕士研究生,研究方向为广电与新媒体。
【基金项目】湖南省社科基金一般项目:“互联网+”时代县级融媒体传播力提升研究(19YBA132)
生成式 AI(Generative Artificial Intelligence)是继专业生产内容(Professional Generated Content,PGC)和用户生成内容(User Generated Content,UGC)之后,基于人工智能技术而自动生成内容的新型生产方式。[1]2022 年至今,GPT 模型、Midjourney 模型、Sora 以及Genie 模型等生成式 AI 技术带来了全新的智能生产浪潮。生成式 AI 技术全面进入内容产业,智能互联时代的内容革命正在发生。如何正确认识生成式 AI 引发的内容变革,分析其动因与逻辑,以及引发的业态变革并反思技术可能引发的风险,成为业界与学界共同关注的热点话题。
NO.1一条主线:AI 涌现
内容革命的主线是探索新技术对于内容行业的改造。在我国互联网发展历程中,内容领域经历了逻辑上互为呼应的三个阶段的变革:第一阶段以“互联”为基础,主要方式是“专业化生产”;第二阶段以“社交”为核心,主要方式是“参与式生产”;第三阶段以大数据、人工智能为依托,主要方式是“智能化生产”。[2] 在第三阶段的进程中,生成式 AI 的涌现成为最大的助推者。GAN、CLIP、Transformer、Diffusion、预训练模型、多模态技术、生成算法等 AI 技术以生产者身份参与内容传播。以 ChatGPT、DALL-E、Amper Music、Midjourney、Sora 等为代表的生成式 AI 产品迭代升级以及在文字、图像、音频、视频等领域中的应用,都以具体实践展示了生成式 AI 在内容生产中的强大潜力。
有学者将人工智能自 1957 年以来的发展划分为一维线性发展、二维通用涌现和三维体验泛化三个阶段 [3]:第一阶段是一维线性阶段,以规则驱动的 AI(Rule-based AI)为代表,主要依赖预设的规则和逻辑来执行任务,通常用于解决定义明确的、结构化的问题,以垂直化、专业化的方式实现对人类单一能力的超越,缺乏自我学习和适应新情况的能力。第二阶段是二维涌现阶段,基于机器学习和深度学习技术,以 ChatGPT、Midjourney 为 代 表 的 生 成 式 AI 发 展 进入到二维阶段——大语言模型完成了对于语义世界的智能化、通用化整合与生成,以无界的方式实现了语义世界的价值构建与生成产品,全面融入人类实践领域(通用性)且具有去边界、场景性、交互性和参与性等显著的特征。第三阶段是三维体验泛化阶段,以Sora 作为生成式 AI 的标志性进阶,使人工智能发展到三维时空阶段,完成了对于物理世界的系统模拟和场景构造。
基于这一脉络,文章尝试分析内容生产如何受到生成式 AI 的影响,同时重新检视内容在智能生态中的身份与定义重塑的可能。
首先是内容的内涵与外延的扩容。传统媒体时代的内容,其内涵指涉文本、音频、图像、视频、互动等对于消除人们头脑中“不确定性”的信息特质;互联网技术浪潮下的“微内容”,强调互联网变革内容生产、传播与消费场景,通过社会化内容平台解放内容生产力,促进内容供给、表达主体、传播形式、传播渠道的极大丰富 [4];生成式 AI 浪潮下的内容则强调内容的“智能生成”。
依托计算机视觉、自然语言处理、多模态等多种技术,AIGC 的“智能生成”具备了数字孪生、智能编辑和 AI 创作三重内涵 [5]:一是数字孪生,其主要目标是建立现实世界到数字世界的映射,将现实世界中的物理属性(如物体的大小、纹理、颜色等)和社会属性(如主体行为、主体关系等)高效、可感知地进行数字化。二是智能数字内容编辑,其主要目标是建立数字世界与现实世界的双向交互。基于数字内容孪生的特性,现实世界的物理属性实现对数字内容的智能编辑和修改,同时利用数字内容的深度仿真和低成本试错优势,为现实世界的应用提供快速迭代能力。三是智能数字内容创作,其主要目标是让人工智能算法具备内容创作和自我演化的能力,形成的 AIGC 产品具备类似甚至超越人类的创作能力。[6] 在外延层面,生成式 AI 基于训练数据、算法模型和多模态加工技术,实现了内容表达从文字到图片到音视频的升维,并可在不同模态之间进行自由转换、映射和生成;与此同时,虚拟化身、虚拟设备、虚拟财产、虚拟环境等非人类要素的加入,使得内容的外延进一步扩容。
其次是内容定义权的转型。Web 1.0 时代,PGC 是内容生产的主导模式,专业媒体机构对于生产什么内容、以什么方式生产内容拥有至高的话语权;Web2.0时代,UGC 成为内容生产的生力军,其逻辑是一种“草根”逻辑,内容的定义权由专业人士转移至普通大众;Web 3.0 时代,生成式 AI 成为内容生产领域的新物种,内容的定义权曾经从专业人士转移至普通人的手中,现在又再次回到了专业的向度上,只不过这一次是由机器人来决定什么叫内容。[7]
更重要的是,生成式 AI 正在重新定义和释放内容生产力,为内容创作领域带来了革命性的变化。作为人体的延伸,AI 能够自动完成许多繁琐、重复的工作,提高工作效率,这将释放出大量的时间和精力,使内容生产者更专注于创新和解决问题。传统的内容创作往往需要专业的技能和知识,在人机互为主体的生态中,生成式 AI 使得内容创作变得更加普及和易于接近,这大大降低了内容创作的门槛。在内容主导逻辑下,生成式 AI 可以快速地生成大量内容,这种高效的创作能力极大地提高了内容生产的效率,使得在短时间内产生大量高质量内容成为可能。生成式 AI 还能够根据特定的需求和偏好生成定制化的内容,这种个性化定制的能力使得内容更具吸引力和相关性;创新创作方式上,生成式 AI 提供了全新的创作方式,让多模态内容的智能生成与转化成为可能,这些内容是传统创作方式难以实现的。
NO.2双重属性:生成式 AI 赋能内容革命的文化逻辑
生成式 AI 本质上是一种机器学习系统,是基于算法、模型等创建文本、音频、图像、视频和代码的技术系统。技术究竟是一种无涉价值的中立性存在还是具有意识形态倾向的主体性存在,一直是科技哲学界备受争议的议题。对待技术,一般有三种态度:一是技术决定论。认为技术的发展和应用是社会变迁和文化发展的主要驱动力。这种观点认为技术进步会自动导致社会结构和人类行为的变化,而社会结构和人类行为的变化则是技术发展的必然结果。二是技术自主论。认为技术具有自主性,即技术遵循自身的内在逻辑和规则发展,而不受外部社会、经济、政治和文化因素的直接影响,并在一定程度上决定和支配着人的思维以及社会的发展。技术自主论强调技术对社会发展的决定性作用,认为技术能够塑造和改变社会结构、文化形态以及人类的生活方式。三是技术建构论。认为技术是建构主义的,技术具有自然属性与社会属性,自然属性决定技术是基于自然界的客观规律而存在的,技术按照其固有的规律发展,而不受人类主观意志的直接影响,社会属性决定技术并非完全由技术内在的逻辑决定,而是受到社会力量、文化、政治、经济等多种因素的影响。技术与社会在相互影响、相互作用中完成相互建构。[8]
生成式 AI 不仅是一项跨领域的新兴技术,在媒介环境学“泛媒介论”视角下,一切有利于信息传递与交往的介质均可称为“媒介”,因此可以将生成式 AI视作一种典型的媒介。基于生成式 AI 的典型媒介属性,以及由此形成的独具特色的文化逻辑,或许可以解释生成式 AI 驱动新一轮内容革命、重构内容生产范式的必然性。本文虽不主张强决定论、强自主论立场,但认为在智能时代基于生成式 AI 的双重属性的技术分析应成为考量内容革命动因的题中之义。
2.1 “类人化”与“深度拟真”的内容表达
生成式 AI 具有“类人化”属性。在媒介技术研究中,“人性化”是用于描述媒介特性的一个重要指标。例如,莱文森认为媒介在进化过程中呈现出越来越符合人类的感知模式、认知模式和生理感官特性,“人性化”构成其媒介人性化进化理论的核心。今天,虽然“人性化”依然可以描述 AIGC 产品与服务给社会集体的普遍印象,但生成式 AI 更体现了后人类社会媒介的“类人化”特点,“即按照类似于人类的自然语言表达方式,模仿人类的思维模式和行为习惯,从而让人产生某种亲近感,方便应用于日常社交领域”[9]。深度拟真性(Deep Falsity),通常用来描述生成式 AI 生成内容在视觉、听觉或文本上的逼真程度,表现在细节、风格、语义和情感上与真实内容极为接近,以至于难以区分。生成性 AI 的“类人化”与内容的深度拟真性紧密相关。从技术层面看,“类人化”的形成以及“深度拟真”的实现,均源于数据驱动的学习、深度学习模型、多阶段训练、对抗性训练、风格和特征迁移、细粒度控制、上下文感知等一系列复杂的技术手段和过程。“类人化”是内在属性,“深度拟真”是外在表现,二者是“一体两面”的关系,相辅相成,相互促进。
生成式 AI 内容生产的本质上是“私密化”的内容的深度拟真。所谓“私密化”,是指生成式 AI 背后的大语言模型“涌现行为”[10] 呈现出“灰箱化”[11] 特征。相对于“黑箱化”技术的神秘性、不可感知,人们对生成式 AI 技术的“涌现”介于可知与不可知之间的跨界联结状态。一方面,用户通过关键词输入介入内容生成模式,结合基于人类反馈的强化学习在一定程度上打开算法黑箱;另一方面,灰箱可能是人与算法之间的合理界限,算法应当以可理解的透明度存在,以用户为导向,以可行性和社会接受效果为衡量标准。[12]这种“私密化”在应用层面则表现为:生成式 AI 以用户为中心,根据用户的特定需求、兴趣和偏好,来定制具有高保真度、细节丰富、风格一致、逻辑连贯、能够传达情感以及适应特定上下文和情境的内容。与传统内容生产相比,生成式 AI 具备强大的语言理解和生成能力,能够根据用户输入与上下文的变化,自动识别用户需求与情绪,相应地对自己的行为和状态进行调整,具有自我管理自我调节的能力。在技术逻辑的主导下,生成式 AI 超越了通用大模型对物理拟真的追求,化身为更加拟人化、具备强大共情力的角色智能体。这些智能体具备与用户建立深厚而长久连接的能力,能为用户提供更加个性化、沉浸式的体验。
2.2 自主性与内容自动化生产
在生成式 AI 技术的加持下,非人类要素参与到内容生产,“人”作为生产主体的地位遭遇挑战。究其原因,生成式 AI 具备的自动化数据处理、自动化代码生成、自动化测试用例生成、自动化部署与持续集成、自动化缺陷预测与修复、自动化文档生成等多种自动化特性,是其主体性特征的技术逻辑。数字时代的内容生产更倾向于“自动化生产”。自动化生产是一种隐喻,是内容的生产方式有意识或无意识地趋向自动化,包含了自主驱动、自动运行和自主改进等不同向度。
一是内容生产的自主驱动。在“前人工智能时代”,传统的内容生产方式通常需要经过漫长的研究和验证过程,才能形成有价值的成果。而大模型可以通过与大量用户的对话和学习,快速积累和更新内容,即内容的建构不仅仅是单向的(从专家到大众),用户的问题与反馈成为内容建构的一部分,与 AI 的回应一起形成了一个动态、共建的内容系统。内容生产系统能够根据预设的目标和用户需求,自动启动内容创作和分发的过程;还可利用用户行为数据、市场趋势分析或特定算法来确定内容创作的方向和主题。此外,自主驱动的内容生产可以快速响应社会热点和用户兴趣的变化,及时生成相关内容。
二是内容的自动运行。指内容生产系统能够在没有人工干预的情况下,独立管理和执行内容生产的各项任务,包括内容的采集、编辑、格式化、发布以及后续的监控和维护。自主运行的系统通常具备高度的自动化和智能化,能够处理大量的数据和任务。生成式 AI 有两种主要的生成模型的范式,第一种是递归式生成模型(Autoregressive Model),是一种基于条件概率的生成模型,能够生成与前面生成内容相关的后续内容。递归式生成模型由循环神经网络(RNN)和变换器(Transformer)两个典型网络构成,两者在它们之间的持续联系中共同发生作用。经典 RNN 架构通过输入一个起始符号,然后根据当前输入符号和前一时刻的状态,预测出下一个符号的概率分布,并根据概率分布随机采样得到下一个符号,如此循环直至生成指定长度的文本。与 RNN 不同,Transformer 则基于自注意力机制,能够同时考虑全局信息,从而避免局部不连贯的问题。第二种生成模型范式是生成式对抗网络(Generative Adversarial Networks,GANs)。GANs是一种基于对抗学习的生成模型,能够生成逼真的数据,如图像、音频等。该模型由生成器和判别器两个部分组成。生成器根据随机噪声生成假数据,而判别器则根据真实数据和假数据进行分类,以此训练生成器生成更加逼真的假数据。通过生成器和判别器之间的不断对抗和训练,GANs 能够生成与真实数据难以区分的高质量假数据。根据对生成式 AI 之“生成”的内涵与机理的剖析,生成式 AI 的“自动化”特性也就得以显现,即在无须人类进行实时的、直接的控制或干预的环境下,机器通过内部的自我对抗与自行运算,自主地生成新的、有意义的内容,达到以假乱真的“后真实”效果。[13]
三是内容的自主改进。技术进化论认为,技术的发展不是线性的,也不是完全由人类设计和控制的,而是通过一系列类似自然选择的过程不断演化、优化的。技术进化论提供了一个理解技术发展的新视角,强调了技术发展的复杂性、动态性和自适性。纵观生成式 AI 的技术发展,其重要的技术里程碑包括:深度学习技术、生成式对抗网络(Generative Adverse- rial Network,GAN)、Transformer 和注意力机制、大型预训练模型、多模态模型等。早期生成式 AI 主要探索如何让机器生成内容,集中在简单的模式识别和生成问题上。随着统计学习方法的发展,生成式 AI 开始利用概率模型来生成文本、图像等内容,例如隐马尔可夫模型(HMM)和贝叶斯网络等。21 世纪初,基于深度学习技术的神经网络可以通过训练来自动学习文本数据的潜在结构和模式,并且可以用这些模式来生成新的文本,为生成式 AI 带来了新的发展机遇。随着深度学习技术的进一步发展,生成式对抗网络、Transformer 模型、大型预训练语言模型、多模态模型的不断涌现与更新迭代,生成高质量的图像、视频、音频和自然语言文本,并开始融合多种模态,结合文本、图像和音频,生成更加丰富和多样化的内容。伴随着数智技术的发展,生成式 AI 正成为影响内容生态的新变量,并随着内容生态的变化不断进行自主进化。
综上所述,自动化是生成式 AI 的关键特性之一,它使得 AI 系统能够自动生成新的、有用的、多样化的内容,而不仅仅是简单地响应预设的指令,包含了任务、环境、用户、数据驱动、上下文、多模态等多个维度。任务方面,生成式 AI 能够适应不同的任务需求,无论是文本生成、图像创建、音乐合成还是其他类型的创造性任务;在环境层面,AI 系统能够感知和适应其所处的环境,例如,通过分析用户行为和偏好来调整其生成的内容,以及适应不同的语言和文化背景,生成适合特定受众的内容;在用户维度,生成式 AI 可以根据用户的反馈和偏好进行自我调整,提供更加个性化的内容和服务,根据用户的实时互动调整内容;数据驱动方面,通过机器学习和深度学习技术,生成式 AI能够从大量数据中学习模式和规律,从而提高其适应性和生成质量。与此同时,生成式 AI 能够理解和适应不同的上下文环境,生成与当前情境相关的内容,如时间、地点、事件等,例如在文本生成中理解语境和语义,以生成更加相关和连贯的内容;在处理涉及多种类型数据的任务时,生成式 AI 能够整合视觉、语言、声音等多种模态的信息,以生成综合的输出。
NO.3三个维度:生成式 AI 重塑内容生产范式
如前所述,以人工智能生产内容为主题的新一轮内容革命中,生成式 AI 的涌现是最大的推动力。“涌现”(Emergence) 是哲学家路易斯首次提出的概念。在复杂系统视角下,“涌现性”是复杂系统表现出来的一种现象和性质,是在复杂系统的自组织过程中出现的、新颖的和连贯的结构、模式和性质。整体性、新颖性、不可预测性、不可还原性等是涌现性的重要特征。[14] 作为智能技术与内容产业这两个系统结合后形成的一个新的系统,新的内容系统必然会形成很多原有系统不存在的“涌现性”,即智能技术发展到一定阶段后,它就开始超越人类对其的基本认知,而进化出了一系列新的特质。在霍兰德(John Holland)看来,这样一种特质可归结为系统各部分间“非线性”和“非加和性”的相互作用。[15] 以此观之,生成式 AI作为新变量、新角色加入内容系统后,内容生态呈现出较之以往不同的范式特征,也可视为“涌现性”的表征。霍兰德还强调“涌现”带来的新生成过程虽然仍然遵循潜在的生成过程规律,但它所产生的模式绝不可能通过对原来生成器的先期考察得到 [16]。快速革新的生成式 AI 技术正在从主体、流程、形态三个层面重塑内容的生产范式。
3.1 主体转换:从人机协同到人机共创
传播学研究中,内容生产者与技术(人与机器)的关系经历了“离身—具身—共身”的转变。在技术的使用上,离身观念认为技术作为独立于人身体之外的工具或手段,人们可以通过技术来延伸或替代身体的某些功能;具身观念强调身体在信息传播与交互中的重要作用,认为身体与心智是密不可分的。在具身性的视角下,技术被视为身体的延伸或模拟,而非独立于人身体之外的存在。而在人机互为主体的深度媒介化时代,人与技术的关系演变为“共身传播”:一方面,机器不再仅仅扮演辅助交流的“媒介”角色,而是成为内容主体动态参与到社会过程中;另一方面,人与机器共身传播本质上是人与机器之间的双向信息交流,这种交流不仅是信息的传递,还包括了意义的生成和共享。至此,人与机器在信息传播过程中深度融合、相互依赖,人与机器互为尺度,人机关系也从二元分立主体向“人 - 机共同体”转化。
以 AI 技术与内容生成的主体关系变迁为线索,生成式 AI 的人机关系经历了辅助模式、协助模式与自主模式的变迁。早期的 AIGC 系统主要基于逻辑推理和规则系统,用于解决一些简单的内容制作与输出问题,但面临技术成熟度不足、真实度不高等困境。该阶段AI 技术在内容生成过程中处于辅助位置,属于工具性存在,AIGC 往往是基于现实世界信息的物理属性与社会属性的数字化呈现,可视作数字孪生内容,如智能写作机器人。辅助模式需要用户通过对目标的深入理解来拆解目标并设定框架,将拆解后的任务下发给AI,让其辅助完成任务,它更强调了人类在决策和指导中的主导地位。
随着深度学习算法的不断迭代,Transformer 模型、基于流的生成模型、扩散模型、CLIP 模型等学习范式的进一步发展为 AI 模型提供了更丰富前沿的算法技术,全球互联网数据的激增为 AI 模型的深度学习提供了更大规模数据,计算机、芯片等技术的升级迭代为AI 模型提供了更强大的算力,算法、算据、算力三要素的共同突破催生了 AIGC 的爆发。该阶段 AIGC 技术不再止步于辅助性工具,而是能够在大规模数据深度学习模型训练的基础上,根据输入指令生成内容并不断强化学习,从而实现初级的自主内容输出,协助人类完成各项任务,如 ChatGPT。在协助模式中,用户与 AI 作为合作伙伴,共同参与工作流程,决策权逐渐开始向 AI 倾斜。
基于实时自主创作的生成式 AI 位于演进路径的更高阶段。在该阶段,AIGC 能够实现实时感知、精准认知以及自主创作,AI 技术与内容生成的关系从工具性的辅助或协助,上升为以虚拟个体进行内容创作与交互,从而再次提升内容生产力。目前 AIGC 技术主要通过视觉大模型提升 AIGC 的环境感知能力,通过语言大模型增强 AIGC 的抽象概念理解与认知能力,多模态大模型升级 AIGC 内容创作能力。[17] 而自主模式展现了 AI 更高的独立性和自主性,其能够自主理解问题、拆解问题、规划决策并执行任务,人类更偏向监督和最终的评估。在这三种协作模式的演化中,从人类主导的辅助到 AI 与人类合作的协作,再到 AI 自主执行的智能体,AI 参与决策的权重逐渐增加,人机交互方式实现了从二元分立向“人 - 机共同体”的飞跃。
在内容领域,“人 - 机共同体”可以理解为人类与人工智能机器共同组成的系统,旨在通过人机协作实现更高效、更智能的工作方式。在这一系统中,生成式 AI 技术的发展为人机共同体的构建提供了有力的技术支持,生成式 AI 可以生成多种类型的内容,为人机共同体提供了丰富的资源和信息;而人机共同体中的机器则可以通过应用生成式 AI 技术来提高其智能化水平和工作效率。例如,机器人可以通过学习生成式AI 模型来更好地理解和执行人类指令;虚拟人则可以利用生成式 AI 技术来模拟人类的行为和情感,与用户进行更自然的交互。
3.2 流程再造:从线性到非线性的进化路线
在生成式 AI 技术的影响下,内容生产流程出现了显著变革。从内容生成方式的革新到产业链价值增值过程的变化,从应用场景的拓展到商业模式和盈利模式的探索,内容生产流程的实时化、网状化、开放化趋势日渐凸显。借助生成式 AI 的强大内容生成能力,内容的按需、实时生成成为可能,内容的创造、整理与传播变得更加网状化,内容生产过程中的人机协作变得更加密切,内容的开放和共享变得更加普遍和容易。
首先是内容生产环节的实时化。生成式人工智能强大的内容生成能力,也进一步构建了“按需生成”的用户中心内容生产范式。智能传播时代算法构筑了分发机制的底层逻辑,而生成式人工智能则让分发的进路更为精准、清晰。既往智能分发必须依赖平台现有的内容,而生成式人工智能本身即为内容生成工具,用户可以通过提问、对话、反馈的方式,即时创造自己需要的内容,真正实现个性化驱动。生成式 AI 通过流程挖掘、算法资源优化、立体交互式分发等,使采、写、编、发的线性流程融合为任一环节为起点的实时供应。
其次是内容生产结构的网状化。传统内容生产是从主体出发,经过采、写、编、发等环节,将内容送达受众的单向线性结构。生成式 AI 驱动下的内容生产,突破了传统的线性、单向度模式,转变为互现的、绝对去中心化的网状“涌现”模式。生成式 AI 的核心特征包括预训练、大模型和生成性 [18],其中,预训练通过预测数据中的某些部分(如缺失的单词、图像中的像素等)来学习数据的结构和规律,提供了人类偏好的基础;大模型具有更强的表达能力和学习能力,能够更好地捕捉数据的内在规律和特征,奠定了内容实现的可能性;生成性则通过生成新的数据或内容来扩展人类的知识和能力,使得内容生产逻辑发生根本变化。在上述核心技术的作用下,内容生产中间的任一环节都可产生跳跃性互联,流程协同中的内容生产走向多元网状生产结构。语言翻译、文本生成、图像与视频生成、音频生成等场景入口贯通,跨场景的转换与体验更便捷。
再次是内容创作的开放化。生成式 AI 的内容性逻辑在于其开放式的内容创作与超链接的无限循环。[19]一方面,生成式 AI 的训练需要大量文本、图像、音频等形式的数据资源,随着数据共享和开放数据运动的推进,生成式 AI 的训练素材也越发丰富。另一方面,技术的开放性、可访问性进一步增强了生成式 AI 的开放性特质,如,深度学习模型通常建立在开源框架和库之上,这些框架和库的开放性使得用户能够轻松地访问和使用这些技术;预训练的生成式 AI 模型,如GPT 系列、BERT 等,也常通过 API 或开源代码的形式提供,使得用户能够方便地将这些模型集成到自己的应用中。这种开放性的特质极大地激发了生成式 AI的内容创作想象力,用户基于能力、需求、目标与价值的综合考量,通过人机共创,实现全新的、独特的、高适配度内容的持续生产。与此同时,生成式 AI 的内容创作呈现出无限循环的特质。通过数据驱动的学习循环、生成模型的自我迭代以及内容生成的循环过程,生成式 AI 能够生成无数次、无限多的内容。以文本生成为例,生成式 AI 首先会根据输入的提示或主题生成一段初始的文本内容,然后根据生成的文本内容继续生成后续的内容,直到达到预设的长度或满足其他条件为止。在这个过程中,生成式 AI 会不断地根据已生成的文本内容来预测下一个词或句子,从而确保生成的文本内容在结构和语义上都是连贯和合理的。由于生成式 AI 是基于大规模数据集进行训练的,并且具有自我迭代的能力,因此它能够生成无限多的可能内容。这一过程始终基于开放的数据集,故而促成“海量数据库—内容生产—海量数据库”无限循环发生。
3.3 内容涌现:从单一模态到多模态交互生成
在生成式 AI 技术的加持下,内容生产不再仅依赖于个体的经验和观察,而开始呈现出一种生成式的知识涌现特性 [20];不再局限于单一的信息模态处理与传播,而是通过整合多种不同模态的数据,实现信息的互补和融合,从而生成具有更高质量、更丰富表现力的内容。这一过程利用了不同模态数据之间的关联性和互补性,使得生成的内容能够更全面、更准确地反映现实世界的复杂性和多样性。
生成式 AI 的内容多模态运作机理主要依赖于深度学习、自然语言处理和跨模态表示学习等技术。通过训练大量的数据,深度学习模型可以学习到不同模态之间的关联和转换规则。例如,通过训练图像和文本数据,模型可以学习到如何将图像转化为文本描述,或将文本转化为图像。自然语言处理技术通过分词、词性标注、句法分析等步骤,可以理解文本的含义和结构,从而生成符合语法和语义的文本内容。而跨模态表示学习则可以将不同模态的数据映射到同一表示空间中,以便进行跨模态的生成和处理。通过学习不同模态之间的共同特征,可以实现跨模态的生成和推理。基于上述技术的多模态大模型的出现,极大地提升了生成式 AI 的内容创作能力。
首先是跨模态内容生成能力。传统的 AI 模型主要处理单一模态的信息,如文本、图像、音频、视频。生成式 AI 通过组合不同模态的人工智能技术,能够实现模态间的生成与转换。例如,生成式 AI 大模型已经可以实现文本、图像、视频、音频、数字人以及 3D内容等多种模态;或将文本转化为图像(如 DALL-E模型)、音频(如 TTS 技术)或视频(如 Sora 模型);或将图像转化为文本(如 Transformer 模型)、音频(如IMG 技术);或将视频转化为文本描述等。生成式 AI跨模态内容生成不再局限于创新内容本身,而更强调创新的生成方式和过程,即“创新生成”。生成式 AI可以在指导、辅助和激发的基础上,鼓励用户跳出常规思维,从多种可能性中生成新的创新点,帮助用户更高效、更创新地生成新的想法和解决方案。这种变革使得创新不再局限于少数人的天赋或经验,而是能够被更广泛地实现和推广,实现全民共创式数字文化内容生产。
其次是交互式内容生成能力。交互式内容是一种允许用户与内容进行互动和操纵的内容形式,例如单击触发的图形动画、问答测试、独立应用程序和交互式地图等。生成式 AI 系统能够实时接收用户的输入,与用户进行流畅的对话,并根据用户的意图生成相应的内容,并能够根据用户的反馈和互动结果动态调整生成的内容,例如,聊天机器人可以根据用户的提问生成相应的回答,或智能助手可以根据用户的指令生成相应的操作结果。跨模态的交互生成能力使得 AI 系统能够更全面地满足用户的需求,提供更加丰富多样的交互体验。一些先进的生成式 AI 还具备情感交互的能力,能够识别用户的情感状态,并以适当的方式回应用户的情感表达。交互式内容生产能力使得 AI 成为一个动态的、响应式的创作伙伴,使其在某种程度上具有类似于人类的“个性”或“身份”。
再次是个性化内容推荐。生成式 AI 通过机器学习算法,特别是深度学习,来理解和分析用户的行为、兴趣和偏好。它可以从海量的数据中提取出用户的个性化特征,并基于这些特征为用户推荐相关的内容。个性化推荐通常涉及协同过滤、内容过滤或混合过滤等算法,这些算法可以精确地匹配用户需求和内容特性。例如,根据用户的个性化偏好,生成定制化的文本、图像、音频和视频等内容;根据用户的阅读历史,推荐相似风格的文章或书籍;根据用户的音乐喜好,生成符合其品位的音乐列表等。生成式 AI 的个性化内容推荐,能够确保用户接收到与其兴趣和需求高度相关的内容,从而提高内容的吸引力和实用性;在信息爆炸的时代,个性化推荐可以帮助用户快速筛选出有价值的信息,减少信息过载带来的困扰;通过提供符合用户个性化需求的内容,还能够提升用户体验和满意度,促进用户与平台的互动和黏性。
NO.4结语
生成式 AI 驱动的新一轮内容革命正在兴起。这场革命以 AI 涌现为主线,生成式 AI 进入内容传播生态,其兼具的类人化和自主性双重属性成为驱动新一轮内容革命的文化逻辑。人机共创、流程再造、内容涌现成为内容生产的新转向。生成式 AI 催生了内容生产新范式,但不可避免地存在一些问题:内容生产的主体性危机;面临透明度、可解释性、数据质量等方面的挑战等。面对生成式 AI 在内容生产领域的应用所带来的风险、挑战以及相应的产业调节路径、敏捷治理路径等,尚需进一步深入分析和研究。
参考文献:
[1] 李屹 .AIGC 模式中新闻生产的路径创新 [J]. 视听,2023(11):17-20.
[2] 雷晓艳,周理熙 . 新内容革命的动因、维度与业态重构[J]. 出版广角,2019(7):10-13.
[3] 喻国明 . 关于生成式 AI 的发展与传播领域革命的若干思考——近一年以来我的新传播研究:论点与框架 [J]. 新闻爱好者,2024(3).
[4] 喻国明 . 微内容的聚合与开发——未来媒体内容生产的技术关键 [J]. 青年记者,2006(21):40-41.
[5] [6] 中国信息通信研究院,京东探索研究院 . 人工智能生成内容白皮书(2022)[R].2022.
[7] 胡泳,刘纯懿 .UGC 未竟,AIGC 已来:“内容”的重溯、重思与重构 [J]. 当代传播,2023(9):4-14.
[8] 晏如松,张红 . 技术的决定论和社会建构论 [J]. 陕西师范大学学报(哲学社会科版),2004(10):23-26.
[9] 自俞鼎,李正风 . 生成式人工智能社会实验的伦理问题及治理 [J]. 科学学研究,2023,42(1):3-9.
[10] 方兴东,钟祥铭 . ChatGPT 革命的理性研判与中国对策——如何辨析 ChatGPT 的颠覆性变革逻辑和未来趋势 [J]. 西北师范大学学报(社会科学版),2023(4):23-36.
[11] 喻国明 , 李钒 . 内容范式的革命:生成式 AI 浪潮下内容生产的生态级演进 [J]. 新闻界 ,2023(07):23-30.
[12] 仇筠茜 ,陈昌凤 . 基于人工智能与算法新闻透明度的“黑箱”打开方式选择 [J]. 郑州大学学报(哲学社会科学版),2018,51(5):84-88+159.
[13] 刘纯懿,胡泳 . 人机逆转、叙事僵死与无事实时代——生成式革命的影响与危机 [J]. 探索与争鸣,2024(1):150-164,180.
[14] 彭兰 . 智能与涌现:智能传播时代的新媒介、新关系、新生存 [M]. 北京:电子工业出版社,2023.
[15-16] 约翰·霍兰 . 涌现:从混沌到有序 [M]. 陈禹,等译 .上海:上海世纪出版集团,2006.
[17] 中国信息通信研究院,京东探索研究院 . 人工智能生成内容白皮书(2022)[R].2022.
[18] 唐铮,林子璐 . 生成式人工智能与新闻业:赋能、风险与前瞻 [J]. 新闻与写作,2023(11):97-104.
[19] 揭其涛,王奕诺 . 玫瑰荆棘:生成式 AI 赋能数字出版内容生产的逻辑、机遇与隐忧 [J]. 科技与出版,2024(4):64-70.
[20] Kizilhan T,Bal Kizilhan S.“The Rise of the Network Society - The Information Age:Economy,Society,and Culture”[J].Contemporary Educational Technology,2016,7(3):277-280.
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://www.iotsj.com//kuaixun/3433.html