有了AI,人人都可以是艺术家。AI绘画的出现,恰如瑞士艺术家保罗·克利所言:“艺术不是再现可见,而是使不可见成为可见。”经过20年左右的发展,目前基于不同类型或者模态元素的AI绘画发展情况不尽相同,发展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队已经研发出由语音生成图像的技术。
上传一张图片,或者输入一些简单的关键词,系统就能自动生成一张卡通图像……最近一段时间,AI绘画开始在互联网社交平台走红。
AI绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容的典型应用场景之一。其主要原理是收集大量已有作品,通过算法对其内容和风格特征进行解析,最后再生成新的作品,所以算法是AI绘画的核心。
当前,“凭空”生成图像的AI绘画,其实也会动辄“翻车”:也许上一秒AI通过你的照片绘出的是一张充满艺术感的二次元画像,下一秒你的宠物猫、狗则可能被画成可爱少女或肌肉猛男。
事实上,AI绘画早已火爆全球。第一张公开展出的、由人工智能创作的绘画作品《埃德蒙·贝拉米的肖像》曾于2018年在佳士得拍卖行以43.25万美元成交,那是一张由机器学习了从14世纪到20世纪的1.5万张肖像画之后自动生成的一张肖像画作品。
AI绘画是如何实现“凭空”生图的?除了娱乐外,AI绘画还有哪些潜在的应用前景?
从“以图生图”到“语音生图”
2022年,由人工智能创作的《太空歌剧院》一度火出圈。在美国科罗拉多州举办的新兴数字艺术家竞赛中,《太空歌剧院》获得“数字艺术/数字修饰照片”类别一等奖。它的构图、配色以及画面的细节堪称精致。然而,这个作品的创作者不是艺术家,而是来自美国科罗拉多州的游戏设计师。
这位游戏设计师在一个名为“Midjourney”的AI创作工具里,先输入几个关键词,如光源、构图、氛围等,得到了100幅作品,再进行约80小时的修图修饰,最终选出3幅作品,最后把图像打印到画布上。
通过简单交互式对话在短时间内生成的“艺术”作品,让人类艺术家展开了一场关于“AI绘画作品参赛是否属于作弊”的争论。这场声势浩大的争论也令大众直观地意识到如今的AI绘画水平已经发展到了何种程度。
“人工智能在艺术方面的创作最早可以追溯到上个世纪末,当时的人工智能绘画技术叫作‘图像的风格化滤镜’。”中国科学院自动化研究所多模态人工智能系统全国重点实验室研究员董未名说,最初的AI绘画方法比较简单,比如一张普通的照片,通过一些图像处理的算法,把照片像素进行几何或者色彩上的变换,然后再调节不同参数,就可以模拟出类似油画或者水彩画的风格。
经过20年左右的发展,目前基于不同类型或者模态元素的AI绘画发展情况不尽相同,发展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队已经研发出由语音生成图像的技术。
AI绘画主要依靠三种技术模式实现
董未名介绍,目前AI绘画主要借助图像风格迁移技术、图文预训练模型和扩散模型实现。
“图像风格迁移技术指的是图像处理算法通过对输入的真实图像内容特征和对参考的艺术图像风格特征的提取,实现真实图像内容特征和艺术图像风格特征的融合,从而生成新的艺术图像。”董未名举例,如果将美国旧金山艺术宫的外景照片和印象派创始人莫奈绘制的作品,通过图像风格迁移技术进行融合,就能得到一张看起来像是由莫奈绘制的美国旧金山艺术宫的绘画作品。最初的AI绘画采用的正是这种技术。
不过,在董未名看来,图像风格迁移技术大多依赖的是生成式对抗网络(GAN)算法,它最大的问题是生成的绘画作品艺术性不强,笔触和构图让人觉得与真实的绘画有差距,所以长久以来,AI绘画一直“籍籍无名”。
当图像风格迁移技术还在挣扎于输出作品的审美问题时,图文预训练模型的出现,加速了AI绘画的崛起。
“依托图文预训练模型,只要输入一句话或者上传一幅风格明显的图片,算法就能将图像特征和文字特征‘对齐’。生成的绘画作品的内容特征和上传图片的内容相似,艺术性也比图像风格迁移技术生成的图片强很多。”董未名举例,比如支撑图文预训练模型的可对比语言—图像预训练(CLIP)算法,就是利用图文特征“对齐”的能力,再结合已有的生成模型,实现“以图生图”或者“图+文”生图。
不过,董未名坦言,图文预训练模型的推广也存在一些争议,有部分人认为,该模型在训练前期,需要用大量的图形处理器(GPU)进行数据训练,耗电量大、成本很高,而该模型的应用场景却不够清晰。但也有人认为,也许该模型未来可以打造为通用的人工智能模型,用它完成更多的算法作业,只是这还需要时间的验证。
诚然没有一项技术是完美的,这也为人类探究更先进的技术提供了无限动力。当下最流行的扩散模型便是其中之一。
“目前最新的AI绘画技术采用的就是扩散模型,这种模型可以把一个随机采样的噪声输入模型,然后尝试通过去噪来生成图像。”董未名表示,扩散模型也存在弱点,由于模型对图片内容识别的能力不足,或者难以完全理解识别文字的意义,以及训练数据的偏差,有时便会生成“四不像”的作品。此外,扩散模型生成图片的速度比较慢,目前还达不到实时生成图片。
互联网治理、元宇宙或潜藏应用前景
AI绘画目前的应用场景,更多聚焦于社交软件。近期在国内社交网络“火出天际”的AI绘画软件主要集中在小程序及App。随着AI绘画小程序的火爆,短视频平台抖音也迅速上线了AI绘画特效。同时,此前腾讯上线了“QQ小世界AI画匠”活动,百度也推出了首款AI艺术和创意辅助平台“文心一格”。
有了AI,人人都可以是艺术家。AI绘画的出现,恰如瑞士艺术家保罗·克利所言:“艺术不是再现可见,而是使不可见成为可见。”“AI现在已经完美实现了这一目标,人们可以通过机器计算来绘制出很多现实中见不到的场景。”董未名畅想,不远的将来,AI绘画或许还将展现更丰富的应用场景。
“现在网络上充斥着很多不良内容,这些内容为了逃避监管经常以绘画的形式出现,而当前很多内容识别模型对真实图片识别得很准确,但缺乏不良内容艺术作品的相关训练数据,所以对不良内容识别不准确。也许可以用AI绘画技术,积累不良内容艺术作品的数据,并用以训练识别模型,以提升互联网内容的安全监管能力和识别的准确率。”董未名建议。
在董未名看来,作为一种艺术呈现形式,AI绘画也将在元宇宙、设计、文旅等行业催生新的商业模式。例如AI绘画目前在AI辅助创作、短视频、影视制作和元宇宙等方面都有布局,因为这些赛道都离不开创意,AI绘画可以帮助创作者通过简单的特征输入,实现对其创意的预览,甚至可以直接进行创作。
不过,董未名并不讳言,当下AI绘画仍然存在版权争议问题。AI绘画的核心是模型,而训练模型需要使用大量图像、文本数据。对于未经授权的图片,经过运算之后所生成的图像版权归属尚难界定。“有的画家风格特别明显,如果用画家的画去训练算法模型生成作品,那最后的版权属于谁呢?”董未名提出的问题,正是多数AI绘画作品所面临的现实问题。
AI绘画掀起了一场资本的群体狂欢,希望有一天它能走出“照猫画虎”的尴尬,真正服务艺术创作、创造更多价值。(科技日报记者 金凤)
焦点访谈丨向创新要发展——新时代 新征程 新伟业******
党的二十大报告指出,我们要坚持以推动高质量发展为主题,推动经济实现质的有效提升和量的合理增长。企业是推动高质量发展的关键之一。近日,记者在调研采访中了解到,无论是国有企业还是民营企业,都在从实际出发,在创新上下功夫,不断提高企业的核心竞争力,在推进高质量发展中贡献着自己的力量。
记者来到大庆油田这一天,正赶上寒潮来临的第一天,室外气温零下15度。
大庆油田第一采油厂第二作业区经理 张向东:当时开采初期油多水少,到了目前油少水多,每采出100吨液量当中有96吨是水,4吨是油,相当于在水中捞油,拿油的难度越来越困难。
大庆油田已经开采了63年。几代大庆人凭借着铁人精神、大庆精神,一举甩掉了中国“贫油”的帽子,成为全国工业企业学习的榜样。到2022年10月,大庆已经累计生产原油超过24亿吨,占国内陆地同期原油总产量的40%。党的二十大报告指出,要坚持以推动高质量发展为主题,推动国有企业做强做优做大。
大庆油田总经理 党委副书记 张赫:高质量发展对于大庆油田来说,其中首要的就是高质量原油稳产,在已经高强度开发63年的基础上,我们要实现原油3000万吨高质量稳产难度更大。
原油越采越少,要想仍然保持高产稳产,困难越来越多。记者旁听了第二作业区的晨会。采油一厂第二作业区有17个基层班队,管理维护着2911口油水井,分布在30平方公里土地上。记者注意到,每天的晨会就是发现问题,第一时间解决问题,把责任落实到每一个人身上,确保每一口油水井没有故障、没有跑冒滴漏、运行正常。
室外很冷,记者在寒风里站一会儿就得不停跺跺脚。寒冷天气下作业,人可能冻坏,设备也会冻坏。晨会后,工人们就要顶着严寒对油井进行维护。
大庆油田第一采油厂第二作业区经理 张向东:我们的油水井的管理难度特别大,就像人的体检一样,发现问题及时采取维护作业,如果停产之后,我们的产量任务就无从谈起。
高质量稳产,不仅要产业工人们继续发扬铁人精神的干劲,也要不断依靠科技创新来支撑。党的二十大报告指出,要加快实施创新驱动发展战略,强化企业科技创新主体地位。面对原油越采越少的局面,十八大以来,大庆油田创造的陆相油田开发水平已经达到世界领先,水驱、聚驱、复合驱等核心技术的运用,使主力油田采收率比世界同类油田高出10到15个百分点。
复合驱技术是大庆油田正在试验和采用的自主创新型技术。截至2022年10月,已经累计从石头缝里“洗”出原油4833万吨,年产量连续6年超过400万吨。
大庆油田总经理 党委副书记 张赫:比如说二氧化碳,在别人看来是废气,但是我们通过创新,把废气变成了宝贝,把原本排向空中的二氧化碳埋进地下,把石油驱出来。我们目前已经累计埋存二氧化碳近200万吨,靠二氧化碳驱油累计已经产油80余万吨。
可是资源总有耗尽的那一天,该怎么办呢?寒潮持续影响着松辽平原,记者来到大庆油田的第三天,气温已经降到零下21℃,还伴随着5级风。大庆是一个百湖之城,有很多的泡泽,记者看到,在封冻的水泡子上,已经建设了一批水面光伏。
学习贯彻党的二十大精神,大庆油田提出要在“十四五”期间,实现“一稳三增”。在稳定国内原油高质量稳产基础上,要实现天然气、页岩油气等非常规油气资源,地热和风、光等新能源的高质量增产,清洁能源替代率达到20%以上。要想达到这一目标,仍然需要不断地创新驱动来实现。
大庆油田总经理 党委副书记 张赫:我们相信,资源有限科技无限,全力推动实现高水平的科技自立自强,为国家端稳端牢能源饭碗贡献大庆油田的力量。
中国国际经济交流中心首席研究员 张燕生:从国家高质量发展的角度来讲,粮食的安全、能源的安全、大宗商品的安全,这些安全都是中国的生命线。国企和央企在这个方面是负有重要的责任,是中华复兴战略全局,对科技、产业、现代金融提出了更高的要求。
企业是社会经济发展和创新驱动的重要力量。二十大报告不仅提出,要推动国有企业做强做优做大。同时,也提出要优化民营企业发展环境,促进民营经济发展壮大,这就给民营企业的未来发展吃了定心丸。
记者来到小米集团的时候,手机相机部总经理易彦正在上海通过视频与北京研发团队进行课题研究。过几天是新品手机发布会,相机部团队还在认真研究着相机功能的优化问题。
民企的发展壮大,同样离不开创新驱动。易彦是党的二十大代表,在手机相机领域,已经是14项发明专利发明人或共同发明人。几年来,她所领导的相机部从原先零散的几个部门发展成具备完整体系架构、远景规划和系统级技术储备能力的高科技部门,使相机成为手机的核心竞争力之一。
冬日的夜晚,记者看到,小米办公楼不少的窗户还亮着灯。白天与易彦进行了沟通,夜晚,相机部的夜枭团队还在做着测试工作。
经过与工程师长时间的了解,记者大概知道了他们在做什么。按下快门,一张照片在不到3秒的时间里,要经过去噪、提亮、细节增强、色彩还原、对齐等等十几项环节的计算,这背后,每一个环节都要依靠不同的AI算法,最终展示出一张细节清晰、颜色真实、画面干净的夜景照片。
小米集团高级算法工程师 夜枭算法研发负责人 冯超禹:夜枭算法,不光可以应用到手机拍照领域,还可以应用到自动驾驶,或者监控领域,在夜景下可以将画面处理得更清晰。
去年,在全球智能手机出货量普遍下滑情况下,小米全球智能手机市场份额连续两个季度实现环比提升,在全球55个国家和地区排名前三,欧洲地区排名第二。
小米集团党委书记 高级副总裁 曾学忠:科技创新是我们企业生存发展的基础,也是我们安身立命长远发展的资源,所以我们的高质量发展都是靠着科技创新。在咱们国家这次二十大特别强调的智能制造方面,我们构建了行业一流的灯塔工厂,探索高质量高效率发展,把技术为本、技术创新作为企业发展的源动力和推进器。
一款人形机器人,在2022年8月已经有过正式亮相。它身高177cm,体重52kg,能感知45种人类语义情绪,自主行走。现在,工程师们正在进一步优化拟人化的仿生功能,让它变得更聪明、更灵活。
二十大报告提出,强化企业科技创新主体地位,发挥科技型骨干企业引领支撑作用。一个面向未来的企业,不仅要在现有产品上始终具备核心竞争力,在未来领域也要不断探索和深耕。
实体经济是社会经济发展的基础。坚持推动高质量发展,是新时代的主题。记者走进一家家企业看到,扎实干事创业、积极创新发展,实体经济正在焕发着新活力。
核电技术已经列为我国进入创新型国家行列的重大成果之一,中核集团持续加大技术创新力度,不仅利用核能发电,还利用核能供热,可以为企业节约天然气,减少二氧化碳排放,经济账可观,环保账更亮眼。
在海南三亚西南200公里外的深海海域,我国首个自营超深水大气田“深海一号”二期工程正准备开钻,中海油正在集聚重大油气工程的技术力量,做最后的攻关。
特殊钢是制造业高质量发展的基石之一,中信泰富特钢集团潜心研发,成功生产出直径1200毫米连铸圆坯,刷新了最大规格的世界纪录,正在稳步推进大飞机、高铁、风电等领域的应用。
推动高质量发展,企业责无旁贷。习近平总书记指出,高质量发展要靠创新。我们看到,有的企业在不断挖掘潜力,寻找新的增长点;有的企业不断优化产品,出新出彩;有的不断探索前沿技术,引领行业发展。党的二十大报告指出,要强化企业科技创新主体地位。在国家一系列政策的推动下,在企业持续的努力下,中国的企业一定会在推进高质量发展中展现新作为。(央视新闻客户端)
(文图:赵筱尘 巫邓炎) [责编:天天中] 阅读剩余全文() |