我最近喜欢上了AI生图软件。我主要用的是豆包和即梦做AI生图,都属于抖音公司的。豆包是免费的,即梦收点费,但比豆包的人像失真率要小。类似的还有360AI工具,泡咖AI,MJ绘画等。各有各的长项也各有各的短板,组合起来用最好。 <h1 style="text-align:center;"><b style="color:rgb(237, 35, 8);">一、昨日重现</b></h1> <p class="ql-block"> 最开始是想将过去的黑白老照片转换成彩色照片,那么通过什么途径才能做到呢?于是我就在网上查,最先进入我眼帘的是豆包AI生图软件。这个软件简单易学,又是免费的,于是我决定试一试。豆包AI生图软件包括文生图和图生图两种。给老照片着色自然用到的是图生图。先将老照片作为参考图导入,然后用文字将老照片的概貌和细节加以描述,以及生成的图是什么样也要给以提示,越详细越好。当一切准备就绪后,就点发送。一段时间后AI生成的图就出现在了界面。</p><p class="ql-block"> </p> <p class="ql-block"> 这张照片拍摄于1976年10月,十八岁的我正在家里拉小提琴。当时的技术手段很简陋拍摄水平也就这样。可是这张照片很珍贵,毕竟它记录了我当时的影像 。</p> 当我看到这张这AI生成的彩色照片时心情很激动!生动又清晰的影像一下子把我拉回到那遥远的年代,有种昨日重现的感觉。 后来豆包又让这张照片动了起来,内心的满足感可想而知。 <h1 style="text-align:center;"><b style="color:rgb(237, 35, 8);">二、梦想实践</b></h1> <p class="ql-block"> AI继续带着我在虚拟世界中翱翔。它还有很多神奇的功能待我去了解。比如它还可以把你装扮成你想成为的角色并置身于你想要的场景中。我根据一位女同志提供的照片和民国风穿旗袍的要求,把她带进了如下虚拟场景:在一个民国时期老宅子的庭院里,她身穿旗袍端坐在木桌前弹着古琴。悠扬的琴声,专注的表情,形成一幅极具传统文化色彩唯美又亲切的画面。</p> <p class="ql-block"> 而另一女同志曾经在卢沟晓月的碑亭前留过影,我就寻思着在这个地方给她举办一场服装秀,是不是很有意思?于是根据这张照片,让AI帮我完成了这个设想。从古装到民族服装,再到民国旗袍装,婚礼服晚礼服,再到现在的时装,夏装,职业装,都让她穿了个遍。更有意思的是整场服装秀,她既当主持人又当模特,玩儿的不亦乐乎!</p> <h1 style="text-align:center;"><b style="color:rgb(237, 35, 8);">三、喜开尊口</b></h1> <p class="ql-block"> AI生图软件不仅让人物扮装成各种角色,还会让照片里的人说话,而且还能创建自己的声音模板,通过对口型,让你相信,这就是他(她)自己说的,简直做得天衣无缝!</p> 这段会说话的视频,我是用MJ绘画网络版制作的。我先录制了一段MP3音频,然后进入MJ绘画网页界面,在左侧的功能栏里找到AI视频选项,在蹦出的视频类型菜单里面找到数字人(对口型)进入创作界面。上传人物图片之后再上传本地音频,一切准备就绪后,点击立即生成按钮。经过一段时间的等待,最后 AI自动给你生成了一段会说话的视频。<div> 当然,这段预先录制的MP3音频也可以作为你个人的声音模板,保存在电脑里随时调用。比如在创作界面,另外一个选项是文本朗读:在文本框中写入你要说的文字,然后再点上传音色按键,在跳出的对话框中,上传你的声音模板,输入你的音色名称,在文本框中输入语音内容,然后上传。最后AI也生成了一段说话的视频。</div><div> 两相比较,我还是觉得第一种更加逼真,第二种有时会失真。</div> <h1 style="text-align:center;"><b style="color:rgb(237, 35, 8);">四、技术评鉴</b></h1> <p class="ql-block"> 豆包可以说是入门级的软件,易上手,免费使用。我感觉手机版的豆包比PC版的豆包做得更好一些。</p> 这张老照片不仅整体模糊,人脸的细节也看不清楚。但它实在是太珍贵了,毕竟是很久以前的影像。我想将它修复。 如果直接在MJ绘画工具箱中调用黑白照片上色工具,生成的图像是这样: <p class="ql-block"> 很显然,这种图片我们是不接受的。</p><p class="ql-block"> 如果利用豆包图生图的功能看看会怎么样?</p> 打开豆包软件,点图像生成标签进入对话界面,导入参考图, 在文本框中写入提示语:<br> 嘿,这张图呢,风格是 “人像摄影” 哈,彩色的哟。参考强度那可是百分百。两个单人沙发中间有个茶几,是那种木框架玻璃板台面的方茶几。沙发后面靠墙那儿有一组镀银铸铁的暖气管。米黄色的木质窗框上挂着小花布窗帘。还有绿植呢。光源是 150W 的白炽灯。坐在右边的老爸穿着 65 式绿军装,没系腰带。左手夹着烟,右手指着书,跟坐在左边穿藏青色工装的老妈一起可专心地看着茶几上的书呢。他们的肤色那叫一个光洁,还加了美颜。<br> 点发送~, 这是在豆包中生成的图片。豆包通过写提示语的方式将黑白转成彩色,起码我们能够接受这种转换的效果。很显然,豆包在转换过程中人像失真得很厉害。那么有没有其他方法弥补呢?我上网查到了泡咖。 <p class="ql-block"> 泡咖AI的长项恰恰是图像换脸和视频换脸,还原度还是较高的。</p> 在泡咖里进入多人换脸界面,上传模板图再上传人脸图,点提交,最后生成图是这样的: 虽不完全像,但已经很有辨识度了。基础很差的老照片能够修复到这样,我已经很满足了!用同样的办法,我还修复了其它的照片。 1976年10月,妈妈在南口家中。 1975年夏,妈妈在南口家门口。 豆包和即梦都是抖音公司的产品,豆包简单易学,提供免费使用,适合初级水平的朋友入门学习。即梦收费方可使用,专业性强,做出来的创意作品适合商用。比如使用即梦软件将黑白照片生成彩色照片效果也很好。 这是一张一岁婴儿的黑白照片。 <p class="ql-block"> 在图生图的界面,导入黑白照片,并写下提示语:“将这张黑白照片生成彩色照片。保持婴儿五官特征不变,以 100% 的参考强度生成,让其肤色呈现肉粉色,细腻润泽,脸部过渡有层次,并添加美颜效果。”然后点立即生成~很快即梦生出了4张不同效果的彩色照片,相比较而言,第4张我觉得更好。</p> 即梦做出来的数字人就更逼真,说话时的动作表情口型更自然。 <p class="ql-block" style="text-align:center;">这款是MJ绘画做的。</p> <h3 style="text-align: center">而这款是即梦做的。</h3> 两款比较起来,即梦做的更好一些。 <p class="ql-block" style="text-align:center;">这也是即梦做的。</p> <p class="ql-block"> MJ绘画专业级的软件,功能强大,运行稳定。自不必说可作为首选。和其他软件相比,它做视频功能更强。我特别看重KLING的图生视频功能:先上传一张图片作为视频的首祯,再上传第二张图片作为结束祯(选填),而后在文本框中写入你对这段视频的创意描述,点立即生成。AI会根据你的创意描述生成第一段视频。你可以用同样的方法把第二张图片作为首祯,再把第三张张图片作为结束祯,生成第二段视频。而后把两段视频按顺序拼接起来(如果还有第三段第四段视频的话也按顺序拼接起来),最后合成一段完整的视频。一组连续动作的照片可以通过这个方法做成一段流畅而完整的视频。这个界面俨然就是一条小型的动画片生产线。</p> <p class="ql-block"> 这一组照片摄于2014年8月28日。一个不到7岁的小男孩儿(生日是8月31日)正在住宅区的小广场上骑车。小孩儿的家长给了我8张连续拍照的图片,希望我能把它们串起来做成视频作为生日礼物。当时我没有办法完成她的要求。</p> <p class="ql-block"> 这回我用MJ绘画KLING图生视频功能完成了这个夙愿,虽然迟了十多年。如今这孩子已经长大就要参加高考了,请接受这个迟来的礼物吧。也许你会说这个视频看上去有点儿怪: 有的地方小孩儿使劲儿蹬脚踏板儿车就是不走?这其实是个时差问题。小视频都是按照5秒时间段做的,而当时拍照时每张间隔时间或许是2秒或许是10秒不等。时差问题可以通过第三方视频编辑软件通过后期剪辑解决。</p> <p class="ql-block"> 用同样的方法还制作了一个装怪兽小孩的视频。</p> <p class="ql-block"> 用这种方法还可以制作出更复杂的闭环街景视频。</p> <p class="ql-block"> </p> 这一组连续照片记录的是古荆州城街景及东门(寅宾门)城楼的闭环景像。通过MJ绘画的图生视频的工具,将这组照片做成了镜头环顾一圈看到的影像。AI根据人和物的运动逻辑创建了动感十足的影像,没有违合感。小片与小片之间的衔接自然流畅。 <p class="ql-block"> 街景与城楼两个场景的巧妙转场即合乎逻辑又富于想象力和创造性,更体现了MJ绘画有别于其他视频编辑软件的优势。</p> <p class="ql-block"> 图生视频写好提示语也很重要。</p><p class="ql-block"> 一位面带温暖笑容的女士,神情惬意地摘下头顶的眼镜,低头仔细端详镜片后,优雅地将其戴上。然后又缓缓地摘下眼镜面向镜头微笑。柔和光线勾勒她放松的侧脸,背景虚化突出细腻动作,浅景深营造生活化氛围,镜片反光点缀细节,整体风格清新自然。</p> <h1 style="text-align: center"><b><font color="#ed2308">五、结束语</font></b></h1> <p class="ql-block"> AI制作叫我着迷,迷就迷在它给了我图片和视频创造的无限可能性,多少年前想做而没做到的事情现在通过AI软件都做成了。感谢我们这个时代科技的迅猛发展,使我有幸实现自己曾经的愿望!我越来越相信这句话:有AI的加持,在未来的探索中,只有你想不到的,而没有你做不到的!</p> AI制作实现了几十年前老照片的情景再现。 AI塑造了新歌手,一曲《芦花》动人心:芦花白,芦花美,花絮满天飞,千丝万缕意绵绵,路上彩云追~ <h3 style="text-align: center">《好一朵茉莉花》</h3> <h1> <font color="#ed2308"><b>朋友,看到这些可爱的数字人,你会不会也对AI制作着迷了呢?</b></font></h1>