设为首页加入收藏
  • 首页
  • {$vo.typename}
  • {$vo.typename}
  • {$vo.typename}
  • {$vo.typename}
  • {$vo.typename}
  • {$vo.typename}
    • 当前位置:首页>朔州>AI唱的歌离神很近,但离人可能有点远了。

      AI唱的歌离神很近,但离人可能有点远了。

      发布时间:2026-04-20 来源:洛阳纸贵网作者:资深bkt爱好者

      先问大家一个问题,你觉得什么才是真正的音乐?

      大伙的答案肯定不一样,但肯定都觉得,自个儿最有品位。毕竟,人类的悲欢并不相通,但人类的装是相通的。

      听 DJ 版的,觉得动次打次爽,这才是真正的音乐;有的人就爱听洋文,听不懂的才拽,说 this is true music。

      但哥们最近玩手机的时候,似乎发现了种新的艺术形式。。让AI唱歌。

      万恶之源呢,是千问App这波更新,让它支持上传一张图片,然后唱,跳,rap了。而且,不光是让一张图唱跳起来,还支持随意编辑图片,修改场景,甚至指定音乐风格。

      也就是说,没有模板,AI需要根据它对音乐的理解自己哼调子。

      就是吧, AI原声嗓。。。有点抽象。

      具体多抽象,真不是我三言两语能形容的。因为艺术,只可意会不可言传,咱直接上片,熏陶一下各位差友。用法很简单,直接在对话框里聊就行。

      比方说,这是一个兵马俑。站在那威严肃穆的眺望远方。

      他一定想不到,在两千年后的今天,会出现这样一句歌词,让他又蹦又跳地唱出来:“秦始皇摸电线,赢麻了。”

      但反差的是,他似乎真的理解了这句话的意思,举手投足间都显示出了一种赢麻了的快乐。。

      别问好不好听,你就说乐不乐吧。

      当然我知道,有的人听音乐就喜欢听个响,那有没有激情一点的曲风呢?

      有的。有很多人说奶龙不是龙,但我不同意,必须让它释放出自己内心的呐喊。

      我让它参考摇滚乐的风格,让奶龙边跳边唱“我是奶龙我是奶龙奶龙也是龙!”

      结果吉他、鼓点,甚至怒音这一块都有了。

      如果你说,一个人唱不得劲,合唱也不是做不到。

      这是最近很火的疯狂动物城的两位主角,电影里的配合非常精彩。

      那在音乐里呢?于是我让它们合唱了一首“因为我们是一家人”。。

      确实温馨确实动人,就是唱腔不太像动物城本地人哈。

      当然,这只是最基本的玩法。如果你有想象力,你甚至可以发挥千问最新的图片编辑功能,人,随你挑,场景也随你挑。

      这有一张差评君捧杯的图片,还有一张熊二的图片。

      我们直接丢给千问,让熊二继承我们差评君的大奖杯。

      然后咱随便挑一张,让它开始唱“We are the champions”。

      结果这次居然不抽象了? 还真有内味,不仅节奏能对上,连声线都对上了,奖杯还随着晃动闪着光,意气风发这一块。

      当然,Cosplay换装这块它也能拿下,比如让八戒穿上猴哥的衣服唱跳。

      那唱点啥呢。。西天取经的路总是艰苦的,有时候不知道路在哪里。所以为了给他中和一下,我给他点了首《有点甜》。。

      这小碎步,我真没见过这么灵巧的八戒,甚至老猪的音色也保留了。

      当然,高山流水和下里巴人都是艺术。接地气的咱玩够了,咱可以再来点高雅的。

      我找到了两幅世界名画,蒙娜丽莎,戴珍珠耳环的少女。为了更加上流,我让她们在维也纳金色大厅合照。

      这么高级的场合,唱点什么呢?这�月了,来首《圣诞星》吧。。

      看看成品,我是感觉,千问还是会分场合的,该抽象的时候抽象,该优雅的时候,也不怎么搞怪,不说维也纳,起码算个谁也讷。

      不过,还是只能整活啊,要是能真来点交响乐,那就更好了,但毕竟是AI嘛。。

      不对,它真会啊?

      这确实太优雅了,有种吃韭菜盒子吃到鲍鱼馅的惊喜感。。

      但我玩到这里,还没玩尽兴,我决定找一些更极限的玩法。比如,我拍了两个玩偶,让千问给他们转成像素风,没啥大问题。

      接着挑了张图,让它们唱了一񟿤-bit风格的歌曲。

      结果就一个字,萌,连音色都还原得很好。

      当然,艺术不仅是音乐,所以我手绘了四个人,俺觉得也能成为艺术的一部分。

      然后发给千问,让这四个人合唱“天下相亲与相爱”,长得就很像嘛不是。

      结果,它不仅把四个人都识别出来了,甚至知道哪里是嘴,全给他们逗乐了。。

      最后,这玩意儿生成的视频看着抽象,背后的技术其实相当硬核。

      视频生成的背后是Wan 2.5,支�P,最�S,一次指令就能做到音画同步、口型对准。据我所知,目前国内AI助手能做到这种“音视频同时输出”的,也就千问独一家。

      而修图功能,则是基于新模型 Qwen-Image-Edit,不仅能看懂图,还能在改图的时候保证人物不崩、光影不乱。

      属实把最顶尖的 AI 技术,全拿来给我们整活用了。

      虽然它唱的调子,跟咱人类理解的旋律不太一样,但这也是AI自己根据图像、提示词推理生成的,有属于它自己的思考,只是没那么像人。但按AI的学习速度,可能很快就进化成音乐大师了。

      玩了这么多下来,我的感觉是,说抽象是真的,说有意思也是真的。

      不管是唱跳rap的八戒还是大厅里的交响乐,那都是音乐,只是阴阳的区别。

      你想看点阴间的,它能给你整百鬼夜行;你想看点阳间的,它也能给你整出维也纳之声。

      工具已经搁这儿了,至于怎么用就看各位差友的精神状态了,感兴趣现在就可以去更新体验下哦。

      撰文:不咕

      编辑:江江

      美编:焕妍

      图片、资料来源:

      千问,部分来自互联网

      • 上一篇:{loop type="arclist" row=1 }{$vo.title}