游戏
无障碍浏览

47

评论

48

72

手机看

微信扫一扫,随时随地看

“雷军爆粗”全网爆火,背后的技术把我看傻了

全文1804字,阅读约需6分钟,帮我划重点

划重点

01国庆假期后,网友们纷纷用AI配音工具生成雷军的语音,吐槽假期过得太快和各种离谱现象。

02AI声音生成的本质是用素材喂模型训练,雷军的语音素材丰富,使得AI骂人视频与本人相似度非常高。

03除此之外,一些网站提供角色声音克隆功能,只需上传人声音频文件,几十秒就能克隆某人的声音。

04然而,AI声音克隆技术也被某些有心之人用于违法犯罪行,如三只羊高管录音事件和老人被骗事件。

05为此,大厂们如Meta和谷歌推出AI音频水印工具,以应对AI声音克隆技术带来的潜在风险。

以上内容由腾讯混元大模型生成,仅供参考

图片
离开国庆的第一天,机哥除了想它,还是想它。

长假后的戒断反应,也已经在上班第一天体现得淋漓尽致。

比较明显的症状有两个。

第一个是——

坐在工位前的我,对着屏幕居然有点词穷,想不出骚话了。

“师傅你是干什么工作的”,这句话放在此时的机哥身上,竟如此合适。

图片

再说到第二个戒断症状。

说出来你可能不信,我被雷军的声音洗脑了。

放假期间,我甭管是刷B站、抖音还是微博,都能听到雷军儒雅迷人的的声线,在推荐信息流高强度播放。

图片

而且是各个领域皆有涉猎。

吐槽力度之大,也是让机哥感受到前所未有的震撼。

多的不说,机哥结合时事,给大伙上一段——

雷军吐槽假期过太快

按住画面移动小窗

X

只见雷军开局就是素质问候,用激昂的语调吐槽七天假期过得太快,眼睛一睁一闭就过去了。

除此以外。

雷军还乐此不疲,在短短七天时间内,把各大领域的奇闻趣事,都吐槽了个遍。

图片

比如三角洲行动玩家们的玩法,过于不讲武德。

图片

锐评英雄联盟大乱斗胜率队,破坏普通玩家游戏体验。

图片

吐槽吃鸡匹配到的队友太菜。

按住画面移动小窗

X

考虑到大多数“雷军锐评”的台词,都掺杂了大量“儒雅随和”的粗口。

机哥就不逐个放上来给大伙试听了。

但可以肯定的是,大多数米粉在这个假期并不无聊。

因为每天上网随后一刷。

都能听到雷总,用着最斯文实诚的声音,骂出攻击性最狠的语句。

图片

以至于连雷总自己都绷不住了。

在微博发了三个愤怒的表情,来回应网友们的恶搞。

图片

看到这里,机友们应该也能猜到。

国庆7天假期嘴没停过的“雷军锐评”,其实是由网友们用AI配音工具生成的。

忆往昔,UP主制作“Are You OK”鬼畜,让雷军火遍大江南北。

看今朝,又有大批网友用雷军的声线当作嘴替。

图片

之所以网友们会选用雷军的声音,来吐槽、锐评各种离谱现象。

比较靠谱的一种说法是。

雷军平时给人的感觉就很儒雅礼貌,说话也是不紧不慢,真诚友善。

所以,网友们用这个声音去骂人时。

斯文的声音和攻击性十足的语句,便形成了节目效果拉满的反差感。

图片

这就好比黑神话里,悟空拿着AK扫射BOSS。

图片

唐僧放下经书,捡起多年不练的拳脚功夫。

网友们爱看的,就是这种脱离原著的离谱效果。

图片

当然啦,还有一个比较重要的原因是,雷军的声音素材实在是太多了。

AI声音生成的本质,就是用素材去喂模型训练。

像B站比较火的GPT-SoVITS克隆声音模型,已经能做到用1分钟的声音素材,复制一个人的声音。

不过道理还是那个道理,的高质量素材越多,声音还原度就越高。

图片

而雷总这些年来,开过的发布会都不计其数了。

各种清晰的低中高音,乃至破音素材,都能在网上搜集到。

所以咱们能看到。

现在网友们发布的雷军AI骂人视频,声音和本人相似度非常高。

甚至平时说话的语气,包括升调、降调和重音,都能做到很不错的还原。

图片

哪怕你对声音大模型、AI技术了解不深,电脑配置带不动大模型。

那也没关系。

因为现在网上就有很多,开箱即用的TTS声音模型网站。

图片


基本上热门一点的人物声音,都能在里面找到。

比如雷军、孙笑川、科比和蔡徐坤等等...

图片

机哥也现学现卖,在网页版选了雷军的模型,简单生成了一句话。

讲真啊,这情感、韵律和音色真的和雷军很接近了。


你要是觉得,网红和名人的声音被用得比较多,不够独特。


很多网站也同样提供,角色声音克隆功能。


只需要把时长>2秒的人声音频文件上传到网站。


几十秒就能把某个人的声音克隆过来。


图片

说白了,在这几年的技术大佬爆肝迭代下。

现在声音克隆、音色实时转换,都已经不是啥高门槛的事儿。

自己不懂技术也没关系。

只要愿意掏钱充个会员,一大堆声音大模型网站,排着队等你上门使用。

所以咱们才能看到,这个假期会冒出那么多AI雷军出来整活。


图片


不过机哥还得提个醒啊,凡事都得有个度。


虽说从雷军本人的回应来看。


他是不介意网友们整活玩梗。


但不代表,网友们就可以用这克隆的声音,去恶搞骂人。


特别是有些视频台词,基本每说两句话,就带好几个素质低下的脏词。

别说雷军本人了,很多网友听到都觉得很低俗。

图片


对于大多数,对AI技术、网络趋势了解不深的中老年人来说。

甚至会觉得,是雷军本人在到处骂人。

图片


而且客观地说。

现在AI声音克隆这技术,已经被某些有心之人,拿去搞违法犯罪行为了。

像是前阵子才上过热搜的,三只羊高管录音事件。

最后就被官方实锤,录音是被人用AI训练声音后,再生成、合成到视频里头。

图片


时间再往前一点,今年4月份也有新闻报道。


有一位老人接到电话,对方声音跟她老战友一模一样,最后这老人就信以为真,把钱转给了骗子。


图片


如果说只靠声音,说服力还不够。


那要是AI换脸+AI换声混合双打呢?


图片

图片


这么看来,AI声音克隆和AI生图都面临着同样的问题。


随着使用门槛越来越低、效果越来越好。


相应的检测手段,似乎有点招架不住。


好在大厂们,目前都没闲着。


比如Meta的AudioSeal模型,会在AI生成的音频上标记隐性水印。


图片


谷歌去年年底,也推出了类似的AI音频水印工具。


图片


总的来说,机哥还是希望相应的检测技术能跟上的。


这回是雷军的声音被拿来整活。


下次要是骗子偷了咱们的声音去诈骗亲朋好友呢。


啊,瞬间笑不出来了。


图片来自网络

这绝对是来捣乱的
↘↘↘
免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
已显示所有评论
首页
刷新
反馈
顶部