折腾VITS个性化声线

昨天中午发现一个VITS代码库,可以根据个人的语音文件,通过训练生成个性化的声线。

因为在多语言情况下环境依赖难配置,那个项目是使用Colab运行的。自从有了国内的GPU云后,我已经很久没有使用Colab了,但看说明并不难,回去饭都没吃就开工,没想到一直到了第二天快两点也没有完工。

其实本来还算顺利,在解决了几个细节问题后,本已经进入最后的训练阶段,但就在进行到90%时,系统突然报错断开,仔细一看,原来是免费的GPU算力用尽。

前功尽弃,这免费的资本主义羊毛也不是这么容易薅的。

其实我也有心理准备,我最终目的就是转到国内的GPU云服务器上,但百度现在只提供飞桨框架,而最常用的恒源云最后阶段总是卡在路径参数上。毕竟这个系统是基于Colab的。

熬夜没有等着colab新的算力到账,早上起来打开电脑,依然无法使用,想付费人家只认美国信用卡。

好在到单位用他人账号登录Colab,有了昨天的经验,顺利完成了训练,效果尚能接受。毕竟训练使用的只是一个样本文件,如果使用大量语音文件进行训练,效果应该还会提升。

狗仗人势,亦看人性

前段时间入坑短视频,起因是看宠物视频。虽然后来看的杂了,但还是关注狗子的品种,想知道那次跟柯基开撕的恶狗是何方神圣。
后来还真让我看到了,那家伙叫细狗,网上风评很差,据说战力上乘。
看来柯基虽然平时怕硬不欺软,看到大狗就绕着走,但还是没有辱没自家猎犬血统。那次如果不是被我拉紧绳子影响发挥,估计能把那厮咬的落荒而逃。
小时候在村里也没少看狗打架,还是能看出胜负强弱的。
那时候村里的人家认不全,但谁家的狗倒是分得清。无论在村里还是进城后回姥娘家,也总被提醒小心谁家的狗。
狗仗人势不假,同样什么人家养出什么样的狗。

见贤思齐,狗子亦然

昨天进门柯基没有扑上来,出门也没听到他那惨烈的叫声,眼里、耳中都空落落的。

心里想着柯基,回去路上特意留意了一下,在路口拐角人家门口,又看到了那条拉布拉多犬,保持着一贯的肃穆神情。

去年一天下午例行遛完柯基,到门口发现密码锁坏了。我就坐在在路口拐角的椅子上,在等送钥匙过来。

那时候柯基难得老老实实趴在我脚边,不像以往那样窜来窜去。我一直以为这家伙是跑累了,直到那家人开门出来,我才注意到门口还趴着一条大拉布拉多犬。

柯基也站起来,一脸羡慕表情地看着拉布拉多犬进门。

都说物以类聚,人以群分。同样,见贤思齐,,狗子亦然。

让子棋让人失望的18B权重

去年感觉到自己阳的时候挺突然的,当时正在网上跟一个网友测试katago让六子棋,突然之间感觉头疼,脑子几乎空白,屏幕都看不清楚了。
那之后一脑子感觉昏昏的,集中精力时间长一些还会有刺痛感。
昨天晚上又与那个网友约定进行让子棋测试。可能为了保证系统稳定,减少了AI信息的返回量的缘故,动脑少了,躺下后脑子没有昏沉沉的感觉,反而清醒的很。
不过测试棋中,目前风头最劲的18B权重实在有失面子。不止是我,被让子方也怀疑是自己水平提高了,还是AI出了问题。即便将pda设为最高,18B依然是斤斤计较官子的大小,可以说是按部就班地输掉对局,或者说,他根本就没想赢。
我们均不甘心,又换成最新60B权重对战一局,结果对局进程幡然一新,从角部开始缠斗,一直纠缠到官子。虽然因为机器配置低,计算量不高而告负,但依然有取胜的希望。
估计现在一直没有更新的18B权重,如网上流传那样,是为了比赛而特训的权重,可谓棋风全面稳健,官子滴水不漏,颇有小林光一之风。
而到了让子棋,必须强力攻击,就非其所长了。

ChatGPT的成本

今天看新闻,谷歌在大倒苦水,说现在ChatGPT类产品的成本要大大高于传统的搜索。感觉这有点吃不到葡萄说葡萄酸的酸酸味道。
成本还分有效成本和无效成本之分呢。
在谷歌之前,是以雅虎为代表的目录式的搜索引擎,找到什么内容完全看供应商的勤快程度。后来谷歌等爬虫式的搜索引擎,基本上是广撒网良莠兼收,同时根据用户访问量进行整理排序。
后来都学坏了,也不知是国内外谁跟谁学坏的,也开始干预,甚至到了吃相难看的地步。
而到了现在的ChatGPT,则等是用户把内容推送上门,或者帮助系统整理归类,这等好事,原先是需要累死多少爬虫啊。
如果现在再把ChatGPT当做搜索引擎,或者整合到搜索引擎中,就有点像前段时间某学者怒斥知网一样:用了我的文章,还向我收费。

短视的业务整合

今天看新闻,百度掌门终于亲自为自家类ChatGPT产品文心一言站台了。

虽然根据之前百度的一贯作风,并不意外百度的小家子气,但看到百度要将文心一言与搜索业务整合,还是没有想到他会如此短视。

百度的没落源自搜索业务的没落,而随着ChatGPT的横空出世,受到冲击最为剧烈的就是搜索引擎。而百度偏偏要用自己难得拿得出手,甚至可以藉以东山再起的文心一言,与日薄西山的搜索整合。

这就像一个破落八旗子弟,家里发现家里箱底有件值钱黄马褂,却非要把新衣服裁了补旧袍子。

何况把ChatGPT整合到bing中的那位刚栽了跟头,好歹人家更有钱,买的还是干儿子,榨干一点是一点。

而百度,这两个可是亲儿子,非要让不肖子拖累死麒麟儿才罢休啊。

ChatGPT小说创作火候还远

近几日跟ChatGPT的交流,主要是基于小说的创作,这方面显然ChatGPT没有网上吹嘘的那么神乎其神。

关于写作,网上评论的AI缺少想象力不是原因,而是结果。这除了受限于AI的数据集,更主要的是AI无论中外,都是受限于内容审核,就像戴着镣铐起舞,像《水浒》这样的小说,根本不可能续写或者再创作。

即便是创作洁本,AI也时不时闹笑话,因为我构思的是架空小说,今天又来了一个曹操反清复明令人瞠目结舌的组合。

如果说AI参与小说创作,那也主要用来注水,而现在小说这种注水本来就不少,AI捉刀,倒也合适。

关于高考,ChatGPT不靠谱

最近关于学生最热的莫过于考研成绩查询,其次是高一学生选课,已经远远高于四六级分数查询。

早上测试了一下ChatGPT,询问山东高一学生选课的建议。

不出所料,基本回答就是错误的,因为这与国内外关系不大,最主要的原因还在于ChatGPT的数据还是截止到2021年。此外就是,更多建议存在于所谓咨询机构的PPT上,公众讨论的还是稀少。

不过,ChatGPT的套话还是值得参考的,我最为赞同的是那就是对学习压力较大的科目进行减负,选择其他科目进行备考。

最后突发奇想,免费的ChatGPT是不是在装傻卖呆啊?

ChatGPT的热度似乎在降低

这几日ChatGPT的热度降低的有点极速,除了微软的bing这位急于求成的猪队友,还因为国内本来想跟风的几位,冷静下来发现,这类ChatGPT除了技术、数据的积累,光硬件能烧的起的也就有云服务业务的那几位。
即便走在前面的百度,也是少有的低调,在宣布文心一言三月推出后,少有进一步的跟进宣传。唯一官方靠谱的新闻,就是确定文心一言将通过百度智能云对外提供服务。
这与我最初的预计差不多,因为百度的各项AI服务,如我常用的OCR、文字语音服务等,都是通过这种形式。
这样也好,用户可以通过api各取所需,或直接使用,或嵌入到自己的业务中,同时收费也更有弹性。

刷抖音亦有所得

前段时间我也开始通过刷抖音来打发时间。发现这东西的确有毒,不过还好没有上瘾,进入新阶段,有正事干也就没有兴趣再刷了。
我刷抖音主要只是选择自己感兴趣的内容看看而已,唯一收藏的一个描述清末新疆历史的《铁马冰河戍轮台》。作者讲述平实,没有哗众取宠的视频和语言,但褒贬之情自然流露。如说某位叛乱首领历来秉承公正执法,有偷东西的人被他下令炮决。
只是视频更新虽然频率不低,但每期时长较短,颇不过瘾。尤其是正讲到那群魔乱舞最为黑暗的时期。
不过还好,虽然对那段历史了解不多,不过还是知道,这些魑魅魍魉也蹦跶不了几天,等刘锦棠率军平盘之时,就是天神降凡降妖除魔之日。
用网络流行语就是:虐成渣。
很多年前在杂志上看到过一段田中芳树的话,现在已经不明真伪,大概是:大将有武将、智将之分,兼而能之的则为名将。
刘锦棠可谓是古今难得的名将。