解放思想,向AI要东西。
事情是这样,前两天有个很不错的开源tts项目,叫作chattts。
这个文生语音效果因为加入了喘气和逼真的笑声而显得情绪饱满,尤其是女声,性格喜人。
那时候,还没有像这样的一键安装包:
https://github.com/6drf21e/ChatTTS_colab chattts的一键安装项目
所以,我只能是一点点在github上面看教程,然后一点点摸索,过程不再赘述,结果就是我强行用终端安装完毕。
交互的时候也需要在终端输入文字:
这里需要解释一下,上述文字seed后面的2333可以替换任意数字,然后前面的文字内容也要替换,比如,我想让ai说“豆瓣的网友都好有才华”,使用某个声音,比如我随便弄个seed值是666,那么我就需要输入:
在终端里就是这样的:

如果我要输入其他,也都是这样的替换法,如果我要是添加呼吸和笑声,还得继续打字输入:
这个过程玩一次两次无所谓,但是如果你要是想多秀几次,你会发现终端这个界面,你不能用鼠标点选输入位置,只能用方向键来移动鼠标,这样就让每次的输入都很不得劲。再被折磨了n次以后,脑子里突然想到难道不能写个什么东西来让这个自动化吗?
但是,别忘了我们可什么代码都不会写。那是不是这样想就异想天开呢?在以前这样的想法可能你不会就没法实现,但是有了AI,一切是不同的。于是,我就直接开问:

那AI就直接给我Python代码了。到这一步你可能会说,那这又出现了Python,还是得学这个啊。
等等,我到这里的时候,看见这些也麻烦,于是就说就不能做一个网页吗?

然后,当我满怀信心复制粘贴,改后缀打开的时候,发现没有预想中的界面,而是一堆代码,渲染失败。那就不用纠结,如实相告:

它先是认为我使用了中文标点符号,结果重新弄还是不行。又认为我没有使用UTF-8编码,结果用了还是不行。又认为我“getElementById”拼写错误,测试继续失败。
调试三次后,我觉得得告诉它我怎么存的,就把软件这些都说了一下:

果然问题出在软件的设置上,跟着操作一遍,拿到了第一版的GUI,我试着输入想说的话,它给出了代码:

然而,当我去点击生成命令区,去删除多余符号的时候,却发现不能编辑,那很简单,把这个事儿告诉AI就行了:

我想要的还挺麻烦,需要一个JS脚本,后来一想也别费劲了,只要能编辑生成框里的文案就行了,于是把它给我的新代码重新替换了旧的代码,于是一个转换器就做好了:

双击打开如下:

完全可用,生成区可编辑,然后写好,删除多余的,复制到终端,很省事儿。
我知道这个东西对于学过计算机的人来说,完全不值一提。但是对于像我这样一个纯麻瓜来说,我觉得意义在于,我学会了向强大的计算机索要我想要的东西。
这是新时代里,我们首先要学会的。无关技术,只是尝试突破一种心理障碍而已。
帮朋友推荐2本书:
这个是关于爱的,不是AI的,它讲述的是最神秘的情感体验中,那些你感受得到却不知道如何诉说的烦恼。也许它可以帮助你理解你自己关于爱的全部体验。
因为成书比较早,没有能纳入ChatGPT发明以后的历史,所以有些观念稍显落后,但是对ChatGPT以前的内容的汇总,还是非常提纲挈领,把最关键的东西都搜罗出来了,可以作为人工智能通识的入门书。
魔云兽的最新日记 · · · · · · ( 全部 )
- 送你一株真的向日葵,换一点“阳光种子”给我 (81人喜欢)
- 有了大模型,我们怎么思考? (4人喜欢)
- 动动嘴皮子,AI就给我做了一个数学动画视频! (3人喜欢)
- 让你的AI做更多事,ChatWise怎么用MCP服务? (3人喜欢)
- 怎么教老年人学AI,推荐一下这本贴心的新书 (1人喜欢)
热门话题 · · · · · · ( 去话题广场 )
-
加载中...