首页 > V2EX > V2EX-分享一个 AI 字幕工具,自建的语音转写服务,更高的准确度,支持英日韩法等 20 多国家语言
2023
01-25

V2EX-分享一个 AI 字幕工具,自建的语音转写服务,更高的准确度,支持英日韩法等 20 多国家语言

yedaxia:

软件首页:33 字幕

V 友们新年好,我是 33 字幕软件的开发者。

AI 字幕工具已经很多了,为什么还要重新做一个呢?

作为一名独立开发者,在一个竞争激烈的领域,胜算是很低的,另外一方面,做同样的东西意义也不大。

之所以打算自己做一个,原因主要有两个:一个是自己这边就有制作字幕的需求,长期来看可以降低一下这方面的成本。还有一个重要的原因是,我们有尝试接入过不少国内云服务商的语音转写服务接口,但对于非中文,发现识别结果没有很理想。

如果你试用一下 33 字幕,你会发现识别的准确度比很多软件要好不少,尤其是外语,不过准确的背后也是有代价的,相应消耗的算力成本也会成倍增加。

除了自己部署的语音转写模型,我们也集成了阿里云、讯飞语音等第三方的语音转写服务。

和大部分 AI 字幕工具不一样,我们把选择权交给使用者,你可以选择效果好成本高的引擎,也可以效果没那么好,但成本低的。

也许有人可能觉得,没有必要让使用者知道太多细节,直接给出最好的结果,这样既可以降低认知负担,又能隐藏技术细节和成本结构。

现实问题大部分是没有银弹的,信息不对称也许对商业有好处,但如果我自己作为一个软件使用者,我希望自己是有选择的,而不是只能选择用还是不用。

这个软件功能非常简单,就是把提取出音频,然后上传到服务器,把音频内容转成字幕文本输出。

对于我们,这个工具把我们最关键的一环补上了。后续的字幕调整工作,有比较完善的工具作为补充,比如 Arctime pro ,Aegisub 等,当然,我也希望可以直接在一个软件内就完成所有工作,这也是后续完善产品的一个方向。

为什么不做成网页端,而是要以 PC 客户端这么重的形式来交付呢?

一开始我们也想通过网页应用的形式,前端方案是通过 ffmpeg.wasm 来完成音频提取、转码等工作,但无奈这个方案存在很多限制,最后放弃了。

要知道,一个产品最终成本都会由使用者来承担。出于以更低成本运行软件的考虑,我们决定通过客户端来解决这个问题,把一些比较重的计算一部分交给用户自己的机器来完成,尽管这样做会增加前期的开发成本,甚至可能损失部分用户,从长期看,我们认为这是值得的。

而且这样做额外的好处还可以做到不上传和存储用户的视频内容,降低总体成本的同时,也保护了内容安全。

这个工具主要可以帮助到哪些人?

  1. 视频创作者:带字幕的视频往往会具有更好的完播率,可以帮助观看者更好地理解内容,尤其在地铁和公交车等一些公共场合中观看视频的时候。
  2. 追海外剧狂人:很多海外剧不带字幕,等字幕组出来需要时间,而通过 33 字幕生成的字幕,然后加上播放器的翻译功能,对于看剧来说应该完全够了。
  3. 外语老师:可以结合我们另外一个帮助构建台词搜索的软件:QuoteHunt ,来构建一个教学素材库。
  4. 字幕组:听译应该是字幕制作流程中对人要求最高,而且最耗费精力的一环了,通过 33 字幕生成初步的字幕稿,可以大大降低制作成本。

给大家送上一些算力兑换码,欢迎试用:(可兑换 10000 算力)

ncJb
AmCt
4BhT
X4Ce
0yyb
N8Vo
cs8G
ha9T
dzN5
dI5J
5QZC
devr
rvVI
qQq1
pPRx
38gQ
RtaF
mKrp
eH0N
PjkQ

软件下载

如何使用兑换码

from V2EX-最新主题 https://ift.tt/9Nok4tw
福利APP推荐:https://niucnet.notion.site
广告投放:https://t.me/cnxalex
牛C网:https://j1o.net
牛C网导航:https://niuc2.com
福利APP合集:https://j1o.net/share/1678.html
V2EX-分享一个 AI 字幕工具,自建的语音转写服务,更高的准确度,支持英日韩法等 20 多国家语言 - 第1张  | 牛C网(NiuL.Net)

最后编辑:
作者:分享菌
这个作者貌似有点懒,什么都没有留下。

留下一个回复