第11章 茶里茶气的梁舒瑶
⚡ 自动翻页
开启后阅读到底自动进入下一章
⚡ 开启自动翻页更爽
看到章尾自动进入下一章,追书不用一直点。
  “第二,素材预处理,用户导入视频素材后,后台同步进行分析,分析完成前先提供基础剪辑功能。”
  “最后,也是最简单的,降低预成片的解析度,1080p渲染慢就720p,还不行就先上480p。”
  “先解决有无问题,后续版本更新中再想办法优化。”
  “好,老板我明白了。”有了初步解决方案,罗浩心里就有底了。
  等罗浩离开,陈宇继续思考“语音转字幕”的准確率和同步性问题。
  他希望软体能自动识別视频中的语音,並生成带时间轴的字幕轨道。
  这个剪辑功能在后世司空见惯。
  但在15年,国內可用的语音识別api收费昂贵且准確率堪忧。
  这一难题只能通过开发新技术解决。
  他测试过讯飞和度娘的语音识別sdk,中文普通话的识別率能达到90%以上,但需要联网,而且有並发限制。
  如果用户量大,api调用成本会高得无法承受,导致利润都被赚走,让瀚宇科技为別人打工。
  这是陈宇无法接受的。
  所以他必须自研语音识別技术,重点是字幕和视频画面的同步要精准,误差不能超过0.2秒。
  这个数字很微妙。
  多了就会让用户明显感觉到卡顿,少了的话,技术实现难度將呈指数级上升。