虽然翻译的有些不到位,不过从测试程序可以看出来语音互译的雏形已经完备,这种翻译水平已经达到了某些三四流翻译软件的水平。
而众人的主要任务就是收集数据,让翻译软件“学会”英语。
为什么是“学会”呢?
这是因为翻译软件的算法决定的,这款软件采用的分类思维,将每个词语设定为一个坐标,并且分类为名词、动词、助词等。
将词语设定为坐标的好处就是将长难句进行肢解,翻译软件处理时就可以将每个词语准确翻译。
接下来就是按照语言的语境进行筛选组合,将不同的翻译对象需要的语法和含义进行组合,并对缺少的要素补足。
这就是许弋手里的翻译软件的逻辑。
但现在许弋手里的这款翻译软件还是有不完美的地方——数据不足。
数据不足的话,这款软件翻译功能就不完善。
它需要像个孩子一样,通过学习某种语言直到学会了的话才能进行准确的翻译工作。
所以,现在的主要的工作就是让翻译软件进行学习——录入、收集数据工作。
“我们需要花一个星期的时间,让翻译软件学会英语。”许弋开始安排各位的工作。
“好的!”众人激动不已,一旦完成,就意味着一款前所未有的翻译软件即将从他们手上诞生。
众人开通过网络寻找大量的资料,收集数据和搭建服务器。
接着在各大网络直播间都开始出现了未央带尾标的ID,只看直播不发言。
李鹏和吴明还收集了大量的美剧和好莱坞大片,在电脑上挂着语音互译软件播放一遍,用来收集数据。
由于大家都在看电影看直播,一度惹的同一楼层的其它公司以为这里是某个富二代盘下来给手下的小老弟们聚会的地方。
在某个直播间,一个刚直播的新人在直播了一周以后终于迎来了一个叫未央233的观众。
女主播在直播间搔首弄姿的叫着未央哥哥要打赏,就差没脱衣服了。
要是她知道未央233只是一个收集数据的端口会不会气的全身脱光。
按照公司的光纤传输速度及语音互译软件收集文件及音频的速度,预计需要一周的时间。
在期间(收集数据开始前半个小时),许弋检查语音互译软件的运行。
很快,在某一个平静的工作日的上午,未央科技公司低调地在应用平台上发布了人工智能语音互译。
本章已完 m.3qdu.com