2月27日学生构建人工智能模型将手语实时翻译成英语

导读 人工智能 (AI) 已被用于开发各种翻译模型,以改善用户之间的沟通并打破跨地区的语言障碍。谷歌和Facebook等公司使用人工智能为其服务开发

人工智能 (AI) 已被用于开发各种翻译模型,以改善用户之间的沟通并打破跨地区的语言障碍。谷歌和Facebook等公司使用人工智能为其服务开发高级翻译模型。现在,来自的一名三年级工科学生创建了一个人工智能模型,可以检测美国手语 (ASL) 并将其实时翻译成英语。

Vellore Institute of Technology (VIT) 的学生 Priyanjali Gupta 在她的 LinkedIn 个人资料上分享了一段视频,展示了基于 AI 的 ASL 检测器的实际操作演示。虽然 AI 模型可以实时检测手语并将其翻译成英语,但目前它只支持少数单词和短语。其中包括你好、请、谢谢、我爱你、是和否。

Gupta 通过利用 Tensorflow 对象检测 API 并通过名为 ssd_mobilenet 的预训练模型使用迁移学习来创建模型。这意味着她能够重新利用现有代码以适应她的 ASL 检测器模型。此外,值得一提的是,AI 模型实际上并没有将 ASL 翻译成英文。相反,它识别一个对象,在这种情况下是标志,然后根据其数据库中的预编程对象确定它的相似程度。

在接受Interesting Engineering采访时,Gupta 指出,她创建这样一个 AI 模型的最大灵感是她的母亲在参加 VIT 的工程课程后唠叨她“做点什么” 。“她嘲笑我。但这让我思考我可以用我的知识和技能做些什么。一天美好的一天,在与 Alexa 的谈话中,包容性技术的想法让我印象深刻。这引发了一系列计划,”她告诉该出版物。

Gupta 在她的声明中还称赞了 YouTuber 和数据科学家 Nicholas Renotte 2020 年的视频,该视频详细介绍了基于 AI 的 ASL 检测器的开发。

尽管 Gupta 在 LinkedIn 上的帖子获得了社区的许多积极响应和赞赏,但一位 AI 视觉工程师指出,她的模型中使用的迁移学习方法是“由其他专家训练的”,是“在 AI 中最容易做的事情”。 ” Gupta 承认了这一声明,并写道“建立一个仅用于标志检测的深度学习模型是一个非常困难的问题,但并非不可能。”

“目前我只是一名业余学生,但我正在学习,我相信我们的开源社区迟早会找到解决方案,这个社区比我更有经验和学识,也许我们可以拥有仅用于符号的深度学习模型语言,”她进一步补充道。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢