“番茄土豆炖牛肉”这段视频内容,谁能通过计算机表述得最好?

比赛现场相当平静。每个人都坐在笔记本电脑前,敲击键盘,移动鼠标。然而,就在他们敲打的键盘下,隐藏着一个秘密。

1.视频描述生成:人工智能模型需要识别视频中的对象,理解对象之间的关系,识别对象的行为,并用自然语言表达它们。

换句话说,玩家将使用算法让计算机将场景中给出的视频内容翻译成自然语言。

零样本目标检测:这与我们在幼儿园看图片和说话时学到的非常相似。然而,机器应该通过无样本人工智能的训练和深入学习来提高人工智能的智能性。

3.行人多目标跟踪:要求玩家在公园监控、交通监控等场景中对人进行自动二维跟踪。

让我们这样理解。在公共场所的不同场景下,计算机需要识别不同的人,并通过一段视频快速找到目标人。这项技术将在社会治理领域发挥作用。

4、电子商务评论观点挖掘:这是最接近行业的四个话题之一。企业可以使用它来更准确地筛选客户的意见和评论

枝江实验室副主任袁纪信介绍说

将来,盲人可以通过戴相机“看见”。

哪个竞争问题在技术上最具挑战性?

视频描述生成。

袁纪信介绍说,国内外许多大学和研究机构还没有通过人工智能显示视频内容在这项技术上取得任何突破。

这个问题相比如何?

例如,其中一个视频展示了厨房里的一个场景,那里有一个装有西红柿、土豆等的罐子。双手拿着锅盖和铲子反复搅拌。

相比之下,玩家编写的算法可以让电脑更准确地描述这段视频的内容。

现场的主人说,“这很简单,是一个家庭主妇在烧西红柿、土豆和牛腩。机器很难描述这段话吗?”

芷江实验室主任朱世江说,“这真的不容易。”

这项技术到底有什么用?

朱士强表示,如果电脑能够更准确地理解和分析产品,盲人将会佩戴一个小摄像头,云中会有一个高速处理平台,帮助盲人实时分析他们面前的场景。

在昨天的比赛中,一些玩家写的算法不仅把西红柿、土豆和炖牛肉的视频表达得更清楚,而且还把锅放在了里面

视频|林嘉楠

据了解,芷江实验室除了获得丰厚的奖金外,还将为获奖者开启高层次人才的绿色通道。

记者|周李超参观制图单位

(作者:记者林嘉楠,编辑:李士力)

上一篇:葛优为角色体验生活,昔日影帝却没人认出来,代表作竟是表情包?
下一篇:贾樟柯对话陈冲 畅谈女性电影人的成长与热情

热门资讯

© Copyright 2018-2019 plarva.com 若达新闻网 Inc. All Rights Reserved.