Microsoft的captionbot描述了图片,因此您不必

视频: therunofsummer 2024

视频: therunofsummer 2024
Anonim

Microsoft已推出一种图像识别工具,该工具试图描述图片的内容。 该人工智能工具仍处于开发阶段,并且不断从用户上传的图片中学习。

就准确性而言,有时描述是相当准确的,而有时CaptionBot提供的描述与所描绘的内容无关。 在某些情况下,由于其边缘状态粗糙,该应用程序根本无法提供描述。

Microsoft设计了CaptionBot,以学习更多经验,并期望其字幕会随着时间的推移变得更加准确。 用户上传的图片越多,应用程序就变得越好,正如CaptionBot描述的那样:

我可以理解任何图像的内容,并且会尝试描述它以及任何人类。 我仍在学习,所以我会保留你的照片,但没有个人信息。

CaptionBot使用三种技术来描述图片中所描绘的内容:Microsoft的计算机视觉,情感和必应图像。 Computer Vision API从图像中提取丰富的信息,以对视觉数据进行分类和处理,同时识别和提取图像中的文本。 顾名思义,Emotion API可以分析面部,以检测各种情绪,包括愤怒,轻蔑,厌恶,恐惧,幸福,中立,悲伤和惊奇。 Bing Image在网络上搜索图像。

我们测试了CaptionBot,在50%的情况下结果都是准确的。 例如,我们上传了两张图片:一张描绘游戏鼠标,另一张描绘一叠纸牌。 在这两种情况下,该工具都建议它是一部手机。 另一方面,CaptionBot可以准确检测到人和脸。

显然,CaptionBot对手机很着迷。 一位Twitter用户报告该应用程序认为Michelle Obama是一部手机。 有关更多CaptionBot有趣的字幕,请查看此Twitter页面。

您也可以在此处测试CaptionBot。 尝试一下:您将帮助改善该工具,否则您将大笑!

Microsoft的captionbot描述了图片,因此您不必