谷歌推出了一项名为包容图片竞赛(Inclusive Images Competition)的项目,希望提高图片识别软件的文化包容性,降低那些用存在文化偏见的图片库训练出来的电脑视觉系统的偏见。

由于人工智能需要使用大量图片数据进行训练才能识别物体。而图片识别技术最近的跨越式发展也得益于公开的大型图片数据库的推出,包括ImageNet和Open Images。

但问题在于,最流行的数据库往往以美国和西方文化为核心,毕竟西方图片在汇总数据库的过程中占据主导。因此,系统往往难以精确描述其他文化和地点。例如,使用开源数据库训练的标准图片识别系统可以识别身着西方婚纱的新娘,但却无法识别身着印度纱丽的新娘。

解决这个问题的方法之一就是开发更加多样化且具有代表性的图片数据库。虽然谷歌在采用这一方法,但该公司相信还有另外一种方式可以采纳:调整机器学习算法本身,使之在学习不完美的数据时更具包容性。

因此,该公司与顶尖人工智能会议Neural Information Processing Systems(NeurIPS)展开合作,并且收到100多位参赛者提交的方案。谷歌大脑研究员帕拉为·巴尔杰卡(Pallavi Baljekar)在12月2日的会议上指出,第一年的竞赛优胜者可以向更包容的系统迈进一小步,但排名前五的方案中只有一个成功识别出印度新娘。所以,显然还有很大的进步空间。