在谷歌AlphaGo一次次秒杀全球围棋高手后,人工智能又一次战胜了人类!最新一期的江苏卫视《最强大脑》中,吴恩达率队的百度人工智能,在跨年龄人脸识别任务中,3:2战胜了世界脑力锦标赛冠军、最强大脑名人堂轮值主席王峰。 比赛相当惊险,作为人类脑力担当的最强选手们,第一次对战人工智能,似乎有些胆寒,赛前连连退让,不愿上场pk小度。选手们的推诿胆怯,惹得嘉宾刘国梁几近发飙,“我实在看不下去了,这要是在我队里,早把他们罚喂猪去了”。 评委 Dr.魏 评论说,这是出于“对未知的恐惧”,恐惧也不意外,在两个最为权威的国际评测FDDB与LFW中,百度人脸识别都获得第一名,领先于腾讯、FACE++等。 但是,百度团队也非常忐忑,毕竟这是百度人工智能小度第一次挑战全球最聪明的人类大脑,后台观赛的百度工程师,因为激动和紧张数度热泪。 人工智能无论是多么先进,其终极作用还是服务人类,身为大赛评委的辣妈章子怡,在现场提议:“我们有很多走失儿童,长大后,亲生父母都认不出来,但是小度可以帮我们辨别。” 战胜最聪明的人类大脑,小度靠什么?章子怡的建议可行吗? 巅峰对决 AlphaGo战胜围棋选手,以及小度在人脸识别赛中险胜最聪明的人类大脑,哪个难度系数更高? 百度首席科学家吴恩达说:“基于强大的数据分析,很容易识别两张近期的照片。但是识别整容、化浓妆、或者有十几年跨度的照片,我们并没有大量的数据可以分析。全世界棋类比赛中顶级的选手很少,但是人脸识别能力每个人都具备。这次人机大战,是顶级的人脸识别选手和擅长棋类游戏的人工智能比拼,很公平。” 第一场比赛的难度在于,蜜蜂队少女一直在跳舞,需要动态识别,而且参加表演的少女们,除了化浓妆之外,可能还有整容经历。特别是蜜蜂队中有一对双胞胎,要对现场动态图像识别,对应到0-4岁的童年照,难度系数很高。 正是因为有了双胞胎这个干扰因素,让王峰第一场比赛中失分。 而小度似乎也出了意外,针对一个识别对象给出了两个选项———一对双胞胎,一个72.98%,另一个是72.99%,最后吴恩达现场选择72.99%的照片,匹配正确。 第二场比赛的难度则在于样本量大,要在30张模糊的集体照、上千个合照人脸中,消除年龄和图像噪点带来的干扰因素,找出对应人。 无论对于人类还是机器人,两场比赛都是硬仗。因此,督战的吴恩达,在赛前也没有必胜的信心,“人类大脑从上百万年前开始就拥有了人脸识别的能力,而机器没有直觉,也并没有久远的进化历史。” 人脸识别其实并非人工智能的强项,人类进行人脸识别,依靠经验、直觉和记忆力,但是计算机只认识0和1,必须通过无数次的学习,把人类的感性直觉,量化为0和1的机器语言和理性严密的程序算法,从而模拟人类通过直觉思考的过程。 在图像识别领域,人脸识别的难度最高,同一种族人类的脸部结构和骨骼组成都是相似的,再遭遇双胞胎甚至多胞胎、表情、灯光、化妆、整容、美图、人脸遮盖物(如口罩、墨镜、头发、胡须等干扰因素,指数化的增加了人脸识别的难度。而且,机器原本就擅长规则清楚的比赛,比如象棋、围棋等等,而人脸识别,则设计到模糊推断。 与此相对,人类大脑中有特定的脑区(Fusiform face area(FFA)专门用户识别人脸,这是人类与与生俱来的本能,因此《最强大脑》评委 Dr.魏评价说,这个比赛相当公平。 具体来说,小度进行人脸识别,主要包括四个步骤:第一,根据五官的几何关系来检测人脸;第二,对图像进行灰度校正、噪声过滤、图像增强等预处理;第三,提取人脸图像特征,对人脸进行建模;最后一步,就是对人脸图像匹配与识别,将待识别的人脸特征与已得到的人脸特征模板进行比较。 比如,对现场蜜蜂队队员的识别步骤如下: 全程观看比赛的Dr.魏评论说:“人工智能在面孔识别上超过人类应该是2012年,就说人脸识别超过了人类的平均水平。现在,百度大脑,超越的人类中出类拔萃的顶尖群体,这是里程碑事件。在这个专业方向上,人工智能的准确率已经达到很高的水准。” 其实,人脸识别的基本原理,各个公司的做法大同小异,小度有啥特异功能?林元庆透露,百度的人脸识别技术与其他公司的最大不同在于,现在百度已经研发出1对N的系统。 之前市场上的人脸识别系统是1比1的,比如说银行应用或者是机场安检,用户需要提交身份证和人脸信息,系统会对身份证照片和人脸进行一对一的比对。而公安抓逃犯的系统是1比N的,但是1比N场景下,很难做到非常高的精度,因此,机器初筛一遍后,还是需要人工辨别确认。 但是百度的人工智能,精度非常高。针对人脸识别,百度已经建立了一个包含 200万人、2亿数据的图片库,截止到2016年9月,百度的人脸识别技术已经可以做到2.3%的错误率。 走出实验室 一切技术的提高,终极目标都是为了服务人类生活,百度的价值主张是“科技为生活”。 作为和谷歌、微软等并列的全球人工智能巨头之一,百度主要布局三个方向:图像识别、智能驾驶、增强现实。 目前,“百度大脑”已建成超大规模的神经网络,拥有万亿级的参数、千亿样本、千亿特征训练,能模拟人脑的工作机制。 而人脸识别是百度大脑最为擅长的领域,在人脸识别技术两个最为权威的国际评测FDDB与LFW中,百度都是世界第一。 林元庆说,技术不断成熟后,“我们要从实验室走到现实当中。”百度的人脸识别,已经有了不少应用案例。 在百度的北京总部,基于图像识别建立了于百度总部的闸机系统,这个系统里大概有一万名百度员工高管,而机器能很精确的识别一万里面的每一个人。林元庆说:“这个绝对是国内首创。” 在内部,百度人脸识别技术帮助百度金融实现远程预授信。 在第三届乌镇互联网大会期间,用户只要在首次入园时提供身份证扫描并录入一张实时拍摄照片,总共耗时不超过10 秒,之后就可以“刷脸”在乌镇景区各处闸机处通行。 能否更为广泛的应用,取决于识别的精准度,在LFW测评中,百度图像识别的精准率达到99.77%;而截至到去年9月,在人脸识别方面,百度人工智能的错误率已经降低到2.3%。 林元庆说,“未来人工智能会成为基础设施,能够成为基础能力,开放应用。” 现在,甚至普通公众,也可以亲身体验下百度人工智能了,在百度大脑官网ai.baidu.com上,百度人工智能输出了全面、易用的核心能力,公众通过SDK或者API形式接入使用,把百度人工智能技术链接到具体的应用场景,就可以亲身体验人工智能黑科技。 小度打拐? 小度以及其背后的人脸识别技术,因为低错误率和高准确度,已经初步具备了走出实验室的基础,所以章子怡建议小度帮助打拐、寻找走失儿童,并非不可行。 过去,鉴定走失儿童身份的主要方法,除了公安系统人士的人工询问、实地走访调查等,还有DNA亲子鉴定。但是无论是人工调查,还是亲子鉴定,面临的一个问题,就是费用太高。 根据凤凰网的报道,跨地区救出一个孩子需要三五万元,而基层派出所每年的办公经费也就七八十万,因此,派出所的打拐经费严重不足,积极性受挫。 而公安部打拐办主任陈士渠说,拐卖案件的特点是跨区域、大范围流窜作案,抓捕犯罪嫌疑人、解救被拐卖妇女儿童成本高,加之拐卖犯罪多发的地方往往经济欠发达,办案经费保障不足,严重阻碍了打拐工作的开展。 此外,DNA对比的另一问题,是流程复杂、耗时较长。 lingwai ,很多走失儿童和寻找子女的受害父母,并不知道可以去DNA采血录入。 如果百度的人脸识别技术应用于打拐,可行的方式,有可能是利用走失儿童的童年照片,先和公安部门身份证系统中的人脸照片进行比对初筛,通过初筛锁定可能范围和可疑对象,进而针对性的调查,最终再通过DNA亲子鉴定确认。 而在测试过程中还发现,由于相貌具有遗传性,在父母和子女图像的对比识别中,小度及 人工智能的前期研究成本虽然高昂,但是后期应用的边际成本其实很低。如果小度能参与到打拐中,第一,有望大幅降低打拐成本,解决打拐经费不足的难题。第二,通过人工智能,降低如同大海捞针一般的打拐人力成本,减少打拐案件破案的难度。第三,帮助走失、被拐子女早日和父母相见。 刚刚有了女儿醒醒、多次参加打拐公益活动的新任妈妈章子怡,自然能够理解,那些找不到走失被拐子女的父母,是如何身陷于绝望、焦躁、恐惧的黑洞之中,无法自拔的。 也许,终有一天,在谷歌、百度、微软等人工智能巨头的共同推动下,未来的人工智能,将如同我们日常使用的水、电、气一样,成为所见即所得即所用的普遍应用,那时候,让新妈妈章子怡揪心的打拐,可能成为旧闻。 |