依靠算法、硬件等团队的努力,地平线已奠定了嵌入式人工智能全球领导者的地位。
智东西编
四月
智东西推荐语:
地平线机器人公司是前百度深度学习研究院(IDL)常务副院长余凯博士的创业项目,目前专攻汽车汽车、机器人智能领域。
人工智能被认为将是横切行的新技术革命中间力量,但似乎还是很抽象。余凯博士麾下,地平线机器人公司有一批技术牛人;透过三位技术大牛对AI算法的解读,可以一窥人工智能到底是神马,以及这些研究者是通过哪些算法来实现智能化的。
本文已授权智东西发布:
*畅:做真正能解决实际问题的算法
地平线联合创始人算法副总裁*畅
初识人工智能应用研究
*畅是一个非常有学术天赋的人,并善于将技术应用于实践中。他的学术生涯,一开始就和AI的实际应用问题相关。
大三那年,人工智能还处在一个低谷中。但一个偶然的机会,让*畅跟随恩师艾海舟一起,加入到清华与日本欧姆龙公司的技术合作项目,研究图像识别领域中非常重要的人脸检测问题。当时的他还不知道,后来的研究成果成为了早期计算机视觉技术被大规模商业应用的成功范例,诞生了世界上第一款人脸检测专用芯片。
时至今日,通过“芯片+软件”的模式,*畅的这项技术已遍布生活中的各个角落,从数码相机、智能手机,再到诸如苹果iPhoto这样的软件,占据了大量的市场份额。
这项技术实现了我们如今随处可见的镜头自动人脸对焦和曝光肤色的智能调整功能,完全改变了自相机诞生以来的人物拍照方式。这很可能是嵌入式人工智能在工业界应用的最早期范例之一。
当时,人工智能方面的大多数技术还很难在工业界找到适合的发展方向,因为技术还不成熟,大多数都还停留在实验室阶段。甚至到*畅博士毕业的时候,人工智能行业形成规模仍然是遥遥无期。很多从业者都觉得这行“不靠谱”,纷纷转到了互联网或者金融行业。
但那次项目的成功,是整个人工智能行业在实际应用中迈出的重要一步。这个成功的范例证明了人工智能在应用方面可开发的巨大潜力,让人工智能开始受到重视,并得到越来越多的投入。*畅通过这个项目,验证了自己的诸多想法,并对人工智能的未来愈加洞悉。
十年轮回,持续深耕
此后十年,*畅在人工智能领域持续深耕:凭借自身努力和出色天赋,他用比别人更少的时间读完清华硕博;紧接着又受邀去美国南加州大学跟随Prof.RamakantNevatia攻读博士后,他创造性的将物体检测、基于机器学习的数据关联和图模型方法用于多目标物体跟踪问题,使其效率大大提高,在学术界产生很大影响。
随后*畅加入地处硅谷的NEC美国研究院,从事大规模分布式并行机器学习和深度学习方法的研究。NEC美国研究院是人工智能早期重镇,大神云集,包括支持向量机的首位提出者Vapnik和人工智能三巨头之一的YannLeCun都曾在此效力。这段工作里*畅收获了两个“生命之重”——真正以工业界的视角对人工智能进行深入思考研究,以及结识了亦师亦友的余凯。
*畅是幸运的,在学术生涯最重要的阶段里得到了多位顶尖学者的相助,获得了快速且巨大的成长,为他以后的发展打下了坚实的基础。
年,*畅参与组建了由余凯创办的百度IDL,任高级科学家、主任研发架构师。在他的带领下,图像技术团队做出了全网人脸图像搜索、PK大咖、全网相似图像搜索、自然场景文字识别、百度移动图像搜索、图片凤巢等许多重量级的产品。
百度图片搜索
鉴于这些优秀的工作成果,他和他的团队两次获得百万美金的“百度最高奖”。在实际应用中,这些产品也展现出了巨大“威力”,比如图片凤巢的技术成果,就使百度每年的广告收入提升度达到5%-6%。
除此之外,他对技术远景也有着精确的预判力。年他离开清华前夕,和其他同学谈论未来行业发展趋势时曾说过,“这个行业在5-10年的时间里一定能取得重大突破、得到广泛应用。”这句预言也在今天得到了很好的印证——从年开始,以深度学习为代表的一大批人工智能得以复兴,甚至这一年被称为“人工智能普及年”。
深度学习中,被大规模用于图像识别的卷积神经网络
十年深耕,十年轮回。*畅在算法方面有了更加广阔的视野,更成熟的思想。他敏锐的意识到,未来将是一个全智能万物互联的时代,所有的终端设备都需要一颗智能的“大脑”,嵌入式人工智能将扮演最核心的角色。而高性能、低功耗的、可真正解决实际问题的算法是其中极为关键的一环。
因为理念上的高度一致性,他追随余凯参与成立了地平线,再次从事嵌入式人工智能的应用研究,致力于算法芯片化。但这次,他将站在更高的起点上。
算法要用来解决实际问题
在加入地平线时,沉浸人工智能领域十几年的*畅,已经形成了一套非常值得人们学习的AI算法研究价值观,那就是:算法研究的根本目的是用来解决实际问题,它是工具,而非目的。这也是整个地平线算法团队所坚持的理念,故而在很多公司很多团队还在算法数据集里争着“刷第一”时,地平线的算法研究方向已经在奔向下一个目标了。
基于这些思考,*畅高瞻远瞩,带领地平线算法团队在许多重要的算法研究方向上进行了极具创新性尝试,包括基于贝叶斯网络的推理系统和面向感知-决策-控制的增强学习系统等。这些前沿研究在*畅的推动下,极大的拉近了算法和实际应用之间的距离,使地平线的算法研究发展到一个新阶段。
具体来说,他认为,如果想让算法能真正的解决实际问题,在考虑算法之前,必须对这些复杂的实际问题进行正确的建模(formulation),选择甚至定制合适的系统(system),基于大量数据(data)驱动,结合模型(model)和知识(knowledge)的表达来解决这一实际问题。脱离开这条轴线,我们做的算法将不具有现实意义。
现在许多人做算法,往往忽视了要解决的问题的本质,没有正确的抽象和建模,也缺乏一个坚实的系统去承载并做可持续的积累。对于这种现象,他一针见血的指出:这样做通常会形成一个过于简化的建模(即采用单一的系统和算法,去解决实际上非常复杂的问题),必然导致算法难有实质性的突破,更无法应用于真正的产品中!
这说明*畅不是一个急功近利的人,相反他非常重视基础,能一眼看到别人发现不了的问题甚至“隐患”;他对算法研究所走的每一步都洞若观火,并拿其与实际问题不断比对,是一个非常出色的算法领导者。
针对“过于简化的建模”问题,*畅还举了一个例子。在自动驾驶领域,有些公司号称在使用深度学习做端到端的训练,直接学习从传感器的输入到控制器(刹车、油门、转向等)的输出的函数映射。我们无法对这种黑盒模型进行有效的分析,在使用中出了故障很难搞清楚究竟是什么原因造成的。而自动驾驶是一个对可靠性要求极高的领域,需要考虑许多长尾条件下的cornercases。这种建模方式没有对自动驾驶这个问题做出正确的形式化描述,而在此基础上构建系统并研究算法,效率十分低下甚至徒劳无功。
基于深度神经网络增强学习的理性决策
以上这些算法思想都是围绕“算法能真正解决实际问题”展开的,但只有“内容上的可行”还不够,还需要“形式上的落地——嵌入式人工智能”,即为算法研究增加一个新的思考维度——和芯片更好的结合。
*畅非常自信,他说,现在应用于自动驾驶等场景的主流GPU架构动辄成本上千美元,能耗几百瓦,根本不可能大规模商用应用起来;但地平线的产品将实现高精度、高效率、高吞吐量、低功耗、低成本的特点,可以真正应用于实践。这是地平线很早就开始的研究工作,并奠定了地平线嵌入式人工智能全球领导者的地位。
罗恒:忽视Trick,将难以解决实际问题
罗恒有些微胖,时常自嘲“要减肥”,藏在方框眼镜之后的一双眼睛睿智有神。
作为一名算法工程师,他的生活常常处于高速的脑力运转之中,这让他的每一秒时间都显得宝贵,走路疾步带风。
罗恒,负责模型压缩和加速方向
年,罗恒在上海交通大学博士毕业后,跟随YoshuaBengio从事博士后研究。回忆起自己走上深度学习的历程,罗恒抚了抚眼镜,“那是段很有趣的经历”,似是做好了讲故事的准备。
师从AI大师YoshuaBengio研究生时,计算机专业的罗恒偶然了解到机器学习的知识,惊觉十分有趣,由此开始持续