查看:
2942
|
回复:
3
|
机器人工程师学习计划【转】
|
|
发表于2018-11-27 22:47:51
|
显示全部楼层
1#
电梯直达
在知乎上看到的一位大疆的工程师给出的大学硕士期间学习机器人工程师的学习计划 https://zhuanlan.zhihu.com/p/22266788 大一 大二 |
|
发表于2018-11-27 22:54:09
|
显示全部楼层
2#
同学的学校应该给大二到大三的学生有开设面向对象的程序设计,一般用Java或C++教授。在面向对象的程序课里面,一定要积累3000行左右的代码的开发经验。经典的面向对象程序设计的练习通常是写游戏,比如俄罗斯方块,吃豆人等等,一定要自己能够做到完全手写一个完整的项目出来。
另外你可以开始学习Matlab当中的神器Simulink了。在大二这一年的学习中,你可能在不少课程里多多少少用到了Matlab。假设你已经在我的推荐下喜欢上了Python,你可能会觉得Matlab的计算工具没有比Python强多少;假设你自己在别人的推荐下喜欢上了mathematica(Mathematica 到底有多厉害? - Wolfram Mathematica),你可能会觉得和Mathematica这种神一样的语言比起来,Matlab弱爆了。但是要注意的是,Matlab最强大的工具是Simulink,通过它你几乎可以仿真一切的物理系统和控制系统。我建议同学可以通过Simulink实现一个倒立摆,然后理解Matlab的强大之处。对此我强烈推荐一个很好的教材(http://ctms.engin.umich.edu/CTMS/index.php?example=Introduction§ion=SimulinkControl),它详细介绍了一些经典的控制系统如何分析以及用Simulink实现。然后我再强烈推荐一个讲Simulink里面一个更加和物理仿真贴近的工具Simscape(Control of an Inverted Pendulum on a Cart)的文章。阅读并实现了这两篇文章里的内容,同学应该会对倒立摆有了比较深刻的认识。倒立摆是机器人学中一个非常重要的模型,因为火箭、导弹、双足机器人、四足机器人,基本都是倒立摆的变形。你自己实现出来的simulink模型一定要存好,以后可能还会再拿出来仔细看。 如果你按照我之前说的方法探索了一些HTML和Javascript的技术,那么JQuery,bootstrap,AngularJS你已经多多少少知道是怎么回事了。web后端的技术,比如PHP和MySQL,也可以了解一下,LAMP要学会怎么配置。如果有同学找你帮忙写小网站,尽量去帮个忙,帮别人做网站是提高自己系统编程能力的好练习。在做网站的过程中你可能还会顺便学一学如何用Photoshop和Illustrator让网站显得更漂亮。这些技能有最好,没空学也没关系。 大三 大三开始的时候,你可以在学校的机器人队里担任重要角色了,或者能够带领一个小团队参加小型的机器人比赛。你在系里甚至院里都小有名气了,可能有的人叫你大神,有的人觉得你技术还不错。但是一定要记得你现在的水平放到别的地方应该不算什么。每年我都往大疆的RoboMasters夏令营招进100个和你现在的水平相当的同学。 大三一定要培养出自己一个人独立造出一个完整机器人的能力,比如一个Robocon水平的机器人,或者一个RoboMasters的战车,或者一个四旋翼飞行器。 Robocon水平的机器人,涉及大量的机械设计,单片机开发,电机驱动的开发,码盘和超声波等传感器的读取,底盘运动学的计算,PID调试,任务调度逻辑的调试,舵机控制。RoboMasters的战车的机械部分简单一些,但是还需要进行云台的控制、发弹系统的控制、功率控制等方面的知识,另外你也可以不搞这些部分,学习学习视觉识别和自动打击,那么就要开始研究OpenCV(OpenCV | OpenCV)了。 四旋翼飞行器的机械部分最简单,但是算法比较复杂。对于大三学生来说,从零开始一步到位写一个稳定的飞控比较困难,因为飞控里面有很多细小的知识点要注意。目前我没有发现什么比较好的书籍推荐,已有的一些关于四旋翼系统的书要么太浅(上来就教你焊电路),要么太深(上来就教你state estimation),听说 @Liu Top的exbot小组在写一个教材,我是非常期待的。学习四旋翼飞行器有下面几个步骤: 第一步:自己调一个小四轴飞起来 现在开源社区的人言必pixhawk,其实我觉得从学习的角度来说,pixhawk太贵,而且不适合学习,我比较推荐的是 首页-第七实验室 这家淘宝店卖的STM32F405飞控,买回来以后自己再随便买个机架(比如大疆F450)、接收机和遥控,就能按照飞控板附带的学习资料、调试软件飞起来。 第二步:看硬件图、读代码 chiplab7的飞控板附带一大堆学习资料,对加速度计、陀螺和磁感计都有很仔细的解释,硬件链路图也很详细。chiplab7淘宝掌柜的又很认真负责,我学用的时候,发现代码有bug和看不懂的地方,都可以直接找掌柜问。 看完代码以后,对一个飞控系统的基本模块:姿态解算、控制解算、混控输出、遥控器处理、嵌入式处理就很明白了。然而这里面有很多技术是需要另外学习的。除了基本的嵌入式编程以外,还有要把大二大三学的信号处理方面的知识再捡起来看看。因为飞行器在空中有振动,会让加速度计产生噪声,为了把这些噪声去除掉,需要对加速度计给出的信号做低通滤波处理,如何选择滤波器的参数呢?如果滤波滤得太狠,延迟就会比较大,对控制的表现会有影响;如果滤波滤得不够,可能会有一些低频的噪声偶尔会出现,导致加速度计的观测不能用。另外最重要的是要理解姿态解算和控制解算这两块知识。chiplab7的飞控板的代码采用的是最简单的互补滤波算法做为姿态解算模块,然后控制解算是对欧拉角的三个角度做闭环PID控制,基本都是基础的基础了。 第三步:小修小改加深理解 chiplab7的飞控是靠气压计定高的,飞行效果非常奔放。这时候可以淘宝买个20块钱的超声波模块,然后自己写个高度环去稳定飞控的定高表现。 我觉得这个过程至关重要,因为高度控制相对来说是个比较直观理解PID控制的方式,而且chiplab7的飞控加高度控制非常好加。工作量不大,因为改善效果很显著,所以可以让人很有成就感,加深继续学习的乐趣。 第四步:理解核心的数学和控制知识 这一部分大三是肯定来不及学的,但是我还是在这里列出来,因为这些知识你之后都需要慢慢学,我也会在之后不断重复提到这些知识点。 姿态解算和控制解算涉及的知识有: 1. 刚体姿态的表示、运动学方程和动力学方程。主要是对牛顿-欧拉方程的认识和理解、刚体姿态的欧拉角表示法、姿态与角速度的关系等等。 这部分说复杂不复杂,说简单也不简单,我同样是没有找到一本完整的书全都介绍过的,是学了好几个不同的书和论文以后搞明白的。现在看起来是从维基百科入手比较靠谱。 2. 自动控制原理。讲PID的书和文章就多了去了,没有太多复杂的书。 3. 线性估计基本原理。其实就是互补滤波:Reading a IMU Without Kalman: The Complementary Filter 。拿这个关键词百度各种搜就会了。 第五步:重头开始造轮子 知乎著名网友vczh曾经说过,学习要抱着勇于造轮子的心态才能进步。所以在熟悉了别人飞控基础上,可以自己重头造一个飞控的轮子。可以自己从芯片开始重新画一个飞控板,读读STM32的芯片手册、读读各种传感器的芯片手册,自己手画一个飞控的原理图、做PCB layout、制板自己焊元件,全套花不了1000块钱,能够加深很多对硬件的理解。这一部分如果大三没空,也可以不搞了。 制造整个机器人的过程中要特别重视文档的积累。在你大三末期,你可能随着学校的机器人队备战比赛,你可能主力负责一台机器人。你应该自己列一个excel表格,把机器人用了几颗螺丝,几根导线,每个零件的规格是什么,都列出来。这个表格一方面可以用来帮助团队管理机器人的物料,一方面也是你自己的经验技术积累,将来你做的其他机器人可能多多少少都是Robocon、RoboMasters机器人的变形。 另一个积累是建一个自己的buglist,buglist包括什么呢,可以像冷大这样:做控制、机器人等算法工程师是怎样一种体验? - 冷哲的回答,就简单把一些自己的发生过的问题和最后的解决办法罗列下来。比如说“杜邦线接插位不稳固容易脱开,接好后应该用电工胶布再裹一圈”,“外发给淘宝加工的机械图纸,要特别注意和加工商沟通有没有漏掉一些细节,如沉头螺丝孔,关键的倒角”等等。你也可以帮其他机器人的问题也做这样的记录。buglist可以就是一个简单的文本文件,如果你一直往里面积累自己工作中的记录,等你将来工作了,这个文件可能会值很多钱。 大三的时候学校应该会开设软件工程的课程。不管你是不是这个专业,上不上这门课,都应该主动去听一听,甚至跟着课程的设计作业一起做一做。软件工程我觉得是机器人工程师必须具备的意识,因为一个机器人系统里涉及大量的硬件系统和软件功能,软件的部分往往还会涉及不同的语言、不同的编译环境、不同的开发工具链。几个人合作的话,大家的专业背景、编程习惯都不相同,这就导致不同的代码和模块之间的协议沟通非常复杂,必须尽早用UML和其他软件工程的工具帮助团队理解和互相沟通。 大三的时候学校应该还会开设操作系统原理和嵌入式系统原理的课程,而大二的时候讲过计算机组成原理(所谓的微机原理)。从大三开始同学需要开始体会实时操作系统和非实时操作系统的区别、原理以及使用时需要注意的地方。这是一个比较杂的知识点,我目前没有找到很好的教材去介绍。在STM32上,有freeRTOS,uCOS,Vxworks这么几种实时操作系统;Linux是一种非实时操作系统,但是可以通过打补丁变成实时操作系统。这些操作系统的细节在机器人开发中都会多多少少被涉及到,同学们可以随时上Google和CSDN去查大神们的介绍。 另外特别重要的一点是机器人系统里的嵌入式平台都有烧坏的可能性,有可能在某个嵌入式Linux平台上面辛辛苦苦写了一个多月代码,这个平台突然烧坏了,代码也就丢了。因此你的机器人如果有嵌入式Linux系统在里面,一定要尽早顶起来路由器,代码定时提交SVN或者git。 大三的暑假你可能会作为学校机器人队的主力去参赛了。备战比赛和参赛是一件磨练心性的事情。我在学生时代体会过和胜利擦肩而过的痛苦,体会过没机会再来一年的遗憾;也在负责大疆RoboMasters比赛的过程中被那些痛苦和遗憾的学生当做发泄的对象,非常有感触。我觉得参加机器人比赛,很努力,然后失败了,是一件让人快速成长的事情。同学如果有机会,一定应该参加至少一届机器人比赛。 大三的暑假你也可以选择来参加大疆的RoboMasters夏令营,关于夏令营大家可以看这个知乎问答了解更多:参加Robomasters 2016夏令营是怎样一种体验? - DJI 大疆创新。每年我们都在全国范围内寻找有一定技术基础的学生,让他们一起分组做一个自动机器人的挑战。这个夏令营,作为组织负责人,不谦虚地说,我觉得应该是全世界范围内最好的技术类夏令营。 大三的暑假有一件很重要的事情就是思考自己大四应该干什么。一般来说,你现在的能力保本校研究生肯定没有问题,当然你也可以选择考其他学校的研究生或者出国留学。虽然说你现在能力已经很全面了,但是你还需要2-3年的时间全面提升自己更多的能力,才能迈向卓越之路。不管是出国还是保研,最重要的目的是给自己争取到未来2-3年能够在一个优秀的环境中安心提升自己,有比较好的学习资源,能够参与到一些不错的项目中去。可能其他有些行当,出国留学始终是比在国内待着更好的选择,但是机器人行业并不是这样。我们国家这两年在机器人方面提高也很快,而且我们国家现在比较有钱。就像我开始说的那样,机器人是富人的活动,现在你在国内也能找到一些很有钱的实验室可以造比较牛逼的机器人。另外国外很多比较强的机器人公司也都在做比较敏感的军方项目,去找实习可能比较受限制。 出国去学机器人学方面的知识你有很多不错的选择,比如世界第一的机器人研究院卡耐基梅隆大学,或者麻省理工学院的CSAIL实验室。北美传统计算机四大名校(麻省理工学院,卡耐基梅隆大学,斯坦福大学,加州大学伯克利分校)里,除了斯坦福大学热火朝天在搞人工智能以外,其他几个学校的机器人研究都很不错。除了四大名校,你还有很多其他的选择,就像我开始说的那样,机器人是富人的活动,如果想接触到最好的机器人资源,你要选择有钱的实验室,而不是有名的实验室。 另外你还需要在大三的尾巴上选定自己将来的细分研究方向,而且开始往这个方向深挖,也就是我在文章开始提到的感知、认知、行为几个方向。当然同时你也不能放松其他方面的知识,尤其是数学基础。我在大三的暑假专门找数学系的同学给我开了个数学小讲座,学习了一点抽象代数的知识,对我后来学习密码学帮助很大。同时我也读了一些拓扑方面的教材(有一本很神奇的书叫做Topopogy Without Tears http://www.topologywithouttears.net/),这样才理解了为什么数学分析要用奇怪的符号去解释一些看起来很浅显的道理。 大三阶段的机器人工程师该学什么基础数学是众说纷纭的,在我看来,你要基本掌握“群是什么”,能够用代数的眼光去证明"det(AB) = det(A)det(B)",还要能理解“用一张纸就可以变出克莱因瓶”(当然是在四维空间里)。另外,你这个时候也要能够意识到自己需要再学一遍线性代数。 大四 大四开始了,你可以开始深挖自己的研究方向,同时也要开始学一些高级一点的通用技术和理论,这时候你和一般的机械、电子、计算机学生就不太一样了,你虽然也在狂编程,但也在狂学习物理和数学。通用技术包括ROS,simulink,gazebo和Vrep等工具。通用理论包括,再学一遍线性代数,学学凸优化、数值计算、旋转表示法等方面的知识。这些知识你在大四仅仅只能开一个头,因为你的大四要实习、毕业、考研、毕设,你会非常地忙。有些人会在大四进实验室和老师发论文,我个人觉得发论文这件事没必要操之过急。你的整个大学期间应该用在广泛涉猎各种各样的知识上面,而不是深入某一个细小的研究问题。 大四可以开始读一些著名入门书籍,我把这些书不分先后地列出来,你没有必要全部去读,而且每本书先读前几章就够了,能读多少尽量读多少。 1. 概率机器人学,https://www.amazon.com/Probabilistic-Robotics-Intelligent-Autonomous-Agents/dp/0262201623 2. 凸优化,https://web.stanford.edu/~boyd/cvxbook/bv_cvxbook.pdf 3. 线性系统理论,https://www.amazon.com/Linear-System-Electrical-Computer-Engineering/dp/0199959579 4. Multiple View Geometry in Computer Vision,Multiple View Geometry in Computer Vision 5. 线性估计,https://www.amazon.com/Linear-Estimation-Thomas-Kailath/dp/0130224642 6. 《机器学习》,周志华老师的书。 7. An Invitation to 3-D Vision,https://www.eecis.udel.edu/~cer/arv/readings/old_mkss.pdf 8. Modern Control Systems,https://www.amazon.com/Modern-Control-Systems-12th-Richard/dp/0136024580 9. Rigid Body Dynamics,http://authors.library.caltech.edu/25023/1/Housner-HudsonDyn80.pdf。说实话刚体动力学理论我没有找到特别好的书。但是刚体动力学理论很重要。 10. Feedback Systems: An Introduction for Scientists and Engineers,FBSwiki 就像我开始说的那样,这些书,大部分特别贵,还好有一些业界良心的作者放出了他们书的电子版。当然你也可以去一些名字都不能说的网站去找影印版。 在读上面这些书的时候,matlab,python都要放在手边,然后把书里面的知识尽量实践出来。很多教科书里都会在章节后面的习题里放一些写明是用matlab做的习题,要尽量多做一些这样的题。 你可能早就听说了ROS的大名,但是最好不要在大四之前去碰它。因为ROS用了很多操作系统和网络的底层技术。我在知乎回答高手可以谈谈ROS机器人操作平台开发的一些经验吗? - YY硕的回答里有简单的介绍。ROS的设计目标是把机器人的控制和传感器处理的软件和它的硬件隔离开,用上ROS以后,你可以方便地用到很多能直接跑的软件代码。但是ROS从入门到精通需要至少一年以上的时间,你必须不断地用,不断地尝试新的代码和硬件,才能对它熟悉起来。 ROS的可视化工具Rviz里面对于机器人旋转的表示用的是四元数,而在你之前研究四旋翼飞行器时,里面的代码表示旋转用的是欧拉角,做姿态解算用的可能是四元数。这个时候要开始有意识地去学习旋转表示法之间的区别和联系。 要重视大四期间的实习和毕业设计。很多大四的学生毕业设计都会非常颓地做一下,我觉得是不好的。要把做毕业设计的过程看做一个正式的项目。这个项目除了做好技术方面的工作,也要做好展示方面的工作。中国工程师的一大特点是,不会表达自己,可能做的东西水平很高,但是做出PPT就会犯字体花哨不正式、一页上面字太多,图文没有联系等表达上的问题。通过PPT介绍、展示自己的成果在工程师的职业生涯的任何一个阶段都非常重要,它甚至也一定程度上限制了机器人工程师能够达到的高度。只有能够把自己的成果清晰地表达给自己的团队,才能获得其他人的反馈、通过沟通提高团队的整体凝聚力和知识水平,这样自己在团队能够获得更多的认可,有助于团队整体工作效率的提高。我每年去参加几次学术会议,都在会议上感觉到一些中国的科研人员走到国际上以后,演讲能力很差就会导致他们的科研成果不受重视。当然其他国家的科研人员也是这样。 为了写出美观的技术报告和毕业论文,你可以开始学习Latex。Latex作为国际国内第一写作神器,学习资料在网上有很多。Latex的学习和使用同样也是需要不断地熟能生巧,多写多练就熟悉了。写毕业论文有个问题是怎么做出精美的矢量图,我推荐Draw Freely | Inkscape,一个比Illustrator更轻量化、但是有些功能反而更强大的免费软件。 对于那些想申请出国留学的同学,你要做一个自己个人的成果展示,用网页的形式呈现比较好。把自己Github链接(如果你按我说的,大学第一天就申请Github账号,现在已经是一个三年的老油条了)、做过的机器人视频、写过的技术报告和文章(最好是英文的)放在上面。 |
|
发表于2018-11-30 13:25:25
|
显示全部楼层
4#
关于毕业设计的选题,我推荐这么几个:
1. 手写双目视觉里程计。涉及到图像处理、特征匹配、位置解算、空间变换等等。 2. 手写四旋翼飞行器基于GPS的轨迹规划。涉及到深挖四旋翼飞行器的运动原理、IMU原理、轨迹生成和优化等。 3. 造一个被推了也不会倒的双足舵机机器人。涉及到舵机控制、倒立摆建模、动力学分析、PID控制、IMU原理等。 4. 深度学习训练一个小车追人跑。涉及到深度学习工具包使用、数据集采集、数据集分析、小车控制等。 5. 机械臂给人端茶倒水。这个相对来说土豪一点,因为能直接拿来用的机械臂都很贵,这个要看实验室有没有条件了。涉及到多自由度机械臂原理的学习、工具包的使用、轨迹规划等等。 这几个项目要做好,都要持续投入三个月以上的时间以及一定的资金,每一个都是理论多于实践。当然同学们自己也可以自己选择自己的毕业设计题目,但是最好还是选做出来能跑能飞的东西,同时避免选择需要花大量时间去拧螺丝、焊板子的题目,尽量买现成的电机、开发板、3D打印结构,大四要多给自己留时间去看书和写代码。
大四到研究生之前的暑假,最好去一些比较不错的机器人公司实习一下,比如说大疆。当然你也可以继续做机器人比赛,比如RoboMasters和大疆的飞行器比赛。
研究生一年级 研究生的时候,你的目标比较清晰了,就是做一种机器人至少两年时间,并从中发掘出可以发表论文的知识点。上面我给出的书单里面,你要开始精读里面的几本。 如果做机器人视觉定位、传感器融合方面的研究,1、4、5、7四本书一定要精读。 如果做控制系统的研究,3、8、9、10一定要精读。 如果做规划算法的研究,那么还要读其他偏CS一些的书,比如讲A* search,random forest,图论方面知识的教材。由于我在这方面造诣不深,就不托大了。 如果学习随机系统的控制和最优控制,除了1、2、3,还要读一本神书Stochastic models estimation and control(https://www.cs.unc.edu/~welch/kalman/media/pdf/maybeck_ch1.pdf)。 如果研究机器人视觉定位,几种常用的定位算法:PTAM(Parallel Tracking and Mapping for Small AR Workspaces (PTAM)),ROS的标配VO(viso2_ros - ROS Wiki),SVO(GitHub - uzh-rpg/rpg_svo: Semi-direct Visual Odometry),LSD-SLAM(http://vision.in.tum.de/research/vslam/lsdslam)ORB-SLAM(GitHub - raulmur/ORB_SLAM2: Real-Time SLAM for Monocular, Stereo and RGB-D Cameras, with Loop Detection and Relocalization Capabilities),都必须自己学习之后全部跑一遍。只会用OpenCV的函数和这些工具包并不能说明你会视觉定位,必须要能自己手写出一个能用的才算。国内有一个很厉害的SLAM专家叫高翔,他的博客要关注一下:机器人 - 标签。由于SLAM这两年很火,研究的人很多,所以网上可以参考的资料也很多,比如https://github.com/hcdth011/ROS-Hydro-SLAM,就在ROS上实现了几种定位算法的对比。
我现在非常不建议同学们选择从四旋翼飞行器的动力学控制里找问题作为研究课题。因为四旋翼飞行器的特点已经被研究透了。目前国际上对多旋翼飞行器的研究主要集中在造一些奇葩形状的飞行器,以及给多旋翼飞行器上安装一个机械臂去做力控制,这样做就对多旋翼飞行器控制的动力学造成了一些影响。因此需要同学对动力学和多自由度机械臂控制有比较深的认识。
自动导航和驾驶是这两年的热点,一方面汽车的自动化是大势所趋,另一方面多旋翼飞行器异军突起,产生了很多对自动飞行的需求。除了机器人视觉定位算法以外,同学还需要学习其他的传感器,以及这些传感器与视觉定位算法怎么融合。这里面有很多坑,比如计算量的问题,怎么保证融合算法不崩,怎么处理传感器的延时等等,都需要同学结合自己的项目去踩,坑踩得多了才能成长。如果大家想找一个多旋翼飞行器平台研究自动导航,我推荐大疆的M100,我已经在知乎回答RoboMasters2015夏令营是怎样的? - YY硕的回答里吹过一波M100,前面说过的今年夏令营的知乎回答参加Robomasters 2016夏令营是怎样一种体验? - DJI 大疆创新里也有人帮我吹了一波。 一些大学里学过的知识点,是必须结合研究生期间的项目的需求弄得很清楚的,比如三大变换(傅里叶变换,拉普拉斯变换,Z变换),旋转表示法(欧拉角、四元数、旋转矩阵),数值计算怎么防止矩阵出现数值问题等等。除了自己的项目,还需要把凸优化、卡尔曼滤波还有多自由度机械臂的控制学习一下。这三个领域的知识,是任何一种机器人都会用的到比较难的知识。 凸优化和凸优化的各种变形是非常重要的知识,因为各行各业里的研究问题,多半是会建立一个优化问题去解决的。上面提到的《Convex Optimization》https://web.stanford.edu/~boyd/cvxbook/bv_cvxbook.pdf,也是一本神书,同学们一定要认真读一读。Matlab、Python、C++都有一些现成的工具包可以帮助你解优化问题,不过最好同学们能自己手写一些基本的优化算法,比如gradient descend,barrier method等等。另外现在主流的SLAM算法,后端都是通过一种叫做g2o的优化算法来出效果的。而且g2o能够整合bundle adjustment 和structure-from-motion这两大计算机视觉里的关键问题,可以说是一种很好的计算思想了,非常有必要学习一下g2o。 卡尔曼滤波在上面书单里的1和3都有提到,同时在神书Stochastic models estimation and control(https://www.cs.unc.edu/~welch/kalman/media/pdf/maybeck_ch1.pdf)也有相当多的篇幅。卡尔曼滤波有好几种证明的方法,同学最好能自己学会1-2种。 多自由度的机械臂的难点在于机械臂的运动学正反解、运动学控制和动力学控制,基本是一个建模分析和数值算法实现的问题。如果你所在的学校没有一个财力雄厚的机器人实验室的话,你基本上没有机会接触到多自由度的机械臂。这时候之前学到的Simulink和就要学的Gazebo就派上用场了,你可以用Simscape里面的刚体搭一个多自由度机械臂,然后通过Simulink仿真去学习机械臂的控制;也可以用Gazebo的URDF语言写一个机械臂,然后通过Gazebo和ROS的接口去控制机械臂;也可以用ROS里面的著名工具包MoveIt! Motion Planning Framework,不过MoveIt的问题是,他只能仿真运动学,而不能仿真动力学。工业领域对多自由度的机械臂控制通常用一个叫做D-H表示法的建模工具(Denavit),这个东西我并不太会。我只会向同学们推荐我导师的著作《A mathematical introduction to robotic manipulation》(http://www.cds.caltech.edu/~murray/books/MLS/pdf/mls94-complete.pdf)。 有一个非常神奇的事实:《A mathematical introduction to robotic manipulation》这本机械臂控制领域的著名教材的第二章和计算机视觉领域的著名教材《An Invitation to 3-D Vision》的第二章基本是一样的,都在讲旋转表示法。这是因为所有的旋转表示法都可以归纳为一种优雅的李群结构:SO(3)群。而计算机视觉和机械臂控制都涉及到理解刚体的旋转,事实上用计算系统去观测和控制所有的刚体构成的系统,理解旋转都是很关键的问题。旋转表示法应该作为研究生阶段的一个重要学习的知识点。 李群和李代数是刚体旋转表示背后的数学理论,如果想要深挖一些,可以看这篇文章An elementary introduction to groups and representations的前50页(http://www.cmls.polytechnique.fr/perso/renard/Hall_Group.pdf)。这是我自己读着觉得最好的文章,当然网上也有很多其他的介绍。
研究生阶段还要培养的一个能力是借助各种工具仿真机器人系统的能力。显然地,很多机器人系统真的造出来的话造价昂贵,需要在实际制造之前写一个比较真实的仿真系统出来测试算法。我觉得做仿真系统的能力直接衡量了机器人工程师的技术水平。当你开始要搭一个仿真系统的时候,第一步是通过欧拉方程和牛顿方程确定刚体的运动特点,甚至要自己写刚体二阶微分方程;第二步是确定刚体之间的互联关系,设计不同类型的关节,如果有软性连接需要加入弹簧阻尼模型;第三步是确定被仿真的刚体系统会不会和外界产生碰撞或者其他形式的力,如果有的话,需要设计合适的接触力和摩擦力仿真的模型。多旋翼飞行器的仿真是很简单的,不需要考虑什么接触力。但是多自由度机械臂基本都需要仿真接触力,不和物理世界去交互的机械臂只有很小的实用意义。而能够自行运动locomotion系统,比如双足、多足机器人,则涉及到更多的接触力,多到接触力都会影响仿真系统的数值稳定性。搭建一个仿真系统需要很强的系统建模能力和数值分析的能力,虽然Simulink、Gazebo、Vrep提供了不同程度的工具简化你的工作,但是要让仿真系统能够稳定运行,必须要能深入其中的细节。有些看起来很高大上的仿真工具,比如Nvida的PhysX,在仿真的时候是忽略掉科里奥利力的,如果不理解仿真的本质,可能就会忽略这一个重要的缺陷。
研究生二年级 你的学习计划接近尾声。现在你已经进入了一个很好的状态:看到一个机器人,能够很果断地分析出它用了什么传感器、执行器、计算平台大概是什么量级,他的执行机构能够承受多少力量。看到一个新的算法,能够大约判断清楚它的执行流程,在什么环节做了优化。看到一个新的没学过的知识,能够分析出它和你以前学过的什么知识有联系,你还需要再学什么才能弄明白这个知识点。 研究生二年级要深化第一年学到的那些技术和知识,要做到完整地读过四五本书,五十篇以上的论文。你已经积累了几万行代码的经验,也能熟练地谈论谁家的电机回差小,谁家的电机线性程度好。 你这个时候可以去写作一些论文,也可以开始学习一些更高级的技术和工具,比如用FPGA和GPU优化算法、魔改Linux内核、玩玩液压系统、了解更多机器学习的知识比如强化学习等等。你也可以从计算机图形学或者计算力学里面找到一些帮助你更好进行机器人仿真和系统分析的工具。由于你懂很多机器人方面的知识,你可以给学校的机器人队做指导,或者带队参加一些比较有挑战性的机器人比赛。
写到这里,我就不可能给出很多不同领域的指导了,因为随着学习的进一步深化,我自己熟悉的领域也在收缩。我只能对几个领域给出我的意见。
对视觉定位和传感器融合来说,SLAM急需新的突破,目前通过几何约束去实现loop closure看起来已经走入了死路,没法有更多的发展了,下一步可行的方向是与深度学习进行结合。具体的一些介绍可以阅读行业中大牛的一篇文章http://www.computervisionblog.com/2016/01/why-slam-matters-future-of-real-time.html,记述了几个业界大牛们最新的观点。传感器融合技术,目前还有很多问题可以探索,因为传感器的延时、不均匀的信号,会给定位系统造成困扰,如何去除这些干扰,需要建立比较复杂的非线性优化问题,具体可以关注香港科技大学Shaojie Shen的工作。 对于多自由度机械手和机器人的locomotion来说,这里面还有非常多可以探索的研究问题。我前面提过接触力和摩擦力很难仿真,大神告诉我现在没有任何一种工具和理论能把接触力和摩擦力正确仿真出来,因此如何在机器人系统里妥善处理对这些力的控制,就是很难的问题了。现在业界的一个前沿发展方向,也是利用机器学习技术来帮助机器人学会处理这些外力,不过人类目前最优秀的多自由度机器人系统,Berkeley的Brett机器人,叠几块积木就要用十分钟(New ‘deep learning’ technique enables robot mastery of skills via trial and error),显然还有很多提升的空间。这方面的问题同学可以关注知乎大神 @戴泓楷
@周佳骥
。最后我想再强调一遍表达能力的重要性。你可以从自己带的课程和机器人队入手,把自己这几年来学过的知识做成PPT讲给学生们听,然后让他们给你反馈。多做这样的练习,提升自己做演讲的能力,这将来会让你受益匪浅。
研究生二年级之后,你可以准备进机器人公司工作了,也可以根据你自己感兴趣的研究方向申请博士接着努力。由于你已经掌握了广博的知识和技能,你的职业生涯将会大有作为。 结束语 我从2008年展开自己的机器人生涯。那一年波士顿动力刚刚发布他们的大狗机器人,Python还是很小众的语言,Ubuntu 8.04还很不稳定,Chrome还没有多少人知道。在之后的几年中我目击了深度神经网络的复兴,看到波士顿动力的机器人日渐强大,经历了ROS的起源和繁荣,帮助了大疆的崛起,深深为这个产业的未来感到激动。我希望这篇文章能够帮助更多的年轻人进入机器人学的海洋,为未来机器人学的继续发展贡献力量。 |
|