清华硕士爆料:这些才是机器学习必备的数学基础

现如今,计算机科学、人工智能、数据科学已成为技术发展的主要推动力。 无论是要翻阅这些领域的文章,还是要参与相关任务,你马上就会遇到一些拦路虎: 想过滤垃圾邮件,不具备概率论中的贝叶斯思维恐怕不行; 想试着进行一段语音识别,则必须要理解随机过程中的隐马尔科夫模型; 想通过观察到的样本推断出某类对象的总体特征,估计理论和大数定理的思想必须建立; 在统计推断过程中,要理解广泛采用的近似采样方法,蒙特卡洛方法以及马尔科夫过程的稳态也得好好琢磨; 想从文本中提取出我们想要的名称实体,概率图模型也得好好了解。 在看到这些专业术语后,很多人就开始打退堂鼓,然后马上选择放弃。 为什么会这样? 因为机器学习所需数学知识有极高的学习曲线。 那么需要多少数学知识呢?宾夕法尼亚大学的计算机教授所写的《计算机科学相关代数学、拓扑学、微分学以及最优化理论》,就用 1900 页的篇幅讲解了相关的数学知识。 不要着急,不要害怕,继续往下看…… 划重点 01 为什么我要向你推荐它? 我作为一个机器学习、自然语言处理方面的研究者和实践者,参与了大量涉及知识图谱、语义理解、智能问答等技术的工程和科研项目。我认为,有更简单、高效的方法可以让你掌握机器学习中所需的数学知识。 首先,集中力量、紧紧围绕机器学习核心算法中所涉及到的知识进行学习,做好精确打击。 然后,注重加强基础知识与算法、应用案例之间的联系,将理论和算法应用场景相互关联,形成学以致用的实践导向。 同时,运用好 Python 工具,做到和工程应用无缝对接,利用 Numpy、Scipy、Matplotlib、Pandas 等工具强化对知识的理解、提升工作效率

内容中包含的图片若涉及版权问题,请及时与我们联系删除