今天要介绍的就是一位从头构建 C++ 机器学习库的 16 岁少年(@novak-99),他的自荐帖在 reddit 上获得了数百的点赞量,并引起了热烈的讨论

下面来看看他构建的这个库(ML++),有 13000 多行代码,涵盖了统计、线性代数、数值分析、机器学习和深度学习等主题。

项目地址:

https://github.com/novak-99/MLPP

ML++ 库包含了 19 大主题以及相关细分内容,分别如下:
  • 回归(线性回归、逻辑回归、Softmax 回归、指数回归、Probit 回归、Cloglog 回归、Tanh 回归)

  • 深度、动态、规模化神经网络(激活函数、优化算法、损失函数、正则化方法、权重初始化方法、学习率规划器)

  • Prebuilt 神经网络(多层感知机、自编码器、Softmax 网络)

  • 生成建模(表格对抗生成网络)

  • 自然语言处理(Word2Vec、词干提取、词袋模型、TFIDF、辅助文本处理函数)

  • 计算机视觉(卷积操作、最大 / 最小 / 平均池化、全局最大 / 最小 / 平均池化、Prebuilt 特征向量)

  • 主成分分析

  • 朴素贝叶斯分类器(多项分布朴素贝叶斯、伯努利分布朴素贝叶斯、高斯分布朴素贝叶斯)

  • 支持向量分类(原始形成、对偶形成)

  • K-Means 算法

  • K 最近邻算法

  • Outlier Finder(使用标准分数)

  • 矩阵分解(SVD 分解、Cholesky 分解、QR 分解)

  • 数值分析(数值微分、Jacobi 向量计算器、Hessian 矩阵计算器、函数近似器、微分方程求解器)

  • 数学变换(离散余弦变换)

  • 线性代数模块

  • 统计模块

  • 数据处理模块(特征缩放、均值归一化、One Hot 表征、反 One Hot 表征、支持的颜色空间转换类型)

  • 实用工具(TP/FP/TN/FN 函数、精度、召回率、准确率、F1 分数)

更多细节内容请参考原项目。
Reddit上,大家纷纷惊艳于作者仅16岁的年纪就做了这么一个了不起的工作,比如有人说:“我在16岁时逃学并玩魔兽世界...花了将近十年的时间才达到这个家伙的水平”,也有人延伸感叹AI领域的“卷”趋势,很多高中生开始涉猎ICLR,NeurIPS等等。你这么看这位16岁少年的工作?怎么看待现在AI领域年轻一代的“卷”趋势?请在留言区分享您的观点。我们也将从中挑选优质分享,参加“每周评论有礼”活动评选

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除