微信扫码
与创始人交个朋友
我要投稿
机器学习模型的种类繁多,应用广泛,如下列举一些常用模型:
1、线性模型
2、基于树的模型
决策树(Decision Tree)
随机森林(Random Forest)
梯度提升决策树(Gradient Boosting Decision Tree, GBDT)
LightGBM
XGBoost
3、神经网络模型
深度神经网络(Deep Neural Network, DNN)
卷积神经网络(Convolutional Neural Network, CNN)
循环神经网络(Recurrent Neural Network, RNN)
Transformer
GAN
diffusion model
4、支持向量机
支持向量机(Support Vector Machine, SVM)
5、近邻模型
K近邻(K-Nearest Neighbors, KNN)
6、概率图模型
朴素贝叶斯(Naive Bayes)
贝叶斯网络(Bayesian Network)
隐马尔可夫模型(Hidden Markov Model, HMM)
7、集成学习模型
AdaBoost
XGBoost
LightGBM
8、聚类模型
均值聚类(K-Means Clustering)
9、降维模型
主成分分析(Principal Component Analysis, PCA)
10、其他模型
线性判别分析(Linear Discriminant Analysis, LDA)
关联规则学习(Association Rule Learning)
矩阵分解(Matrix Factorization)
协同过滤(Collaborative Filtering)
在众多机器学习模型中,我们如何在各种实际情况下做出恰当的选择呢?本文我从如下几个方面系统地分析下~ 有帮助的话点个赞哦。
a. 图像识别
b. 自然语言处理
c. 推荐系统
d. 表格数据的任务
适用模型:自然语言及图像识别上面深度学习无疑是王者,但在表格类异构数据上,xgboost等集成学习树模型才是实打实的神器。大量实验表明基于树的模型在中型表格数据集上仍然是 SOTA。
对于这一结论,下文给出了确凿的证据,在表格数据上,使用基于树的方法比深度学习(甚至是现代架构)更容易实现良好的预测,研究者并探明了其中的原因。
论文地址:https://hal.archives-ouvertes.fr/hal-03723551/document
很多时候模型效度需要实际验证的时候才知道优劣,通常情况下那个模型效度好,才是最终决定我们选择那种模型,或者考虑所有模型一起上(模型融合)。
模型融合:是一种结合多个模型的预测结果以生成更强大、更准确的预测结果的策略。它通过将多个弱模型(基模型)的预测结果整合,以降低误差并提高模型的泛化能力。常见的模型融合方法,如Bagging、Stacking与Boosting。
常用的效度评估指标如下:
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-05-28
2024-04-26
2024-08-21
2024-04-11
2024-07-09
2024-08-13
2024-07-18
2024-10-25
2024-07-01
2024-06-17