朴素贝叶斯算法 朴素 假定特征与特征之间是相互独立的 贝叶斯公式 公式分为三个部分: P(C):每个文档类别的概率(某文档类别数/总文档数量) P(W│C):给定类别下特征(被预测文档中出现的词)的概……继续阅读 » 2周前 (03-18) 2313浏览 0评论1641个赞
特征工程 特征抽取 文本特征提取-CountVectorizer 作用:对文本数据进行特征值化 sklearn.feature_extraction.text.CountVectorizer(stop……继续阅读 » 5年前 (2021-04-01) 3463浏览 0评论2787个赞
朴素版Dijkstra 目标 找到从一个点到其他点的最短距离 思路 ①初始化距离dist数组,将起点dist距离设为0,其他点的距离设为无穷(就是很大的值) ②for循环遍历n次,每层循环里找出不在S……继续阅读 » 5年前 (2021-02-01) 2493浏览 0评论1606个赞
优化器总结 机器学习中,有很多优化方法来试图寻找模型的最优解。比如神经网络中可以采取最基本的梯度下降法。 梯度下降法(Gradient Descent) 梯度下降法是最基本的一类优化器,目前主要分为三……继续阅读 » 5年前 (2021-01-29) 3135浏览 0评论250个赞
欠拟合与过拟合 什么是过拟合与欠拟合 欠拟合 过拟合 第一种情况:因为机器学习到的天鹅特征太少了,导致区分标准太粗糙,不能准确识别出天鹅。 第二种情况:机器已经基本能区别天鹅和其他动物了。然后,很不巧……继续阅读 » 5年前 (2021-01-21) 2310浏览 0评论1587个赞
线性回归 什么是线性回归 定义与公式 线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。 特点:只有一个……继续阅读 » 5年前 (2021-01-20) 2535浏览 0评论2778个赞