-
Pandas备忘拾遗 – 多重索引
Jul302020Pandas 备忘拾遗 – 多重索引 from IPython.core.display import display, HTML display(HTML("<style>.container { width:80% !important; }</style>")) import numpy as np import matplotlib.pyplot as plt import pandas as pd import seaborn as sns pd.__version__ '1.0.5' def df_to ...
阅读全文抢沙发
-
交叉熵实例,Tensorflow交叉熵函数
Sep2420191. 概述 学习Tensorflow关于交叉熵的计算方法时: tf.nn.sparse_softmax_cross_entropy_with_logits tf.nn.softmax_cross_entropy_with_logits 需要弄清楚这两个方法的差异,以及方法内部的细节,即这个方法是如何计算出来交叉熵的. 因此,使用一个具体的例子来说明. 上述两个方法有两个主要参数logits 和 labels. logits ...
阅读全文作者:边城网事 | 分类:Tensorflow, 神经网络 | 阅读:983
-
机器学习实战Ch06 支持向量机SVM
Sep1620191. 概述 最基本的支持向量机(Support Vector Machine SVM)用于解决线性可分数据的二分类问题. 对于二维平面上的点,可以用一条线来分隔不同分类的点.如下图所示. 对于三维空间中的点,可以用一个面来分隔不同分类的点,对于四维及以上维度的点,用超平面来分隔不同分类的点.这里为便于叙述,将二维中的分隔直线,三维中的分隔 ...
阅读全文作者:边城网事 | 分类:Machine Learning, ML-算法 | 阅读:1,001
-
机器学习实战Ch05 多元线性回归
Sep1220191. 多元线性回归要解决的问题 如果有下面的训练数据,$x_1$和$x_2$是特征数据,$y$是数据标签,观察到$y$的取值要么为1,要么为0. $x_1$ $x_2$ $y$ 1.2 2.3 1 2.5 2.2 0 1.4 2.1 1 那么问题来了, 已知有上面的观察数据,如果有一组新的输入$x_1 = 1.5,x_2=2.4$,要如何预测$y$的值呢? 2. sigmoid函数 要解决上 ...
阅读全文
-
机器学习 决策树可视化
Sep092019机器学习决策树可视化 <机器学习实战>第三章中介绍了基于Json格式的决策树的可视化方法,但是书中介绍的方法画出来的图过于简陋. 于是使用Python的pygraphviz库重新画了一个,看起来舒服一些. pygraphviz依赖于GraphViz,因此使用之前需要先下载安装. Mac系统直接brew安装就好了. 假设决策树算法计算完成之后,生成类 ...
阅读全文
-
机器学习实战04 朴素贝叶斯算法
Aug292019
-
机器学习实战03 – 决策树分类器
Aug092019机器学习 实战 决策树 代码实现, 以及利用graphviz和pygraphviz库画树形图,类似下面的图形 并且根据生成的决策树给数据分类. 涉及到 计算Shannon 熵, 设 $x_i$ 为训练数据中的一个分类, $S$ 表示训练数据集类别的样本空间, 则 $p(i)$表示类别$x_i$ 在样本空间 $S$中出现的频率 则, Shannon 熵H的计算公式为 $$H = ̵ ...
阅读全文作者:边城网事 | 分类:Machine Learning, ML-算法 | 阅读:802
-
机器学习实战02 — K-近邻算法识别手写数字
Aug062019按照书中内容写了一个手写数字识别demo. 尝试自己手写数字并拍了照片,将照片缩小成32*32,然后转成灰度图,再转成二值矩阵. 实际效果不太好,还需要优化. 先贴代码,日后改善. import pandas as pd import numpy as np import matplotlib.pyplot as plt import operator from os import listdir from PIL import Image de ...
阅读全文作者:边城网事 | 分类:Machine Learning, ML-算法 | 阅读:738
-
K-近邻算法实现
Aug042019#!/usr/bin/env python3 import pandas as pd import numpy as np import matplotlib.pyplot as plt import operator def main(): group, labels = createTrainingDataSet() label = classify0([0, 0], group, labels, 3) print(label) def dating_test(): datingDataMat, datingLabels = file2matrix("datingT ...
阅读全文作者:边城网事 | 分类:ML-算法 | 阅读:745
-
Numpy 数组广播机制 实例 broadcast
Apr022019#!/usr/bin/env python3 import pandas as pd import numpy as np """ Numpy 数组广播机制 实例 broadcast broadcasting的规则 对两个numpy数组之间的作二元计算,broadcasting须遵循一下规则: 如果两个数组维数不相等,维数较低的数组的shape会从左开始填充1,直到和高维数组的维数匹配 如果 ...
阅读全文