• 机器学习实战Ch06 支持向量机SVM

    1. 概述 最基本的支持向量机(Support Vector Machine SVM)用于解决线性可分数据的二分类问题. 对于二维平面上的点,可以用一条线来分隔不同分类的点.如下图所示. 对于三维空间中的点,可以用一个面来分隔不同分类的点,对于四维及以上维度的点,用超平面来分隔不同分类的点.这里为便于叙述,将二维中的分隔直线,三维中的分隔 ...

    阅读全文
    作者:边城网事 | 分类:Machine Learning, ML-算法 | 阅读:9
  • 机器学习实战Ch05 多元线性回归

    1. 多元线性回归要解决的问题 如果有下面的训练数据,$x_1$和$x_2$是特征数据,$y$是数据标签,观察到$y$的取值要么为1,要么为0. $x_1$ $x_2$ $y$ 1.2 2.3 1 2.5 2.2 0 1.4 2.1 1 那么问题来了, 已知有上面的观察数据,如果有一组新的输入$x_1 = 1.5,x_2=2.4$,要如何预测$y$的值呢? 2. sigmoid函数 要解决上 ...

    阅读全文
    作者:边城网事 | 分类:Machine Learning, ML-算法, Python | 阅读:17
  • 机器学习 决策树可视化

    机器学习决策树可视化 <机器学习实战>第三章中介绍了基于Json格式的决策树的可视化方法,但是书中介绍的方法画出来的图过于简陋. 于是使用Python的pygraphviz库重新画了一个,看起来舒服一些. pygraphviz依赖于GraphViz,因此使用之前需要先下载安装. Mac系统直接brew安装就好了. 假设决策树算法计算完成之后,生成类 ...

    阅读全文
    作者:边城网事 | 分类:Machine Learning, Python, 随记 | 阅读:19
  • 第一章 函数与极限

    1. 第一节 映射与函数 1.1. 集合 1.2. 映射 1.3. 函数 1.3.1. 函数的概念 1.3.2. 函数的几种特性 1.3.2.1. 函数的有界性 设函数$f(x)$的定义域为 $D$,数集$X \subset D$.如果存在数$K_1$,使得 $$f(x) \le K_1$$ 对于任一 $x\in X$ 都成立,则称函数 $f(x)$ 在 $X$ 上有上界,而$K_1$ 称为函数 $f(x)$ 在$X$ 上的一个上 ...

    阅读全文
    作者:边城网事 | 分类:高数同济六版读书笔记 | 阅读:20
  • 第三章 微分中值定理与导数应用

    1. 第一节 微分中值定理 1.1. 费马引理 1.2. 罗尔定理 1.3. 拉格朗日中值定理 1.4. 柯西中值定理 2. 第二节 洛必达法则 3. 第三节 泰勒公式 3.1. 关于$(x – x_0)$的$n$次多项式 $$p_n(x) = a_0 + a_1(x – x_0) + a_2(x – x_0)^2 + \dots + a_n(x – x_0)^n \tag{1}$$ 3.2. 替换公式(1)的系数 将 ...

    阅读全文
    作者:边城网事 | 分类:高数同济六版读书笔记 | 阅读:36
  • 机器学习实战04 朴素贝叶斯算法

    1. 概述 1.1. 数学基础知识 朴素贝叶斯算法主要是利用概率论中的贝叶斯公式来构建分类器给文档分类. 涉及到以下数学知识: 古典概型 条件概率 贝叶斯公式 古典概型就是计算概率的基本方法这里略去不表. 条件概率是指在已知A已经发生的情况下,求B的概率,可表示为 $P(B|A)$. 其计算公式为: $$P(B|A)=\frac{P(AB)}{P(A)}$ ...

    阅读全文
    作者:边城网事 | 分类:ML-算法, Python | 阅读:45
  • wordpress 中 plantuml-renderer 插件中文乱码的解决办法

    wordpress 中 plantuml-renderer 插件中文乱码的解决办法 plantuml-renderer/public/class-plantuml-renderer-public.php 找到上面的文件, 修改99行 为下面这个样子: private function encodep( $text ) { $data = $text; //utf8_encode( $text ); 因为网页原来已经是utf-8 编码了,这里不需要再次编码 $compressed ...

    阅读全文
    作者:边城网事 | 分类:随记 | 阅读:41
  • Graphviz 语法学习

    1. 综合示例 digraph{ //attributes edge[color = Blue, style = "dashed",] label="byPass-Branch" node[color=red]; //nodes headNode->node1; headNode->node2; node1->node3; node[shape=box,color=black]; //distribute headNode->fromApp1[style=dotted]; headNode->fromApp2[style=dotted]; headN ...

    阅读全文
    作者:边城网事 | 分类:图形_可视化 | 阅读:42
  • 机器学习实战03 – 决策树分类器

    机器学习 实战 决策树 代码实现, 以及利用graphviz和pygraphviz库画树形图,类似下面的图形 并且根据生成的决策树给数据分类. 涉及到 计算Shannon 熵, 设 $x_i$ 为训练数据中的一个分类, $S$ 表示训练数据集类别的样本空间, 则 $p(i)$表示类别$x_i$ 在样本空间 $S$中出现的频率 则, Shannon 熵H的计算公式为 $$H = ̵ ...

    阅读全文
    作者:边城网事 | 分类:Machine Learning, ML-算法 | 阅读:43
  • 机器学习实战02 — K-近邻算法识别手写数字

    按照书中内容写了一个手写数字识别demo. 尝试自己手写数字并拍了照片,将照片缩小成32*32,然后转成灰度图,再转成二值矩阵. 实际效果不太好,还需要优化. 先贴代码,日后改善. import pandas as pd import numpy as np import matplotlib.pyplot as plt import operator from os import listdir from PIL import Image de ...

    阅读全文
    作者:边城网事 | 分类:Machine Learning, ML-算法 | 阅读:45