决策树归纳是从有类标号的训练元组中学习决策模型。常用的决策树算法有ID3,C4.5和CART。它们都是采用贪心(即非回溯的)方法,自顶向下递归的分治方法构造。

八大无监督异常检测技术
本文是笔者首篇关于异常检测类的文章,主要介绍了八种不同的无监督异常检测方法,篇幅较长,实验部分仅供参考。全文表述中如有不明之处,读者可在下方留言。

分类之性能评估指标
本文主要介绍几种常用的用于分类的性能评估指标,同时介绍如何绘制ROC曲线以及计算AUC值的便捷方法。最后再附上一个绘制ROC曲线和计算AUC的Python源码实现。

排序算法-选择排序
选择排序(Selection sort)是一种简单直观的排序算法。它的工作原理是每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,直到全部待排序的数据元...
机器学习-个人资料整理
学习Machine Learning也有很长一段时间了,好好整理下自己的学习资料,这份资料绝对不是一时半会就整理得完的,先开个头吧,以后会间断性更新该blog的。
Python元组与列表的区别
列表和元组非常类似,有时候他们都干一样的事情。但其实他们存在一些不同,最大的区别有两点,第一、元组一旦被赋值,值不可以被改变,一旦改变就会出错;列表可以任意的更改。第二、他们用不同...
机器学习算法Top10
以下就是从参加评选的18种候选算法中,最终决选出来的十大经典算法,文章内容参考的是一篇英文paper,下面来看看十大经典算法的具体内容。

基于知识库与知识图谱构建电影问答系统
本文仅介绍基于模板的知识库问答,讲解过程中如果有阐述不周之处,还请读者指出!下面,我们来看看如何对问题进行解析,并将图谱应用到电影问答系统。

豆瓣电影短评数据情感分析Baseline
为了进一步发挥数据的价值,这次将介绍下如何基于豆瓣影评数据进行评论情感分析,分享一个比较简单的情感分析baseline,后续有机会再将进一步的优化结果分享出来。

13万豆瓣电影数据爬取原理剖析
本文将重点分享下我是如何构建豆瓣电影数据爬取模型,如何处理爬虫过程中遇到的问题,最终得到13w+电影数据加上28w+的影评数据。
评论