GitHub - LinXueyuanStdio/PythonDataMining: 在学院的书架上发现了一本不带脑子就能看懂的书《Python数据挖掘与实战》

FOSSA Status

在学院的书架上发现了一本不带脑子就能看懂的书《Python数据挖掘与实战》

推荐在nbviewer下加速浏览

  • pdf版的书在当前目录./下,分黑白图版彩图版

    • 体积略大(8.8Mb),谨慎点击,建议clonefork
  • 随书附带的代码在./BOOK_CODE文件夹下面,全英文

    • 原书有些数据集不包含在内,因为这些数据需要从其他网站上下载,而网站已经更新,书编写时的数据很难再找到
    • 有些数据还要翻墙才拿得到,比如第六章”使用朴素贝叶斯进行社交媒体挖掘”时,数据集需要通过twitterAPI来获取,要在代码里翻墙
    • 我根据书中的需要,一个一个重新把数据集找到,放到./data目录下
    • 懒得一个一个改随书附带的代码里面的路径,遂在随书附带的代码的基础上做了中文版
  • 阅读笔记在当前目录./

  • 知识点在笔记notes

  • 最后,厚着脸皮要 star ,嘤嘤嘤~~

  1. 数据挖掘流程简单示例10min.ipynb
  2. 用近邻算法分类.ipynb
  3. 用决策树预测获胜球队.ipynb
  4. 用亲和性分析推荐电影.ipynb
  5. 用转换器抽取特征.ipynb
  6. 用朴素贝叶斯进行社会媒体挖掘.ipynb
  7. 用图挖掘找到感兴趣的人.ipynb
  8. 用神经网络破解验证码.ipynb
  9. 作者归属问题.ipynb
  10. 新闻语料分类.ipynb
  11. 用深度学习进行图象分类.ipynb
  12. 大数据处理.ipynb
  1. Python Tweepy 翻墙抓取Twitter信息

License

FOSSA Status


为您推荐了相关的技术文章:

  1. BlackHat 2016 回顾之 JNDI 注入简单解析
  2. 漏洞检测的那些事儿 - 从理论到实战
  3. 利用 Python 特性在 Jinja2 模板中执行任意代码
  4. 从反序列化到命令执行 - Java 中的 POP 执行链
  5. 服务端模板注入攻击 (SSTI) 之浅析

原文链接: github.com