PS:结合下面这篇博客的第一个代码,写写关于python的入门编程理解
https://blog.csdn.net/han_xiaoyang/article/details/49123419
用 python shell 运行data1.py
- 打开python shell —new file 新建一个.py 文件并保存
- run — run model 然后python shell 会出现相应的结果
PS:嫌弃我讲的太敷衍可以参考这片百度知道哪1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
https://zhidao.baidu.com/question/1958691628398602620.html
```python
#data1.py
#用到包里的函数
from numpy import loadtxt, where
from pylab import scatter, show, legend, xlabel, ylabel
#load the dataset
data = loadtxt('D:/机器学习/逻辑回归/data1.txt', delimiter=',')
X = data[:, 0:2]
y = data[:, 2]
pos = where(y == 1)
neg = where(y == 0)
scatter(X[pos, 0], X[pos, 1], marker='o', c='b')
scatter(X[neg, 0], X[neg, 1], marker='x', c='r')
xlabel('Feature1/Exam 1 score')
ylabel('Feature2/Exam 2 score')
legend(['Fail', 'Pass'])
show()
```
代码运行的结果![data1结果](http://p8ge6t5tt.bkt.clouddn.com/%E5%B1%8F%E5%B9%95%E6%88%AA%E5%9B%BE%2817%29.png)
## 使用pip工具安装包
pip是python的一个非常好用的包管理工具,可以很方便地安装和管理各种三方库
具体可以参考下面这篇博客~~
https://blog.csdn.net/zhangxinyu11021130/article/details/50987631
注意事项:
1. 要设置系统变量
2. 要下载相应版本的包 我的是python3.5.264位
下面是更新包的简单方法
1. 进入cmd cd D:/program/python/pythoninstall/Scripts
2. pip install pandas
3. 进入python ,import pandas 查看是否导入成功
PyPi地址在国外,因为有墙的原因所以有些地区使用pip安装第三方库的时候会出现下载慢甚至严重的无法访问导致安装失败。通过更换pip镜像源为国内地址可以解决上述问题
开源软件镜像站 https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
PS:真的是遇到一件超级诡异的事情,用pandas里面的describe没有反应,害我以为我pandas没有装好!但是在shell里面一条条指令输进去有结果,但是在.py文件里一口气run竟然不行!!!哇哦,要不是师兄,我还一个下午都在纠结我的包是不是没有装好
~~ 好了,这条诡异的PS总算解决了,因为我没有用print函数,当然不会输出结果 ~~ 哎 ~ 傻了吧唧的 ~~
分割线 python 学习方向
python有着全品类的数据科学工具,从数据获取、数据清洗到整合各种算法都做得非常全面。
网页爬虫: scrapy
数据挖掘:
pandas:模拟R,进行数据浏览与预处理。numpy:数组运算。
scipy:高效的科学计算。
matplotlib:非常方便的数据可视化工具。
机器学习:
scikit-learn:远近闻名的机器学习package。未必是最高效的,但是接口真心封装得好,几乎所有的机器学习算法输入输出部分格式都一致。而它的支持文档甚至可以直接当做教程来学习,非常用心。对于不是非常高纬度、高量级的数据,scikit-learn胜任得非常好(有兴趣可以看看sklearn的源码,也很有意思)。libsvm:高效率的svm模型实现(了解一下很有好处,libsvm的系数数据输入格式,在各处都非常常见)
keras/TensorFlow:对深度学习感兴趣的同学,也能很方便地搭建自己的神经网络了。
自然语言处理:
nltk:自然语言处理的相关功能做得非常全面,有典型语料库,而且上手也非常容易。交互式环境:
ipython notebook:能直接打通数据到结果的通道,方便至极。强力推荐。