您好,欢迎访问唐山现代电脑培训学校官网!

186 3153 9995

全国咨询热线

您现在所在位置: 主页 > 行业动态

python与数据科学应用(Ⅰ)

更新时间:2022-11-05

1.png

传送门:

Python数据科学(1)- python科学应用数据(Ⅰ)

Python数据科学(2)- python科学应用数据(Ⅱ)

Python数据科学(3)- python科学应用数据(Ⅲ)

Python数据科学(4)- 数据收集系列

Python数据科学(五)- 数据处理和数据采集

Python数据科学(6)- 资料清理(Ⅰ)

Python数据科学(7)- 资料清理(Ⅱ)

1.数据科学介绍与应用

数据科学主要基于统计学、机器学习、数据可视化和(某一)领域的知识。其主要研究内容包括数据科学基础理论、数据预处理、数据计算和数据管理(来自百度百科全书)。

1.统计数据科学所需的能力(Statistic)单变量分析、多变量分析、变异数分析

数据处理(Data Munging)抓取数据,清理数据,转换数据

数据可视化(Data Visualization)图,商业智能系统

2.数据科学主要分为以下步骤

可分为数据科学家和数据工程师。 数据科学家主要负责前三步,而数据工程师则负责后两步。

2.Python与数据科学1.python语言

Python请直接阅读链接的第一部分。

通过对比,可以突出python简单易用#使用J ** A输出Hello World class test{        public static void  ** in(String args[]){            System.out.println("Hello World");  }}#使用python语言输出Hello World 只需要一行代码print("Hello World")2.python如果需要进行统计科学计算,需要一个完整的数据分析套件,python中具备Numpy、Scipy、stat ** odels.如果需要深度学习,也可以使用TensorFlow、MXNET,它们都有python结构化数据处理和分析处理和分析Pandas可用于处理大数据PySpark机器学习, python上又有Scikit-learn3.安装Anaconda

看过我之前文章的同学都知道,我一直用它python2.7 最早也用过3.5.现在我要带你安装Anaconda,原谅我刚开始学习python太年轻了,Python学起来容易,但用起来不容易。头疼的是包的管理和Python不同版本的问题,尤其是当你使用它们时Windows的时候。然后出现了发行版Python(比如Anaconda),发行版最直接的好处就是会python还有很多常用的package包装,方便我们使用。接下来我带你安装Anaconda.

也可以百度搜索Anaconda

根据自己的计算机系统选择

建议安装使用Python3,理由如下

python3和python语法差异很大,具体参考解释 Python 2 和 Python 3 版本之间的差异Python语言作者Guido van Rossum邮件通知Python 2.7支持时间延长至2020年,届时将不再维护

然后根据自己的电脑做32// ** 位的下载。

下载安装后记得检查环境变量

安装后,窗户会看到它Jupyter notebook

4.使用Jupyter notebook

Jupyter Notebook(以前叫 IPython notebook)是支持运行的交互式笔记本 40 多种编程语言。Jupyter Notebook 本质是一个 Web 支持实时代码、数学方程、可视化和共享文学程序文档的应用程序  ** rkdown。 用途包括:数据清理与转换、数值模拟、统计建模、机器学习等。这就是我们使用它的原因。

安装好Anaconda,打开cmd,输入Jupyter notebook

点击New,新建文件

代码可以通过按钮或快捷键操作

5.Python 3 语法1.变量类型

和其他语言一样,python三是六种标准数据类型:

Number(数字)String(字符串)List(列表)Tuple(元组)Sets( ** )Dictionary(字典)

数字包括int、float、bool、complex(复数)。内置的 type() 函数可用于查询变量所指的对象类型。另外还可以用Python的自省 isinstance 来判断>>>a = 0609>>> isinstance(a, int)True>>>2.列表Python列表是一种内置数据类型:list。list有序 ** ,元素可以随时添加和删除。序列中的每个元素分配一个数字 - 第一个索引是0,第二个索引是1,等等。列表可以存储各种类型的数据#设置listli = 查看list使用相关功能dir()dir(li)

#查看list的长度>>>len(li)5#查看list内容>>>print(li)[304,12,999,46,405]>>>li[0]304>>>li[-1]405>>>li[304,12,999]>>>li.append(609)>>>print(li)[304,12,999,46,405,609]#列表扩展extend 接受一个参数总是一个参数 list,并且把这个 list 添加到原始元素中的每个元素 list 中>>>li.extend(['xlm','love'])>>>print(li)[304,12,999,46,405,'xlm','love']#list排序>>>li.sort>>>print(li)[12, 46, 304, 405, 999, 'xlm', 'love&#39>>>li = [304,12,999,46,405]>>>li.sort(reverse=True)>>>print(li) [999, 405, 304, 46, 12]3.元组

元组(tuple)与列表类似,区别在于元组的元素无法修改。

tuple = 4.字典字典4.(dictionary)是Python另一种非常有用的内置数据类型。列表是有序对象的组合,字典是无序对象 ** 。两者的区别在于字典中的元素是通过键存取的,而不是通过偏移存取的。字典是一种映射类型,字典使用"{ }"标志,它是一个无序的键(key) : 值(value)对 ** 。键(key)不可变类型必须使用。键在同一字典中(key)必须是唯一的。

推荐课程

在线客服

ONLINE SERVICE

联系电话

186 3153 9995

返回顶部