python与数据科学应用(Ⅰ)
更新时间:2022-11-05
传送门:
Python数据科学(1)- python科学应用数据(Ⅰ)
Python数据科学(2)- python科学应用数据(Ⅱ)
Python数据科学(3)- python科学应用数据(Ⅲ)
Python数据科学(4)- 数据收集系列
Python数据科学(五)- 数据处理和数据采集
Python数据科学(6)- 资料清理(Ⅰ)
Python数据科学(7)- 资料清理(Ⅱ)
1.数据科学介绍与应用
数据科学主要基于统计学、机器学习、数据可视化和(某一)领域的知识。其主要研究内容包括数据科学基础理论、数据预处理、数据计算和数据管理(来自百度百科全书)。
1.统计数据科学所需的能力(Statistic)单变量分析、多变量分析、变异数分析
数据处理(Data Munging)抓取数据,清理数据,转换数据
数据可视化(Data Visualization)图,商业智能系统
2.数据科学主要分为以下步骤
可分为数据科学家和数据工程师。 数据科学家主要负责前三步,而数据工程师则负责后两步。
2.Python与数据科学1.python语言
Python请直接阅读链接的第一部分。
通过对比,可以突出python简单易用#使用J ** A输出Hello World class test{ public static void ** in(String args[]){ System.out.println("Hello World"); }}#使用python语言输出Hello World 只需要一行代码print("Hello World")2.python如果需要进行统计科学计算,需要一个完整的数据分析套件,python中具备Numpy、Scipy、stat ** odels.如果需要深度学习,也可以使用TensorFlow、MXNET,它们都有python结构化数据处理和分析处理和分析Pandas可用于处理大数据PySpark机器学习, python上又有Scikit-learn3.安装Anaconda
看过我之前文章的同学都知道,我一直用它python2.7 最早也用过3.5.现在我要带你安装Anaconda,原谅我刚开始学习python太年轻了,Python学起来容易,但用起来不容易。头疼的是包的管理和Python不同版本的问题,尤其是当你使用它们时Windows的时候。然后出现了发行版Python(比如Anaconda),发行版最直接的好处就是会python还有很多常用的package包装,方便我们使用。接下来我带你安装Anaconda.
也可以百度搜索Anaconda
根据自己的计算机系统选择
建议安装使用Python3,理由如下
python3和python语法差异很大,具体参考解释 Python 2 和 Python 3 版本之间的差异Python语言作者Guido van Rossum邮件通知Python 2.7支持时间延长至2020年,届时将不再维护
然后根据自己的电脑做32// ** 位的下载。
下载安装后记得检查环境变量
安装后,窗户会看到它Jupyter notebook
4.使用Jupyter notebook
Jupyter Notebook(以前叫 IPython notebook)是支持运行的交互式笔记本 40 多种编程语言。Jupyter Notebook 本质是一个 Web 支持实时代码、数学方程、可视化和共享文学程序文档的应用程序 ** rkdown。 用途包括:数据清理与转换、数值模拟、统计建模、机器学习等。这就是我们使用它的原因。
安装好Anaconda,打开cmd,输入Jupyter notebook
点击New,新建文件
代码可以通过按钮或快捷键操作
5.Python 3 语法1.变量类型
和其他语言一样,python三是六种标准数据类型:
Number(数字)String(字符串)List(列表)Tuple(元组)Sets( ** )Dictionary(字典)
数字包括int、float、bool、complex(复数)。内置的 type() 函数可用于查询变量所指的对象类型。另外还可以用Python的自省 isinstance 来判断>>>a = 0609>>> isinstance(a, int)True>>>2.列表Python列表是一种内置数据类型:list。list有序 ** ,元素可以随时添加和删除。序列中的每个元素分配一个数字 - 第一个索引是0,第二个索引是1,等等。列表可以存储各种类型的数据#设置listli = 查看list使用相关功能dir()dir(li)
#查看list的长度>>>len(li)5#查看list内容>>>print(li)[304,12,999,46,405]>>>li[0]304>>>li[-1]405>>>li[304,12,999]>>>li.append(609)>>>print(li)[304,12,999,46,405,609]#列表扩展extend 接受一个参数总是一个参数 list,并且把这个 list 添加到原始元素中的每个元素 list 中>>>li.extend(['xlm','love'])>>>print(li)[304,12,999,46,405,'xlm','love']#list排序>>>li.sort>>>print(li)[12, 46, 304, 405, 999, 'xlm', 'love'>>>li = [304,12,999,46,405]>>>li.sort(reverse=True)>>>print(li) [999, 405, 304, 46, 12]3.元组
元组(tuple)与列表类似,区别在于元组的元素无法修改。
tuple = 4.字典字典4.(dictionary)是Python另一种非常有用的内置数据类型。列表是有序对象的组合,字典是无序对象 ** 。两者的区别在于字典中的元素是通过键存取的,而不是通过偏移存取的。字典是一种映射类型,字典使用"{ }";标志,它是一个无序的键(key) : 值(value)对 ** 。键(key)不可变类型必须使用。键在同一字典中(key)必须是唯一的。
推荐课程
-
唐山现代多元Design全能班
346人 报名小编
-
唐山现代多元Design精英班
393人 报名小编
-
唐山现代艺术设计全能班
373人 报名小编
-
唐山电商课程培训班
331人 报名小编
-
唐山专业盲打指法训练
251人 报名小编