EmmmuaCode EmmmuaCode
首页​
导航🚀​
  • 数据结构
  • 计算机网络
  • Java基础

    • JavaSE
    • JVM虚拟机
    • JUC并发编程
  • JavaWeb

    • Servlet
    • MVC
    • filter|listener
  • HTML
  • CSS
  • JavaScript
  • Vue
  • uni-app
  • Spring5
  • SpringMVC
  • SpringBoot2
  • SpringCloud
  • SpringSecurity
  • 搜索引擎

    • ElasticSearch
  • 消息队列

    • RabbitMQ
  • 服务器

    • Nginx🌐
  • 服务框架

    • Dubbo
  • Python基础
  • 数据分析
  • Hadoop
  • SQL 数据库

    • MySQL
  • NoSQL 数据库

    • NoSQL数据库概论
    • Redis
    • MongoDB
    • HBase
  • 框架

    • MyBatis
    • MyBatis-Plus
    • ShardingSphere
  • 部署

    • Linux
    • Docker
  • 管理

    • Maven
    • Git
  • 友情链接
  • 优秀博客文章
  • 索引

    • 分类
    • 标签
    • 归档
  • 其他

    • 关于
Github (opens new window)

wufan

海内存知己,天涯若比邻。
首页​
导航🚀​
  • 数据结构
  • 计算机网络
  • Java基础

    • JavaSE
    • JVM虚拟机
    • JUC并发编程
  • JavaWeb

    • Servlet
    • MVC
    • filter|listener
  • HTML
  • CSS
  • JavaScript
  • Vue
  • uni-app
  • Spring5
  • SpringMVC
  • SpringBoot2
  • SpringCloud
  • SpringSecurity
  • 搜索引擎

    • ElasticSearch
  • 消息队列

    • RabbitMQ
  • 服务器

    • Nginx🌐
  • 服务框架

    • Dubbo
  • Python基础
  • 数据分析
  • Hadoop
  • SQL 数据库

    • MySQL
  • NoSQL 数据库

    • NoSQL数据库概论
    • Redis
    • MongoDB
    • HBase
  • 框架

    • MyBatis
    • MyBatis-Plus
    • ShardingSphere
  • 部署

    • Linux
    • Docker
  • 管理

    • Maven
    • Git
  • 友情链接
  • 优秀博客文章
  • 索引

    • 分类
    • 标签
    • 归档
  • 其他

    • 关于
Github (opens new window)
  • Python 基础

    • Python 基础篇(一)
    • Python 基础篇(二)
    • Python 基础篇(三)
    • Python 基础篇(四)
    • Python 基础篇 (五)
    • Python 列表
    • Python 字典
    • Python 元组和集合
    • Python 字符串
    • Python 函数与变量作用域
    • Python 异常处理
    • Python 面向对象
    • Python 模块与包
    • Python 文件
    • 学生信息管理系统
  • 数据分析

    • 数据分析介绍
    • 环境搭建
      • Python版本
      • Anaconda
        • Anaconda prompt
        • Anaconda Navigator
        • Spyder
        • jupyter notebook
      • 使用jupyter notebook的方式
      • conda基本使用
        • 环境管理
        • 包管理
      • 常用快捷键
        • 命令模式(按Esc键)
        • 编辑模式
      • 注意事项
    • Numpy库
    • Pandas 库
  • 大数据

    • 大数据基本导论
  • Hadoop

    • hadoop集群搭建
    • HDFS详解
    • HDFS API
    • MapReduce
    • MapReduce原理及API
    • YARN
  • zookeeper

    • zookeeper详细文档
  • Hive

    • Hive基础
    • Hive SQL语法大全
    • Hive性能调优
  • 工具

    • Flume 详细文档
    • Sqoop详细文档
    • Azkaban详细文档
  • studynotes
  • bigdata
  • dataCleaning
wufan
2021-12-20
目录

环境搭建

# 环境搭建

# Python版本

本课程用到的Python版本都是3.x。要有一定的Python基础,知道列表、字符串、函数等的用法。


# Anaconda

Anaconda(水蟒)是一个捆绑了Python、conda、其他相关依赖包的一个软件。包含了180多个可学计算包及其依赖。Anaconda3是集成了Python3的环境,Anaconda2是集成了Python2的环境。Anaconda默认集成的包,是属于内置的Python的包。并且支持绝大部分操作系统(比如:Windows、Mac、Linux等)。下载地址如下:https://www.anaconda.com/distribution/(如果官网下载太慢,可以在清华大学开源软件站中下载:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/)。根据自己的操作系统,下载相应的版本,因为Anaconda内置了许多的包,所以安装过程需要耗费相当长的时间,大家在安装的时候需要耐心等待。在安装完成后,会有以下几个模块:Anaconda prompt、Anaconda Navigator、Spyder、jupyter notebook,以下分别做一些介绍。

# Anaconda prompt

Anaconda prompt是专门用来操作anaconda的终端。如果你安装完Anaconda后没有在环境变量的PATH中添加相关的环境变量,那么以后你想在终端使用anaconda相关的命令,则必须要在Anaconda prompt中完成。
01

# Anaconda Navigator

这个相当于是一个导航面板,上面组织了Anaconda相关的软件。

# Spyder

一个专门开发Python的软件,熟悉MATLAB的同学会比较有亲切感,但在后期的学习过程中,我们将不会使用这个工具写代码,因为还有更好的可替代的工具。
02

# jupyter notebook

一个Python编辑环境,可以实时的查看代码的运行效果。

03

# 使用jupyter notebook的方式

  1. 先打开Anaconda Prompt,然后进入到项目所在的目录。
  2. 输入命令jupyter notebook打开jupyter notebook浏览器。

# conda基本使用

conda伴随着Anaconda安装而自动安装的。conda可以跟virtualenv一样管理不同的环境,也可以跟pip一样管理某个环境下的包。以下来看看两个功能的用法。

# 环境管理

conda能跟virtualenv一样管理不同的Python环境,不同的环境之间是互相隔离,互不影响的。为什么需要创建不同的环境呢?原因是有时候项目比较多,但是项目依赖的包不一样,比如A项目用的是Python2开发的,而B项目用的是Python3开发的,那么我们在同一台电脑上就需要两套不同的环境来支撑他们运行了。创建环境的基本命令如下:

# conda create --name [环境名称] 比如以下:
conda create --name da-env
1
2

这样将创建一个叫做da-env的环境,这个环境的python解释器根据anaconda来,如果anaconda为3.7,那么将默认使用3.7的环境,如果anaconda内置的是2.7,那么将默认使用2.7的环境。然后你就可以使用conda install numpy的方式来安装包了,并且这样安装进来的包,只会安装在当前环境中。有的同学可能有想问,如果想要装一个Python2.7的环境,anaconda中没有内置Python2.7,那么该怎么实现呢?。实际上,我们只需要在安装的时候指定python的版本,如果这个版本现在不存在,那么anaconda会自动的给我们下载。所以安装Python2.7的环境,使用以下代码即可实现:

conda create --name xxx python=2.7
1

以下再列出conda管理环境的其他命令:

  1. 创建的时候指定需要安装的包:

     conda create --name xxx numpy pandas
    
    1
  2. 创建的时候既需要指定包,也需要指定python环境:

     conda create --name xxx python=3.7 numpy pandas
    
    1
  3. 进入到某个环境

     windows: activate xxx
     mac/linux: source activate xxx
    
    1
    2
  4. 退出环境:

     deactivate
    
    1
  5. 列出当前所有的环境:

     conda env list
    
    1
  6. 移除某个环境:

     conda remove --name xxx --all
    
    1
  7. 环境下的包导出和导入:

    • 导出:conda env export > environment.yml。
    • 导入:conda env create --name xxx -f environment.yml。

# 包管理

conda也可以用来管理包。比如我们创建完一个新的环境后,想要在这个环境中安装包(比如numpy),那么可以通过以下代码来实现:

activate xxx
conda install numpy
1
2

以下再介绍一些包管理常用的命令:

  1. 在不进入某个环境下直接给这个环境安装包:

    conda install [包名] -n [环境名]
    
    1
  2. 列出该环境下所有的包:

     conda list
    
    1
  3. 卸载某个包:

     conda remove [包名]
    
    1
  4. 设置安装包的源:

     conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
     conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
     conda config --set show_channel_urls yes
    
    1
    2
    3

# Jupyter notebook使用

# 常用快捷键

# 命令模式(按Esc键)

  1. Enter:转入编辑模式
  2. Shift-Enter:运行本单元,选中下个单元
  3. Ctrl-Enter:运行本单元
  4. Alt-Enter:运行本单元,在其下插入新单元
  5. Y:单元转入代码状态
  6. M:单元转入markdown状态
  7. R:单元转入raw状态
  8. 1:设定 1 级标题
  9. 2:设定 2 级标题
  10. 3:设定 3 级标题
  11. 4:设定 4 级标题
  12. 5:设定 5 级标题
  13. 6:设定 6 级标题
  14. Up:选中上方单元
  15. K:选中上方单元
  16. Down:选中下方单元
  17. J:选中下方单元
  18. Shift-K:扩大选中上方单元
  19. Shift-J:扩大选中下方单元
  20. A:在上方插入新单元
  21. B:在下方插入新单元
  22. X:剪切选中的单元
  23. C:复制选中的单元
  24. Shift-V:粘贴到上方单元
  25. V:粘贴到下方单元
  26. Z:恢复删除的最后一个单元
  27. D,D:删除选中的单元
  28. Shift-M:合并选中的单元
  29. Ctrl-S:文件存盘
  30. S:文件存盘
  31. L:转换行号
  32. O:转换输出
  33. Shift-O:转换输出滚动
  34. Esc:关闭页面
  35. Q:关闭页面
  36. H:显示快捷键帮助
  37. I,I:中断Notebook内核
  38. 0,0:重启Notebook内核
  39. Shift:忽略
  40. Shift-Space:向上滚动
  41. Space:向下滚动

# 编辑模式

  1. Tab : 代码补全或缩进
  2. Shift-Tab : 提示
  3. Ctrl-] : 缩进
  4. Ctrl-[ : 解除缩进
  5. Ctrl-A : 全选
  6. Ctrl-Z : 复原
  7. Ctrl-Shift-Z : 再做
  8. Ctrl-Y : 再做
  9. Ctrl-Home : 跳到单元开头
  10. Ctrl-Up : 跳到单元开头
  11. Ctrl-End : 跳到单元末尾
  12. Ctrl-Down : 跳到单元末尾
  13. Ctrl-Left : 跳到左边一个字首
  14. Ctrl-Right : 跳到右边一个字首
  15. Ctrl-Backspace : 删除前面一个字
  16. Ctrl-Delete : 删除后面一个字
  17. Esc : 进入命令模式
  18. Ctrl-M : 进入命令模式
  19. Shift-Enter : 运行本单元,选中下一单元
  20. Ctrl-Enter : 运行本单元
  21. Alt-Enter : 运行本单元,在下面插入一单元
  22. Ctrl-Shift-- : 分割单元
  23. Ctrl-Shift-Subtract : 分割单元
  24. Ctrl-S : 文件存盘
  25. Shift : 忽略
  26. Up : 光标上移或转入上一单元
  27. Down :光标下移或转入下一单元

# 注意事项

jupyter notebook每一个cell运行完后都会把这个cell中的变量保存到内存中,如果在一个cell中修改了之前的变量,再此运行这个cell的时候可能会导致一些问题产生。比如以下代码:

# 第一个cell中的代码
a = 10
b = 20

# 第二个cell中的代码
c = a/b
b = 0
1
2
3
4
5
6
7

因为第二个cell修改了b变量,此时在整个环境中b都是等于0的,所以以后再运行这个cell的时候,a/b这个就会出问题了。这时候可以使用Kernel->Rstart&Run All来重新运行整个项目。

#数据分析
上次更新: 2024/04/21, 09:42:22
数据分析介绍
Numpy库

← 数据分析介绍 Numpy库→

最近更新
01
微信支付功能的实现与流程
11-21
02
购物车与结算区域的深入优化与功能完善
11-21
03
购物车与结算区域的功能实现与优化
11-21
更多文章>
Theme by Vdoing | Copyright © 2023-2024 EmmmuaCode | 黔ICP备2022009864号-2
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式