Spider-Python基础
本文最后更新于:2023年10月19日 晚上
Document Outline
一、Python环境的安装
1. 下载Python
点击downloads按钮,在下拉框中选择系统类型(windows/Mac OS/Linux等)
选择下载最新版本的Python
2. 安装Python
双击下载好的Python安装包
勾选左下角Add Python 3.7 to PATH 选项,然后选择Install now立刻安装Python.
默认安装
自定义安装
安装完成
3. 测试是否安装成功
点击电脑左下角开始按钮,输入cmd 进入到windows的命令行模式。
在命令行中输入Python,正确显示Python版本,即表示Python安装成功
如果在命令行中输入python出现如下错误
可能是因为在安装Python的过程中没有勾选 Add Python 3.7 to PATH 选项,此时需要手动对Python进行配置。
4. 手动配置Python
注意:如果在安装过程中,已经勾选了 Add Python 3.7 to PATH选项,并且在cmd 命令模式下输入python指令
不报错,就不需要再手动的配置Python.
右键此电脑 –> 选择 属性
选择高级系统设置–>环境变量–>找到并且双击Path
双击Path
,在弹框里点击新建,找到Python的安装目录,把路径添加进去
这里新添加的路径 E:\python 是Python安装好以后,Python.exe 这个可执行文件所在的目录。
二、pip的使用
pip 是一个现代的,通用的Python包管理工具。提供了对 Python 包的查找、下载、安装、卸载的功能,便
于我们对Python的资源包进行管理。
1. 安装
在安装Python时,会自动下载并且安装pip.
2. 配置
在windows命令行里,输入 pip -V 可以查看pip的版本。
如果在命令行里,运行pip -V,出现如下提示:
可能是因为在安装python的过程中未勾选 Add Python 3.7 to PATH 选项,需要手动的配置pip的环境变量。
右键此电脑–>环境变量–>找到并且双击Path–>在弹窗里点击新建–>找到pip的安装目录,把路径添加进去。
这里新添加的路径 E:\python\Scripts 是Python安装好以后,pip.exe 这个可执行文件所在的目录。
3. 使用pip管理Python包
pip install <包名> 安装指定的包
pip uninstall <包名> 删除指定的包
pip list 显示已经安装的包
pip freeze 显示已经安装的包,并且以指定的格式显示
4. 修改pip下载源
载。这是个国外的网站,遇到网络情况不好的时候,可能会下载失败,我们可以通过命令,修改pip现在软件时的
源。 格式:
上下载requests(基于python的第三方web框架)
国内常用的pip下载源列表:
三、运行Python程序
1. 终端运行
1. 直接在python解释器中书写代码
退出python环境
exit()
ctrl + z ==>enter
2. 使用ipython解释器编写代码
使用pip命令,可以快速的安装IPython.
2. 运行python文件
使用python指令运行后缀为.py的python文件
3. Pycharm
尽管上面介绍的方法已经能够提高我们的编码速度,但是仍然无法应对我们开发中更加复杂的要求。一般情况下,
我们都需要借助工具来辅助我们快速的搭建环境,编写代码以及运行程序。
IDE的概念
IDE(Integrated Development Environment)又被称为集成开发环境。说白了,就是有一款图形化界面的软
件,它集成了编辑代码,编译代码,分析代码,执行代码以及调试代码等功能。在我们Python开发中,最常
用的IDE是Pycharm.
pycharm由捷克公司JetBrains开发的一款IDE,提供代码分析、图形化调试器,集成测试器、集成版本控制系统等,
主要用来编写Python代码。
Pycharm的安装
双击安装文件
自定义安装路径(可以不用设置
编辑设置(全部选中)
安装完成后双击
设置主题
启动软件
4. Pycharm的使用介绍
运行Pycharm,选择Create New Project,创建一个新的Python工程。
选择’Pure Python’创建一个新的纯Python工程项目,Location表示该项目的保存路径,Interpreter 用来
指定Python解释器的版本。
右击项目,选择New,再选择Python File
在弹出的对话框中输入的文件名HelloPython,点击OK,表示创建一个Python程序的文本文件,文本文件后
缀名默认.py
在新建的01_尚硅谷_firstPythonDemo.py文件里,输入以下代码,并在空白处右键选择Run运行,表示输出
一段尚硅谷爬虫字符串。
27python代码
运行成功后,Pycharm Console窗口将显示我们的输出结果。
页面布局介绍
文件导航区域能够 浏览/定位/ 打开 项目文件
文件编辑区域 能够 编辑 当前打开的文件
控制台区域 能够:
输出程序执行内容
跟踪调试代码的执行
四、Python
1.1 注释
1.1 注释介绍
在我们工作编码的过程中,如果一段代码的逻辑比较复杂,不是特别容易理解,可以适当的添加注释,以辅助自己
或者其他编码人员解读代码。
没注释的代码
有注释的代码
注意:注释是给程序员看的,为了让程序员方便阅读代码,解释器会忽略注释。使用自己熟悉的语言,适当的对代
码进行注释说明是一种良好的编码习惯。
1.2 注释的分类
在Python中支持单行注释和多行注释。
单行注释
以#开头,#右边的所有东西当做说明,而不是真正要执行的程序,起辅助说明作用。
多行注释
以’’’开始,并以’’’ 结束,我们称之为多行注释。
# #开头右边的都是注释,解析器会忽略注释
1
| print('hello world') #我的作用是在控制台输出hello world
|
‘’’
1 2 3 4 5 6 7 8 9 10
| _ooOoo_ o8888888o 88" . " (| ‐_‐ |) O\ = /O ____/`‐‐‐'\____ .' \\| |// `. / \\||| : |||// \ / _||||| ‐:‐ |||||‐ \ | | \\\ ‐ /// | |
|
2. 变量以及数据类型
2.1 变量的定义
思考下列代码有什么问题?
不使用变量打印九次 “今天天气真好”,如果需要变成打印 “今天天气不好” 需要修改九行代码
对于重复使用,并且经常需要修改的数据,可以定义为变量,来提高编程效率。
定义变量的语法为: 变量名 = 变量值。(这里的 = 作用是赋值。)
定义变量后可以使用变量名来访问变量值。
说明:
| _| ‘’\‐‐‐/‘’ | |
\ .‐__ ‐
___/‐. /
___. .' /‐‐.‐‐\
. . __
.”” ‘< `._<|>/_.’ >’””.
| | : ‐ \
.;\ _ /
;./ ‐
: | |
\ \ ‐. \_ __\ /__ _/ .‐
/ /
======‐.____
‐._/_.‐`___.‐’======
`=‐‐‐=’
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
佛祖保佑 永无BUG
佛曰:
写字楼里写字间,写字间里程序员;
程序人员写程序,又拿程序换酒钱。
酒醒只在网上坐,酒醉还来网下眠;
酒醉酒醒日复日,网上网下年复年。
但愿老死电脑间,不愿鞠躬老板前;
奔驰宝马贵者趣,公交自行程序员。
别人笑我忒疯癫,我笑自己命太贱;
不见满街漂亮妹,哪个归得程序员?
‘’’
1 2 3 4 5 6 7 8 9
| print("今天天气真好") print("今天天气真好") print("今天天气真好") print("今天天气真好") print("今天天气真好") print("今天天气真好") print("今天天气真好") print("今天天气真好") print("今天天气真好")
|
# 定义一个变量表示这个字符串。如果需要修改内容,只需要修改变量对应的值即可
1 2 3 4
| weather = "今天天气真好" print(weather) # 注意,变量名不需要使用引号包裹 print(weather) print(weather)
|
变量即是可以变化的量,可以随时进行修改。
程序就是用来处理数据的,而变量就是用来存储数据的。
2.2 变量的类型
程序中: 在 Python 里为了应对不同的业务需求,也把数据分为不同的类型。 如下图所示:
2.3 查看数据类型
在python中,只要定义了一个变量,而且它有数据,那么它的类型就已经确定了,不需要咱们开发者主动的
去说明它的类型,系统会自动辨别。也就是说在使用的时候 “变量没有类型,数据才有类型”。
比如下面的示例里,a 的类型可以根据数据来确认,但是我们没法预测变量 b 的类型。
如果临时想要查看一个变量存储的数据类型,可以使用 type(变量的名字),来查看变量存储的数据类型。
3. 标识符和关键字
计算机编程语言中,标识符是用户编程时使用的名字,用于给变量、常量、函数、语句块等命名,以建立起名称与
使用之间的关系。
1. 标识符由字母、下划线和数字组成,且数字不能开头。
2. 严格区分大小写。
3. 不能使用关键字。
思考:下面的标识符哪些是正确的,哪些不正确为什么
3.1 命名规范
标识符命名要做到顾名思义。
起一个有意义的名字,尽量做到看一眼就知道是什么意思(提高代码可 读性) 比如: 名字 就定义为 name ,
定义学生 用 student
遵守一定的命名规范。
驼峰命名法,又分为大驼峰命名法和小驼峰命名法。
1 2 3 4 5 6 7 8 9 10 11
| fromNo from# my_Boolean my‐Boolean Obj 2 ndObj myInt test Mike2jack My_tExt _test
|
1 2 3 4
| a = "zhangsan" name = "zhangsan" b = 23 age = 23
|
小驼峰式命名法(lower camel case): 第一个单词以小写字母开始;第二个单词的首字母大写,
例如:myName、aDog
大驼峰式命名法(upper camel case): 每一个单字的首字母都采用大写字母,例如:
FirstName、LastName.
还有一种命名法是用下划线“_”来连接所有的单词,比如send_buf.
Python的命令规则遵循PEP8标准
3.2 关键字
关键字的概念
一些具有特殊功能的标识符,这就是所谓的关键字。
关键字,已经被python官方使用了,所以不允许开发者自己定义和关键字相同名字的标识符。
关键字
关键字的学习以及使用,咱们会在后面的课程中依次一一进行学习。
4. 类型转换
1 2 3 4 5
| False None True and as assert break class continue def del elif else except finally for from global if import in is lambda nonlocal not or pass raise return try while with yield
|
函数 说明
int(x) 将x转换为一个整数
float(x) 将x转换为一个浮点数
str(x) 将对象 x 转换为字符串
bool(x) 将对象x转换成为布尔值
转换成为整数
转换成为浮点数
转换成为字符串
转换成为布尔值
1
| print(int("123")) # 123 将字符串转换成为整数
|
1
| print(int(123.78)) # 123 将浮点数转换成为整数
|
1 2
| print(int(True)) # 1 布尔值True转换成为整数是 1 print(int(False)) # 0 布尔值False转换成为整数是 0
|
# 以下两种情况将会转换失败
‘’’
1 2 3 4
| 123.456 和 12ab 字符串,都包含非法字符,不能被转换成为整数,会报错 print(int("123.456")) print(int("12ab")) '''
|
1 2 3
| f1 = float("12.34") print(f1) print(type(f1))
|
1 2 3
| f2 = float( 23 ) print(f2) print(type(f2))
|
1 2 3 4
| str1 = str( 45 ) str2 = str(34.56) str3 = str(True) print(type(str1),type(str2),type(str3))
|
运算符 描述 实例
+ 加 两个对象相加 a + b 输出结果 30
- 减 得到负数或是一个数减去另一个数 a - b 输出结果 -10
* 乘 两个数相乘或是返回一个被重复若干次的字符串 a * b 输出结果 200
/ 除 b / a 输出结果 2
// 取整除 返回商的整数部分 9//2 输出结果 4 , 9.0//2.0 输出结果 4.0
% 取余 返回除法的余数 b % a 输出结果 0
** 指数 a**b 为 10 的 20 次方
() 小括号 提高运算优先级,比如: (1+2) * 3
5. 运算符
5.1 算数运算符
下面以a=10 ,b=20为例进行计算
注意:混合运算时,优先级顺序为: ** 高于 * / % // 高于 + - ,为了避免歧义,建议使用 () 来处理运
算符优先级。 并且,不同类型的数字在进行混合运算时,整数将会转换成浮点数进行运算。
算数运算符在字符串里的使用
如果是两个字符串做加法运算,会直接把这两个字符串拼接成一个字符串。
1 2 3 4 5 6
| print(bool('')) print(bool("")) print(bool( 0 )) print(bool({})) print(bool([])) print(bool(()))
|
>>> 10 + 5.5 * 2
21.0
>>> ( 10 + 5.5) * 2
31.0
1 2
| In [3]: str1+str2 Out[3]: 'helloworld'
|
运算符 描述 实例
= 赋值运算符 把 = 号右边的结果 赋给 左边的变量,如 num = 1 + 2 * 3,结果num的值为 7
如果是数字和字符串做加法运算,会直接报错。
如果是数字和字符串做乘法运算,会将这个字符串重复多次。
5.2 赋值运算符
5.3 复合赋值运算符
1 2 3 4 5
| In [3]: a+str1 ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ TypeError Traceback (most recent call last) <ipython‐input‐3‐993727a2aa69> in <module> ‐‐‐‐> 1 a+str1
|
1
| TypeError: unsupported operand type(s) for +: 'int' and 'str'
|
1
| In [ 4 ]: str1 = 'hello'
|
1 2
| In [ 5 ]: str1* 10 Out[ 5 ]: 'hellohellohellohellohellohellohellohellohellohello'
|
# 单个变量赋值
# 同时为多个变量赋值(使用等号连接)
1 2 3 4 5 6
| >>> a = b = 4 >>> a 4 >>> b 4 >>>
|
# 多个变量赋值(使用逗号分隔)
1 2 3 4 5 6 7
| >>> num1, f1, str1 = 100 , 3.14, "hello" >>> num1 100 >>> f1 3.14 >>> str1 "hello"
|
运算符 描述 实例
+= 加法赋值运算符 c += a 等效于 c = c + a
-= 减法赋值运算符 c -= a 等效于 c = c - a
*= 乘法赋值运算符 c *= a 等效于 c = c * a
/= 除法赋值运算符 c /= a 等效于 c = c / a
//= 取整除赋值运算符 c //= a 等效于 c = c // a
%= 取模赋值运算符 c %= a 等效于 c = c % a
**= 幂赋值运算符 c **= a 等效于 c = c ** a
5.4 比较运算符
以下假设变量a为 10 ,变量b为 20 :
# 示例:+=
1 2 3 4
| >>> a = 100 >>> a += 1 >>> a 101
|
# 示例:*=
1 2 3 4
| >>> a = 100 >>> a *= 2 >>> a 200
|
# 示例:*=,运算时,符号右侧的表达式先计算出结果,再与左边变量的值运算
1 2 3 4
| >>> a = 100 >>> a *= 1 + 2 >>> a 300
|
运
算
符
描述 实例
== 等于:比较对象是否相等
(a == b) 返回
False
!= 不等于:比较两个对象是否不相等
(a != b) 返回
true
> 大于:返回x是否大于y
(a > b) 返回
False
>= 大于等于:返回x是否大于等于y
(a >= b) 返回
False
<
小于:返回x是否小于y。所有比较运算符返回 1 表示真,返回 0 表示假。这分别与特
殊的变量True和False等价
(a < b) 返回
true
<= 小于等于:返回x是否小于等于y
(a <= b) 返回
true
运
算
符
逻辑表
达式
描述 实例
and
x and
y
只要有一个运算数是False,结果就是False;
只有所有的运算数都为True时,结果才是True
做取值运算时,取第一个为False的值,如果所有的值
都为True,取最后一个值
True and True and False–>
结果为False
True and True and True–>
结果为True
or x or y
只要有一个运算数是True,结果就是True;
只有所有的运算数都为False时,结果才是False
做取值运算时,取第一个为True的值,如果所有的值都
为False,取最后一个值
False or False or True–>结
果为True
False or False or False–>结
果为False
not not x
布尔”非” - 如果 x 为 True,返回 False 。如果 x 为
False,它返回 True。
not True –> False
5.5 逻辑运算符
性能提升
面试题:一下代码的输出结果是什么,为什么会有这样的输出。
思考:
1. 逻辑运算的短路问题
2. 逻辑与运算和逻辑或运算取值时为什么是那种规则。
6. 输入输出
6.1 输出
普通输出
python中变量的输出
格式化输出
比如有以下代码:
想一想:
在输出年龄的时候,用了多次”我今年xx岁”,能否简化一下程序呢???
答:
字符串格式化
看如下代码:
在程序中,看到了%这样的操作符,这就是Python中格式化输出。
1 2
| a > 10 and print('hello world') a < 10 and print('hello world')
|
1 2
| a > 10 or print('你好世界') a < 10 or print('你好世界')
|
1 2 3
| pirnt("我今年 10 岁") pirnt("我今年 11 岁") pirnt("我今年 12 岁")
|
1 2
| age = 10 print("我今年%d岁" % age)
|
1 2
| age += 1 print("我今年%d岁" % age)
|
1 2
| age += 1 print("我今年%d岁" % age)
|
6.2 输入
看如下示例:
运行结果:
注意:
7. 流程控制语句
7.1 if判断语句
if语句是用来进行判断的,其使用格式如下:
demo1:
运行结果:
demo2:
1 2 3
| age = 18 name = "红浪漫晶哥" print("我的姓名是%s, 年龄是%d" % (name, age))
|
1 2
| password = input("请输入密码:") print('您刚刚输入的密码是:%s' % password)
|
1 2 3
| age = 30 if age >= 18 : print("我已经成年了")
|
我已经成年了
1 2 3
| age = 16 if age >= 18 : print("我已经成年了")
|
运行结果:
小总结:
以上 2 个demo仅仅是age变量的值不一样,导致结果却不同;能够看得出if判断语句的作用:就是当满足一定
条件时才会执行代码块语句,否则就不执行代码块语句。
注意:代码的缩进为一个tab键,或者 4 个空格
练一练
要求:从键盘获取自己的年龄,判断是否大于或者等于 18 岁,如果满足就输出“哥,已成年,网吧可以去了”
2. 使用if语句,来判断 age>=18是否成立
7.2 if else
想一想:在使用if的时候,它只能做到满足条件时要做的事情。那万一需要在不满足条件的时候,做某些事,
该怎么办呢?
答:使用 if-else
if-else的使用格式
demo1
结果 1 :大于等于 18 的情况
结果 2 :小于 18 的情况
练一练
要求:从键盘输入身高,如果身高没有超过150cm,则进动物园不用买票,否则需要买票。
7.3 elif
1 2 3 4
| if 条件: 满足条件时的操作 else: 不满足条件时的操作
|
1 2 3 4 5
| age = 18 if age >= 18 : print("我可以去红浪漫了") else: print("未成年,不允许去")
|
我可以去红浪漫了
未成年,不允许去
想一想:
如果有这样一种情况:当条件A满足时做事情 1 ;当条件A不满足、条件B满足时做事情 2 ;当条件B不满
足、条件C满足时做事情 3 ,那该怎么实现呢?
答:
elif
elif的功能
elif的使用格式如下:
说明:
当xxx1满足时,执行事情 1 ,然后整个if结束
当xxx1不满足时,那么判断xxx2,如果xxx2满足,则执行事情 2 ,然后整个if结束
当xxx1不满足时,xxx2也不满足,如果xxx3满足,则执行事情 3 ,然后整个if结束
demo:
7.4 for
在Python中 for循环可以遍历任何序列的项目,如一个列表或者一个字符串等。
for循环的格式
for循环的使用
遍历字符串:
1 2 3 4 5 6
| if xxx1: 事情 1 elif xxx2: 事情 2 elif xxx3: 事情 3
|
1 2 3 4 5 6 7 8 9 10
| if score>= 90 : print('本次考试,等级为A') elif score>= 80 : print('本次考试,等级为B') elif score>= 70 : print('本次考试,等级为C') elif score>= 60 : print('本次考试,等级为D') elif score< 60 : print('本次考试,等级为E')
|
1 2
| for 临时变量 in 列表或者字符串等可迭代对象: 循环满足条件时执行的代码
|
输出结果:
打印数字
输出结果:
0
1
2
3
4
练习
使用for循环,计算1~100的和
7.5 range
range 可以生成数字供 for 循环遍历,它可以传递三个参数,分别表示 起始、结束和步长。
8. 数据类型高级
8.1 字符串高级
字符串的常见操作包括:
获取长度:len len函数可以获取字符串的长度。
查找内容:find 查找指定内容在字符串中是否存在,如果存在就返回该内容在字符串中第一次
出现的开始位置索引值,如果不存在,则返回-1.
1 2
| for s in "hello": print(s)
|
1 2
| for i in range( 5 ): print(i)
|
1 2 3 4 5 6 7 8
| >>> range( 2 , 10 , 3 ) [ 2 , 5 , 8 ] >>> for x in range( 2 , 10 , 3 ): ... print(x) ... 2 5 8
|
判断:startswith,endswith 判断字符串是不是以谁谁谁开头/结尾
计算出现次数:count 返回 str在start和end之间 在 mystr里面出现的次数
替换内容:replace 替换字符串中指定的内容,如果指定次数count,则替换不会超过count次。
切割字符串:split 通过参数的内容切割字符串
修改大小写:upper,lower 将字符串中的大小写互换
空格处理:strip 去空格
字符串拼接:join 字符串拼接
8.2 列表高级
列表的增删改查
添加元素
添加元素有一下几个方法:
append 在末尾添加元素
insert 在指定位置插入元素
extend 合并两个列表
append
append会把新元素添加到列表末尾
insert
insert(index, object) 在指定位置index前插入元素object
extend
通过extend可以将另一个列表中的元素逐一添加到列表中
#定义变量A,默认有 3 个元素
1
| A = ['xiaoWang','xiaoZhang','xiaoHua']
|
1
| print("‐‐‐‐‐添加之前,列表A的数据‐‐‐‐‐A=%s" % A)
|
#提示、并添加元素
1 2
| temp = input('请输入要添加的学生姓名:') A.append(temp)
|
1
| print("‐‐‐‐‐添加之后,列表A的数据‐‐‐‐‐A=%s" % A)
|
1 2 3
| strs = ['a','b','m','s'] strs.insert( 3 ,'h') print(strs) # ['a', 'b', 'm', 'h', 's']
|
1 2 3 4 5
| a = ['a','b','c'] b = ['d','e','f'] a.extend(b) print(a) # ['a', 'b', 'c', 'd', 'e', 'f'] 将 b 添加到 a 里 print(b) # ['d','e','f'] b的内容不变
|
修改元素
我们是通过指定下标来访问列表元素,因此修改元素的时候,为指定的列表下标赋值即可。
查找元素
所谓的查找,就是看看指定的元素是否存在,主要包含一下几个方法:
in 和 not in
in, not in
python中查找的常用方法为:
in(存在),如果存在那么结果为true,否则为false
not in(不存在),如果不存在那么结果为true,否则false
说明:
in的方法只要会用了,那么not in也是同样的用法,只不过not in判断的是不存在
删除元素
类比现实生活中,如果某位同学调班了,那么就应该把这个条走后的学生的姓名删除掉;在开发中经常会用到删除
这种功能。
列表元素的常用删除方法有:
del:根据下标进行删除
pop:删除最后一个元素
remove:根据元素的值进行删除
del
#定义变量A,默认有 3 个元素
1
| A = ['xiaoWang','xiaoZhang','xiaoHua']
|
1
| print("‐‐‐‐‐修改之前,列表A的数据‐‐‐‐‐A=%s" % A)
|
#修改元素
1
| print("‐‐‐‐‐修改之后,列表A的数据‐‐‐‐‐A=%s" % A)
|
#待查找的列表
1
| nameList = ['xiaoWang','xiaoZhang','xiaoHua']
|
#获取用户要查找的名字
1
| findName = input('请输入要查找的姓名:')
|
#查找是否存在
1 2 3 4
| if findName in nameList: print('在列表中找到了相同的名字') else: print('没有找到')
|
pop
remove
8.3 元组高级
Python的元组与列表类似,不同之处在于元组的元素不能修改。元组使用小括号,列表使用方括号。
访问元组
修改元组
python中不允许修改元组的数据,包括不能删除其中的元素。
定义只有一个数据的元组
定义只有一个元素的元组,需要在唯一的元素后写一个逗号
1 2 3 4
| movieName = ['加勒比海盗','骇客帝国','第一滴血','指环王','霍比特人','速度与激情'] print('‐‐‐‐‐‐删除之前‐‐‐‐‐‐movieName=%s' % movieName) del movieName[ 2 ] print('‐‐‐‐‐‐删除之后‐‐‐‐‐‐movieName=%s' % movieName)
|
1 2 3 4
| movieName = ['加勒比海盗','骇客帝国','第一滴血','指环王','霍比特人','速度与激情'] print('‐‐‐‐‐‐删除之前‐‐‐‐‐‐movieName=%s' % movieName) movieName.pop() print('‐‐‐‐‐‐删除之后‐‐‐‐‐‐movieName=%s' % movieName)
|
1 2 3 4
| movieName = ['加勒比海盗','骇客帝国','第一滴血','指环王','霍比特人','速度与激情'] print('‐‐‐‐‐‐删除之前‐‐‐‐‐‐movieName=%s' % movieName) movieName.remove('指环王') print('‐‐‐‐‐‐删除之后‐‐‐‐‐‐movieName=%s' % movieName)
|
1 2 3
| >>> aTuple = ('et', 77 ,99.9) >>> aTuple ('et', 77 ,99.9)
|
8.4 切片
切片是指对操作的对象截取其中一部分的操作。字符串、列表、元组都支持切片操作。
切片的语法:[起始:结束:步长],也可以简化使用 [起始:结束]
注意:选取的区间从”起始”位开始,到”结束”位的前一位结束(不包含结束位本身),步长表示选取间隔。
8.5 字典高级
查看元素
除了使用key查找数据,还可以使用get来获取数据
修改元素
字典的每个元素中的数据是可以修改的,只要通过key找到,即可修改
1 2 3 4 5 6 7 8 9 10
| >>> a = ( 11 ) >>> a 11 >>> type(a) int >>> a = ( 11 ,) >>> a ( 11 ,) >>> type(a) tuple
|
# 索引是通过下标取某一个元素
# 切片是通过下标去某一段元素
1 2
| s = 'Hello World!' print(s)
|
1
| print(s[ 4 ]) # o 字符串里的第 4 个元素
|
1
| print(s[ 3 : 7 ]) # lo W 包含下标 3 ,不含下标 7
|
1
| print(s[ 1 :]) # ello World! 从下标为 1 开始,取出 后面所有的元素(没有结束位)
|
1
| print(s[: 4 ]) # Hell 从起始位置开始,取到 下标为 4 的前一个元素(不包括结束位本身)
|
1
| print(s[ 1 : 5 : 2 ]) # el 从下标为 1 开始,取到下标为 5 的前一个元素,步长为 2 (不包括结束位本身)
|
1
| info = {'name':'班长','age': 18 }
|
1 2
| print(info['age']) # 获取年龄
|
1 2
| print(info.get('sex')) # 获取不存在的key,获取到空的内容,不会出现异常 print(info.get('sex', '男')) # 获取不存在的key, 可以提供一个默认值。
|
demo:
结果:
1 2
| 修改之前的字典为 {'name': '班长', 'id': 100} 修改之后的字典为 {'name': '班长', 'id': 200}
|
添加元素
如果在使用 变量名[‘键’] = 数据 时,这个“键”在字典中,不存在,那么就会新增这个元素
demo:添加新的元素
结果:
1 2
| 添加之前的字典为:{'name': '班长'} 添加之后的字典为:{'name': '班长', 'id': 100}
|
删除元素
对字典进行删除操作,有一下几种:
del
clear()
demo:del删除指定的元素
结果
1
| info = {'name':'班长', 'id': 100 }
|
1
| print('修改之前的字典为 %s:' % info)
|
1
| info['id'] = 200 # 为已存在的键赋值就是修改
|
1
| print('修改之后的字典为 %s:' % info)
|
1
| print('添加之前的字典为:%s' % info)
|
1
| info['id'] = 100 # 为不存在的键赋值就是添加元素
|
1
| print('添加之后的字典为:%s' % info)
|
1
| info = {'name':'班长', 'id': 100 }
|
1
| del info['name'] # del 可以通过键删除字典里的指定元素
|
1 2
| 删除前,{'name': '班长', 'id': 100} 删除后,{'id': 100}
|
del删除整个字典
结果
1 2 3 4
| 删除前,{'name': 'monitor', 'id': 100} Traceback (most recent call last): File "<stdin>", line 1, in <module> NameError: name 'info' is not defined
|
clear清空整个字典
结果
字典的遍历
遍历字典的key(键)
1
| info = {'name':'monitor', 'id': 100 }
|
1
| info = {'name':'monitor', 'id': 100 }
|
1 2
| 清空前,{'name': 'monitor', 'id': 100 } 清空后,{}
|
遍历字典的value(值)
遍历字典的项(元素)
遍历字典的key-value(键值对)
9. 函数
思考:下列代码的问题
1 2
| print('欢迎马大哥光临红浪漫') print('男宾 2 位')
|
1 2
| print('欢迎马大哥光临红浪漫') print('男宾 2 位')
|
1 2
| print('欢迎马大哥光临红浪漫') print('男宾 2 位')
|
9.1 定义函数
定义函数的格式如下:
示例:
9.2 调用函数
定义了函数之后,就相当于有了一个具有某些功能的代码,想要让这些代码能够执行,需要调用它
调用函数很简单的,通过 函数名() 即可完成调用
函数定义好以后,函数体里的代码并不会执行,如果想要执行函数体里的内容,需要手动的调用函数。
每次调用函数时,函数都会从头开始执行,当这个函数中的代码执行完毕后,意味着调用结束了。
9.3 函数参数
思考一个问题,如下:
现在需要定义一个函数,这个函数能够完成 2 个数的加法运算,并且把结果打印出来,该怎样设计?下面的代
码可以吗?有什么缺陷吗?
为了让一个函数更通用,即想让它计算哪两个数的和,就让它计算哪两个数的和,在定义函数的时候可以让函数接
收数据,就解决了这个问题,这就是 函数的参数
定义、调用带有参数的函数
定义一个add2num(a, b)函数,来计算任意两个数字之和:
# 定义一个函数,能够完成打印信息的功能
1 2 3
| def f1(): print('欢迎马大哥光临红浪漫') print('男宾 2 位')
|
# 定义完函数后,函数是不会自动执行的,需要调用它才可以
1 2 3 4 5
| def add2num(): a = 11 b = 22 c = a+b print(c)
|
注意点:
在定义函数的时候,小括号里写等待赋值的变量名
在调用函数的时候,小括号里写真正要进行运算的数据
调用带有参数函数的运行过程:
调用函数时参数的顺序
定义时小括号中的参数,用来接收参数用的,称为 “形参”
调用时小括号中的参数,用来传递给函数用的,称为 “实参”
9.4 函数返回值
“返回值”介绍
现实生活中的场景:
1 2 3
| def add2num(a, b): c = a+b print c
|
1 2 3 4 5 6 7
| >>> def test(a,b): ... print(a,b) ... >>> test( 1 , 2 ) 1 2 >>> test(b= 1 ,a= 2 ) 2 1
|
我给女儿 10 块钱,让她给我买个冰淇淋。这个例子中, 10 块钱是我给女儿的,就相当于调用函数时传递到参
数,让女儿买冰淇淋这个事情最终的目标,我需要让她把冰淇淋带回来,此时冰淇淋就是返回值
综上所述:
所谓“返回值”,就是程序中函数完成一件事情后,最后给调用者的结果
带有返回值的函数
想要在函数中把结果返回给调用者,需要在函数中使用return
如下示例:
或者
保存函数的返回值
在本小节刚开始的时候,说过的“买冰淇淋”的例子中,最后女儿给你冰淇淋时,你一定是从女儿手中接过来 对么,
程序也是如此,如果一个函数返回了一个数据,那么想要用这个数据,那么就需要保存
保存函数的返回值示例如下:
结果:
9.5 局部变量
什么是局部变量
如下图所示:
1 2 3
| def add2num(a, b): c = a+b return c # return 后可以写变量名
|
1 2
| def add2num(a, b): return a+b
|
#定义函数
1 2
| def add2num(a, b): return a+b
|
#调用函数,顺便保存函数的返回值
1
| result = add2num( 100 , 98 )
|
198
9.6 全局变量
如果一个变量,既能在一个函数中使用,也能在其他的函数中使用,这样的变量就是全局变量
在函数外边定义的变量叫做全局变量
全局变量能够在所有的函数中进行访问
10. 文件
10.1 文件的打开与关闭
打开文件/创建文件
在python,使用open函数,可以打开一个已经存在的文件,或者创建一个新文件
open(文件路径,访问模式)
示例如下:
说明:
# 定义全局变量
# 调用函数
1
| f = open('test.txt', 'w')
|
访问
模式
说明
r 以只读方式打开文件。文件的指针将会放在文件的开头。如果文件不存在,则报错。这是默认模式。
w 打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
a
打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将
会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
r+ 打开一个文件用于读写。文件指针将会放在文件的开头。
w+ 打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
a+
打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模
式。如果该文件不存在,创建新文件用于读写。
rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。
wb
以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新
文件。
ab
以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是
说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。
wb+
以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文
件。
ab+
以二进制格式打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。如果该文
件不存在,创建新文件用于读写。
文件路径
绝对路径:指的是绝对位置,完整地描述了目标的所在地,所有目录层级关系是一目了然的。
例如:E:\python,从电脑的盘符开始,表示的就是一个绝对路径。
相对路径:是从当前文件所在的文件夹开始的路径。
test.txt,是在当前文件夹查找 test.txt 文件
./test.txt,也是在当前文件夹里查找test.txt文件, ./ 表示的是当前文件夹。
../test.txt,从当前文件夹的上一级文件夹里查找 test.txt 文件。 ../ 表示的是上一级文件夹
demo/test.txt,在当前文件夹里查找 demo这个文件夹,并在这个文件夹里查找 test.txt文件。
访问模式:
关闭文件
示例如下:
10.2 文件的读写
写数据(write)
使用write()可以完成向文件写入数据
demo: 新建一个文件 file_write_test.py,向其中写入如下代码:
运行之后会在file_write_test.py文件所在的路径中创建一个文件test.txt,并写入内容,运行效果显示如下:
注意:
- 如果文件不存在,那么创建;如果存在那么就先清空,然后写入数据
读数据(read)
使用read(num)可以从文件中读取数据,num表示要从文件中读取的数据的长度(单位是字节),如果没有传入
num,那么就表示读取文件中所有的数据
demo: 新建一个文件file_read_test.py,向其中写入如下代码:
1 2
| f = open('test.txt', 'w')
|
# 关闭这个文件
1 2 3
| f = open('test.txt', 'w') f.write('hello world, i am here!\n' * 5 ) f.close()
|
运行现象:
1 2 3
| hello ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ world, i am here!
|
注意:
如果用open打开文件时,如果使用的”r”,那么可以省略 open(‘test.txt’)
读数据(readline)
readline只用来读取一行数据。
读数据(readlines)
readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行为列表的
一个元素。
10.3 序列化和反序列化
1 2 3
| f = open('test.txt', 'r') content = f.read( 5 ) print(content)
|
1
| print("‐"* 30 ) # 分割线,用来测试
|
1 2
| content = f.read() # 从上次读取的位置继续读取剩下的所有的数据 print(content)
|
1
| f = open('test.txt', 'r')
|
1 2
| content = f.readline() print("1:%s" % content)
|
1 2
| content = f.readline() print("2:%s" % content)
|
1 2 3
| f = open('test.txt', 'r') content = f.readlines() print(type(content))
|
1 2
| for temp in content: print(temp)
|
通过文件操作,我们可以将字符串写入到一个本地文件。但是,如果是一个对象(例如列表、字典、元组等),就无
法直接写入到一个文件里,需要对这个对象进行序列化,然后才能写入到文件里。
设计一套协议,按照某种规则,把内存中的数据转换为字节序列,保存到文件,这就是序列化,反之,从文件的字
节序列恢复到内存中,就是反序列化。
对象—》字节序列 === 序列化
字节序列–》对象 ===反序列化
Python中提供了JSON这个模块用来实现数据的序列化和反序列化。
JSON模块
JSON(JavaScriptObjectNotation, JS对象简谱)是一种轻量级的数据交换标准。JSON的本质是字符串。
使用JSON实现序列化
JSON提供了dump和dumps方法,将一个对象进行序列化。
dumps方法的作用是把对象转换成为字符串,它本身不具备将数据写入到文件的功能。
dump方法可以在将对象转换成为字符串的同时,指定一个文件对象,把转换后的字符串写入到这个文件里。
使用JSON实现反序列化
使用loads和load方法,可以将一个JSON字符串反序列化成为一个Python对象。
loads方法需要一个字符串参数,用来将一个字符串加载成为Python对象。
1 2 3 4
| import json file = open('names.txt', 'w') names = ['zhangsan', 'lisi', 'wangwu', 'jerry', 'henry', 'merry', 'chris'] # file.write(names) 出错,不能直接将列表写入到文件里
|
1 2
| result = json.dumps(names)
|
# 可以将字符串写入到文件里
1 2
| file = open('names.txt', 'w') names = ['zhangsan', 'lisi', 'wangwu', 'jerry', 'henry', 'merry', 'chris']
|
1 2 3
| # dump方法可以接收一个文件参数,在将对象转换成为字符串的同时写入到文件里 json.dump(names, file) file.close()
|
load方法可以传入一个文件对象,用来将一个文件对象里的数据加载成为Python对象。
11. 异常
程序在运行过程中,由于我们的编码不规范,或者其他原因一些客观原因,导致我们的程序无法继续运行,此时,
程序就会出现异常。如果我们不对异常进行处理,程序可能会由于异常直接中断掉。为了保证程序的健壮性,我们
在程序设计里提出了异常处理这个概念。
11.1 读取文件异常
在读取一个文件时,如果这个文件不存在,则会报出FileNotFoundError错误。
11.2 try…except语句
1 2 3
| result = json.loads('["zhangsan", "lisi", "wangwu", "jerry", "henry", "merry", "chris"]') print(type(result))
|
# 以可读方式打开一个文件
1
| file = open('names.txt', 'r')
|
1 2
| result = json.load(file)
|
1 2
| print(result) file.close()
|
try…except语句可以对代码运行过程中可能出现的异常进行处理。 语法结构:
示例:
1 2 3 4
| try: 可能会出现异常的代码块 except 异常的类型: 出现异常以后的处理语句
|
1 2 3 4 5
| try: f = open('test.txt', 'r') print(f.read()) except FileNotFoundError: print('文件没有找到,请检查文件名称是否正确')
|