Python基础:04.函数与模块
函数
1. 函数的定义
函数代码块以 def
关键词开头,后接函数标识符名称和圆括号 ()。任何传入参数和自变量必须放在圆括号中间,圆括号之间可以用于定义参数。函数内容以冒号起始,并且缩进。return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回 None
函数的命名需要规范,且不能和python内置函数重名,具体的可以去查看内置函数部分内容。
1 |
|
5
函数的第一行语句可以选择性地使用文档字符串—用于存放函数说明。可以通过函数名.__doc__
的方法或者help()
函数来查看
1 |
|
返回两个参数的和
Help on function add in module main:add(a, b)
返回两个参数的和
None
2. 函数参数
在学习具体的函数参数前,需要学习参数的传递,实参形参等简单概念略过,主要是讨论不可变类型和可变类型传参的区别
2.1 参数传递
- 不可变类型:类似 c++ 的值传递,如 整数、字符串、元组。如fun(a),传递的只是a的值,没有影响a对象本身。比如在 fun(a)内部修改 a 的值,只是修改另一个复制的对象,不会影响 a 本身。
- 可变类型:类似 c++ 的引用传递,如 列表,字典。如 fun(la),则是将 la 真正的传过去,修改后fun外部的la也会受影响
1 |
|
2
[7, 8, 9, [1, 2, 3]]
2.2 必需参数(位置参数)
必需参数(位置参数)须以正确的顺序传入函数。调用时的数量必须和声明时的一样,不然会出现语法错误
1 |
|
5
2.3 关键字参数
使用关键字参数允许函数调用时参数的顺序与声明时不一致,因为 Python 解释器能够用参数名匹配参数值
1 |
|
1
2.4 默认参数
定义函数时可以给出参数的默认值。调用函数时,如果没有传递参数,则会使用默认参数。
需要注意的是:默认参数要放在位置参数后面,否则Python的解释器会报错。定义时尽量把变化大的参数放前面,变化小的参数作为默认参数放后面。
有多个默认参数时,调用的时候,可以按顺序提供默认参数或者用关键字参数
1 |
|
2
6
默认参数必须指向不变对象!
Python函数在定义的时候,默认参数的值就被计算出来了,因为默认参数也是一个变量,每次调用该函数,如果改变了默认参数的内容,则下次调用时,默认参数的内容就变了。
1 |
|
[‘END’]
[‘END’, ‘END’]
1 |
|
[‘END’]
[‘END’]
[1, 2, 3, ‘END’]
2.5 不定长参数
有时可能需要一个函数能处理比当初声明时更多的参数。这些参数叫做不定长参数。
2.5.1 参数带*
加了星号*
的参数会以元组(tuple)的形式导入,存放所有未命名的变量参数。
1 |
|
9
2
对已有的list或者tuple调用一个不定长参数的函数,总不能把列表中的值一个个输进去。此时可以在list或tuple前面加一个*
号,把list或tuple的元素变成不定长参数传进去,这种方法很常用!!
1 |
|
9
2.5.2 参数带**
参数带两个星号 ** 会以字典的形式导入,可以扩展函数的参数和功能,用户的输入自带参数和值
1 |
|
name: Bob age: 35 other: {‘city’: ‘Beijing’}
也可以先组装出一个dict,然后调用的时候,在dict加上两个*,把该dict参数传进去
1 |
|
name: Jack age: 24 other: {‘city’: ‘Beijing’, ‘job’: ‘Engineer’}
2.5.3 *作为参数单独出现
声明函数时,参数中星号*
可以单独出现,但*
后的参数在调用时必须用关键字传入。这种结构用于,限制调用者可以传入的参数名,同时可以提供默认值。如果缺少*
,Python解释器将无法识别位置参数和命名关键字参数
1 |
|
Jack 24 nanjing Engineer
Bob 35 Beijing Engineer
- 如果函数定义中已经有了一个可变参数,后面跟着的命名关键字参数就不再需要一个特殊分隔符*了
1 |
|
3. 函数返回值
return [表达式]
语句用于退出函数,选择性地向调用方返回一个表达式。不带参数值的return语句返回None
函数运行时碰到第一个return语句就立即返回,结束函数,通常用于选择性的执行某条return语句
1 |
|
[1, 2, 3]
(1, 2, 3, 4, 5, 6)
函数可以有多个返回值,中间用逗号隔开,其实是返回一个元组。
调用函数时可以将返回的值分别赋给多个变量或直接返回给一个变量(这一个变量会接收为元组形式)
1 |
|
5 -1
(5, -1)
也可以以列表形式返回多个值,用的较少
1 |
|
[5, -1] 5 -1
4. 函数的递归
一个函数在内部调用自身本身,这个函数就是递归函数
1 |
|
120
使用递归函数需要注意防止栈溢出。在计算机中,函数调用是通过栈(stack)这种数据结构实现的,每当进入一个函数调用,栈就会加一层栈帧,每当函数返回,栈就会减一层栈帧。由于栈的大小不是无限的,所以,递归调用的次数过多,会导致栈溢出
解决递归调用栈溢出的方法是通过尾递归优化,尾递归是指,在函数返回的时候,调用自身本身,并且,return语句不能包含其它表达式,只调用自身。这样,编译器或者解释器就可以把尾递归做优化,使递归本身无论调用多少次,都只占用一个栈帧,不会出现栈溢出的情况
遗憾的是,大多数编程语言没有针对尾递归做优化,Python解释器也没有做优化,所以,即使把上面的fact(n)函数改成尾递归方式,也会导致栈溢出。
1 |
|
120
1 |
|
120
5. 匿名函数
有些简单的函数不需要显式地定义,可以使用匿名函数,匿名函数不再使用 def 语句定义函数,不需要写出函数名(自身并没有一个显式的__name__
属性),因此不必担心函数名冲突
匿名函数语法为 lambda arg1,arg2,...,argn:一个表达式
- arg是函数的参数,可以有多个。可以设置默认值参数,调用时可以使用关键字参数
- 匿名函数只能有一个表达式,所以仅仅能在lambda表达式中封装有限的逻辑进去。匿名函数不用写return,返回值就是该表达式的结果
lambda 函数拥有自己的命名空间,且不能访问自己参数列表之外或全局命名空间里的参数
匿名函数也是一个函数对象,也可以把匿名函数赋值给一个变量,再利用变量来调用该函数
匿名函数优点是调用小函数时不占用栈内存从而增加运行效率
1 |
|
30
使用关键字传参也可以
1 |
|
13
1 |
|
[1, 4, 9, 16, 25, 36, 49, 64, 81]
1 |
|
[1, 3, 5, 7, 9, 11, 13, 15, 17, 19]
模块
模块是一个包含所有你定义的函数和变量的文件,其后缀名是.py。模块可以被别的程序引入,以使用该模块中的函数等功能。
模块名要遵循Python变量命名规范,不要使用中文、特殊字符
先查看系统是否已存在该模块,检查方法是在Python交互环境执行import abc,若成功则说明系统存在此模块
1. import语句
import moudle_name
:导入指定的py文件,此时这个py文件被认为是一个模块,当前脚本文件可以调用模块中定义好的参数和函数import module_name as newname
:此语法可以用来简化模块名称,方便随时调用from modname import name
: 从模块中导入一个指定的部分到当前命名空间中,而不是导入整个模块from modname import *
: 此语法把一个模块的所有内容全都导入到当前的命名空间,但是其会被认为是一种“拙劣实践”
一个模块只会被导入一次,不管执行了多少次import。这样可以防止导入模块被一遍又一遍地执行,在notebook中体现为第一次导入时会执行一下文件中的语句,后面再导入则不会
在较大的模块中有很多参数与函数,为了不与当前文件中变量名混淆,最好在调用时使用modname.name的结构
1 |
|
[0 1 2 3 4 5 6 7 8 9]
2. 模块的搜索路径
当解释器遇到 import 语句,如果模块在当前的搜索路径就会被导入。 搜索路径是一个解释器会先进行搜索的所有目录的列表,是由一系列目录名组成的,Python解释器就依次从这些目录中去寻找所引入的模块
搜索路径是在Python编译或安装的时候确定的,安装新的库应该也会修改。搜索路径被存储在sys模块中的path变量
sys.path 输出是一个列表,其中第一项是空串’’,代表当前目录,即我们执行python解释器的目录,对于脚本的话就是运行的脚本所在的目录
1 |
|
[‘’,
‘D:\software\Anaconda3\python36.zip’,
‘D:\software\Anaconda3\DLLs’,
‘D:\software\Anaconda3\lib’,
‘D:\software\Anaconda3’,
‘D:\software\Anaconda3\lib\site-packages’,
‘D:\software\Anaconda3\lib\site-packages\win32’,
‘D:\software\Anaconda3\lib\site-packages\win32\lib’,
‘D:\software\Anaconda3\lib\site-packages\Pythonwin’,
‘D:\software\Anaconda3\lib\site-packages\IPython\extensions’,
‘C:\Users\wanyu\.ipython’]
3. 模块里的主函数
每个模块里都可以有主函数,但导入模块时,并不想执行被导入模块的主函数,因此用__main__
来标识
- 当**.py**文件被直接运行时,
if __name__ ==’__main__'
之下的代码块将被运行; - 当.py文件以模块形式被导入时,
if __name__ == '__main__'
之下的代码块不被运行
1 |
|
这和Java里的main逻辑是一样的,导入其他类的时候不会执行其他类的main
4. 作用域
在模块中定义的函数与变量一般分为外部不需要的和需要的,外部需要的定义为public,正常定义即可,外部不需要的定义成private,即在变量名前加_
或__
5. 包
包是一种管理 Python 模块命名空间的形式,是模块的上级目录
包使得采用”点模块名称”结构不用担心不同模块之间的全局变量相互影响。采用点模块名称这种形式也不用担心不同库之间的模块重名的情况
目录只有包含一个叫做 __init__.py
的文件才会被认作是一个包
__init__.py
可以是空文件,也可以有Python代码,因为其本身就是一个模块
一般推荐使用from Package import specific_submodule
语句来导入包中的模块
6. 模块通用函数
- dir()函数
内置的函数 dir() 可以找到模块内定义的所有名称。以一个字符串列表的形式返回
如果没有给定参数,那么 dir() 函数会罗列出当前定义的所有名称