python文件对象方法,本节中的示例都默认文件对象 f
已经创建。
要读取文件内容,需要调用 f.read(size)
,该方法读取若干数量的数据并以字符串形式返回其内容,size 是可选的数值,指定字符串长度。如果没有指定 size 或者指定为负数,就会读取并返回整个文件。当文件大小为当前机器内存两倍时,就会产生问题。反之,会尽可能按比较大的 size 读取和返回数据。如果到了文件末尾,f.read()
会返回一个空字符串( ”“
):
>>> f.read() 'This is the entire file.\n' >>> f.read() ''
f.readline()
从文件中读取单独一行,字符串结尾会自动加上一个换行符( \n
),只有当文件最后一行没有以换行符结尾时,这一操作才会被忽略。这样返回值就不会有混淆,如果如果 f.readline()
返回一个空字符串,那就表示到达了文件末尾,如果是一个空行,就会描述为 '\n'
,一个只包含换行符的字符串:
>>> f.readline() 'This is the first line of the file.\n' >>> f.readline() 'Second line of the file\n' >>> f.readline() ''
f.readlines()
返回一个列表,其中包含了文件中所有的数据行。如果给定了 sizehint 参数,就会读入多于一行的比特数,从中返回多行文本。这个功能通常用于高效读取大型行文件,避免了将整个文件读入内存。这种操作只返回完整的行。
>>> f.readlines() ['This is the first line of the file.\n', 'Second line of the file\n']
一种替代的方法是通过遍历文件对象来读取文件行。这是一种内存高效、快速,并且代码简洁的方式:
>>> for line in f: ... print(line, end='') ... This is the first line of the file. Second line of the file
虽然这种替代方法更简单,但并不具备细节控制能力。因为这两种方法处理行缓存的方式不同,千万不能搞混。
f.write(string)
方法将 string 的内容写入文件,并返回写入字符的长度:
>>> f.write('This is a test\n') 15
想要写入其他非字符串内容,首先要将它转换为字符串:
>>> value = ('the answer', 42) >>> s = str(value) >>> f.write(s) 18
f.tell()
返回一个整数,代表文件对象在文件中的指针位置,该数值计量了自文件开头到指针处的比特数。需要改变文件对象指针话话,使用 f.seek(offset,from_what)
。指针在该操作中从指定的引用位置移动 offset 比特,引用位置由 from_what 参数指定。 from_what 值为 0 表示自文件起始处开始,1 表示自当前文件指针位置开始,2 表示自文件末尾开始。from_what 可以忽略,其默认值为零,此时从文件头开始:
>>> f = open('workfile', 'r+') >>> f.write('0123456789abcdef') >>> f.seek(5) # Go to the 6th byte in the file >>> f.read(1) '5' >>> f.seek(-3, 2) # Go to the 3rd byte before the end >>> f.read(1) 'd'
在文本文件中(那些没有使用 b
模式选项打开的文件),只允许从文件头开始计算相对位置(使用 seek(0, 2)
从文件尾计算时就会引发异常)。
当你使用完一个文件时,调用 f.close()
方法就可以关闭它并释放其占用的所有系统资源。在调用 f.close()
方法后,试图再次使用文件对象将会自动失败:
>>> f.close() >>> f.read() Traceback (most recent call last): File "<stdin>", line 1, in ? ValueError: I/O operation on closed file
用关键字 with 处理文件对象是个好习惯。它的先进之处在于文件用完后会自动关闭,就算发生异常也没关系。它是 try-finally 块的简写:
>>> with open('/tmp/workfile', 'r') as f: ... read_data = f.read() >>> f.closed True 文件对象还有一些不太常用的附加方法,比如 isatty() 和 truncate() 在库参考手册中有文件对象的完整指南。