文件基本操作:
- 创建文件: 在Python中利用
open(file_name,code)
方法来创建(打开)文件 (如果该文件已存在就直接打开,如果该文件不存在,就创建新文件)。语法格式如下:open(file_name,code)
- 参数说明:
- name:创建文件的名称;
- code:创建文件的模式。
code | 含义 |
---|---|
‘w’ | 打开一个文件,只写 |
‘wb’ | 以二进制格式打开一个文件,只写 |
‘w+’ | 打开一个文件,读写 |
‘wb+‘ | 以二进制格式打开一个文件,读写 |
‘r’ | 以只读的方式打开文件。文件指针位于文件开头 |
‘r+’ | 打开一个文件用于读写。文件指针位于文件开头 |
‘rb’ | 以二进制格式打开一个文件进行读写。文件指针位于文件开头,一般用于非文本文件(如,图片) |
‘a’ | 打开一个文件用于追加。若该文件已存在,则文件指针位于文件末尾,新的内容将被被写入到原有内容之后;若该文件不存在,则创建新文件进行写入。 |
‘ab’ | 以二进制格式打开一个文件,用于追加。若该文件已存在,则文件指针位于文件末尾,新的内容将被被写入到原有内容之后;若该文件不存在,则创建新文件进行写入。 |
‘a+’ | 打开一个文件用于读写.文件指针位于文件末尾 |
‘ab+’ | 以二进制格式打开一个文件用于读写。文件指针位于文件末尾 |
数据的读取与写入方式: 在文本模式下,文件中的内容被视为字符串 (在 Python 3 中为 Unicode 字符串),并且会自动处理平台特定的行结束符。
- 在 Windows 上,行结束符为
\r\n
,在Unix/Linux
上为\n
。 - 当你从文件读取或写入文本时,Python 会自动处理这些行结束符。但是,在二进制模式下,数据则被视为原始字节流,不会对行结束符做任何处理。
编码问题: 在文本模式下,可以通过 encoding
参数指定一个字符编码方式,比如 UTF-8,ASCII
等。
- 当你从文件读取或写入文本时,Python 会自动根据指定的编码方式对文本进行编码或解码。
- 但是,在二进制模式下,由于数据被视为原始字节流,不涉及任何编码和解码的操作,所以不需要(也不能)指定字符编码方式。
文件类型: 有些文件(比如图片,音频,视频等)是以二进制格式存储的,这些文件必须以二进制模式打开。
- 如果尝试以文本模式打开这些文件,可能会导致数据的损坏。
- 因此,在处理文件时,应根据文件的类型和需要处理的数据类型选择适当的文件打开模式。
- 如果你需要处理的是文本数据,那么通常应使用文本模式。
- 如果你需要处理的是二进制数据(比如图片或音频文件),或者需要进行低级的文件操作(比如读写固定数量的字节),那么应使用二进制模式。
写入文件内容:
文件创建成功后,就利用write(string)
可以向文件中写入内容。语法格式如下: write(string)
参数及注意事项说明: string:要写入文件中的字符串。但需要注意的是,
- Python字符串可以是二进制字符串。特别是当,文件以二进制模式创建时,string要利用 encode()转换为bytes形式,否则会报错
- 注意事项: write()方法的返回值为写入的字符长度;
- write()方法不会在字符串的末尾添加换行符;
- 在文件关闭或缓冲区刷新前,字符串内容还存储在缓冲区中,在文件中是看不到写入的内容的。利用close()方法来关闭文件。
在python,使用open函数,可以打开一个已经存在的文件,或者创建一个新文件 open(文件名,访问模式)
访问模式 | 说明 |
---|---|
r | 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 |
w | 打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。 |
a | 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
rb | 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。 |
wb | 以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。 |
ab | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
r+ | 打开一个文件用于读写。文件指针将会放在文件的开头。 |
w+ | 打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。 |
a+ | 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。 |
rb+ | 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。 |
wb+ | 以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。 |
ab+ | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。 |
关闭文件
close( )
# 新建一个文件,文件名为:
test.txt f = open('test.txt', 'w') # 关闭这个文件
f.close()
文件的读写
- 写数据(write) 使用write()可以完成向文件写入数据
f = open('test.txt', 'w') f.write('hello world, i am here!') f.close()
注意:如果文件不存在那么创建,如果存在那么就先清空,然后写入数据
读数据(read)
使用read(num)可以从文件中读取数据,num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据
f = open('test.txt', 'r')
content = f.read(1024)
print(content)
print("-"*30)
content = f.read()
print(content)
f.close()
注意:如果open是打开一个文件,那么可以不用谢打开的模式,即只写 open('test.txt'),如果使用读了多次,那么后面读取的数据是从上次读完后的位置开始的
读数据(readlines)
就像read没有参数时一样,readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素
#coding=utf-8
f = open('test.txt', 'r')
content = f.readlines()
print(type(content))
i=1
for temp in content:
print("%d:%s"%(i, temp))
i+=1
f.close()
读数据(readline)
#coding=utf-8
f = open('test.txt', 'r')
content = f.readline()
print("1:%s"%content)
content = f.readline()
print("2:%s"%content)
f.close()
文件的定位读写
获取当前读写的位置tell
在读写文件的过程中,如果想知道当前的位置,可以使用tell()来获取
# 打开一个已经存在的文件
f = open("test.txt", "r")
str = f.read(3)
print"读取的数据是 : ", str
# 查找当前位置
position = f.tell()
print"当前文件位置 : ", position
str = f.read(3)
print"读取的数据是 : ", str
# 查找当前位置
position = f.tell()
print"当前文件位置 : ", position
f.close()
定位到某个位置
如果在读写文件的过程中,需要从另外一个位置进行操作的话,可以使用seek()
- seek(offset, from)有2个参数
- offset:偏移量
- from:方向
- 0:表示文件开头
- 1:表示当前位置
- 2:表示文件末尾
- demo:把位置设置为:从文件开头,偏移5个字节
# 打开一个已经存在的文件
f = open("test.txt", "r")
str = f.read(30)
print"读取的数据是 : ", str
# 查找当前位置
position = f.tell()
print"当前文件位置 : ", position
# 重新设置位置
f.seek(5,0)
# 查找当前位置
position = f.tell()
print"当前文件位置 : ", position
f.close()
demo:把位置设置为:离文件末尾,3字节处
# 打开一个已经存在的文件
f = open("test.txt", "r")
# 查找当前位置
position = f.tell()
print"当前文件位置 : ", position
# 重新设置位置
f.seek(-3,2)
# 读取到的数据为:文件最后3个字节数据
str = f.read()
print"读取的数据是 : ",
str f.close()
文件的相关操作
- 有些时候,需要对文件进行重命名、删除等操作,python的os模块中都有这么功能
import os
python编程时,经常和文件、目录打交道,这是就离不了os模块。os模块包含普遍的操作系统功能,与具体的平台无关。以下列举常用的命令
- os.name()——判断现在正在实用的平台,Windows 返回 ‘nt'; Linux 返回’posix'
- rename(需要修改的文件名, 新的文件名) 也可以做剪切。
- os.getcwd()——得到当前工作的目录。
- os.listdir()——指定所有目录下所有的文件和目录名。以列表的形式全部列举出来,其中没有区分目录和文件。
- os.remove()——删除指定文件
- os.rmdir()——删除指定目录 :该目录不能为空
- os.mkdir()——创建目录
- 注意:这样只能建立一层,要想递归建立可用:os.makedirs(x/y/z)
- os.path.isfile()——判断指定对象是否为文件。是返回True,否则False
- os.path.isdir()——判断指定对象是否为目录。是True,否则False。
- os.path.exists()——检验指定的对象是否存在。是True,否则False.
- os.path.split()——返回路径的目录和文件名。
此处只是把前后两部分分开而已。就是找最后一个'/'。看例子:
- os.getcwd()——获得当前工作的目录
(get current work dir)
- os.system()——执行shell命令。
注意:此处运行shell命令时,如果要调用python之前的变量,可以用如下方式: var=123
os.environ['var']=str(var) //注意此处[]内得是 “字符串”
os.system('echo $var')
os.chdir()——改变目录到指定目录
os.path.getsize()——获得文件的大小,如果为目录,返回0
os.path.abspath()——获得绝对路径。
os.path.join(path, name)——连接目录和文件名。
os.path.basename(path)——返回文件名
os.path.dirname(path)——返回文件所在目录
文件夹的基本操作
- 文件夹的创建:
掌握一个方法:os.mkdir (path)
。 在Python中常用该方法来创建文件夹。
os.mkdir (path)
参数说明: path是创建文件夹的路径。该方法没有返回值
- 绝对路径: 从磁盘的根目录开始定位,直到对应的位置为止。
- 相对路径: 从当前所在路径开始定位,直到对应的位置为止。用 “.” 表示当前目录;用“. .”表示上一级目录
import os
#------在相对路径下创建文件夹----------------
#在当前目录下创建一个文件夹
os.mkdir("mydir1")
#在当前目录的mydir1文件夹中创建一个子文件夹
os.mkdir("./mydir1/sub_mydir1")
#在当目录的上一级目录下创建一个文件夹
os.mkdir("../up_mydir1")
#-------在绝对路径下创建文件夹---------------
#在C盘根目录下创建一个文件夹
os.mkdir("C:/mydir")
#在C盘的mydir文件夹中创建一个子文件夹
os.mkdir("C:/mydir/sub_mydir")
print("创建成功!")
判断文件夹是否存在
掌握一个方法:os.path.exists(path) 在Python中,利用该方法来判断文件夹的路径。该方法返回值为Trueor False。
import os
if os.path.exists("mydir1"):
print("该文件夹已存在!")
else:
print("该文件夹不存在,可以新建。")
文件夹重命名
os.rename(src,dst)
在Python中,利用该方法对文件夹进行重命名。 参数说明: src:文件夹原名; dst:文件夹新名;
import os
if os.path.exists("mydir1"):
print("该文件夹存在,可以重命名。")
if os.path.exists("new_mydir1")
print("sorry,new_mydir 文件夹已存在")
else:
print("new_mydir1文件夹不存在可以重命名。")
os.rename("mydir1","new_mydir1")
print("重命名成功。")
else:
print("该文件夹不存在,无法进行重命名操作!")
文件夹的删除
os.rmdir(path)
在Python中,利用该方法来删除文件夹。path为该文件夹的路径,该方法没有返回值.
- 在进行删除操作前,应先判断,要删除的文件夹是否已经存在(即删除操作有无操作对象)
os.rmdir(path)
方法只能删除空的文件夹,即文件夹中不能有文件夹或文件。否则操作无法执行。- 可以利用
os.listdir(path)
方法来查看文件夹中的文件夹或文件。该方法返回一个列表,其中包含由路径指定的目录中条目的名称。
import os
if os.path.exists("C:/mydir"):
print("该文件夹存在,可以删除。")
if len(os.listdir("C:/mydir/"))==0:
os.rmdir("C:/mydir/")
print("删除成功")
else:
print("删除操作无效,mydir 非空。")
else:
print("该文件夹不存在,无法删除!")
与文件夹和文件有关的其他操作
- 获取和修改当前文件夹的位置 在Python中,利用
os.getcwd()
方法可以获取当前文件夹的位置,注意该方法没有参数。 使用os.chdir(path)
可以修改当前文件夹的位置。
连接目录和文件名
Python中,利用os.path.join(dir, filename)
方法可以连接目录和文件名
参数说明: dir:文件的目录 filename:目录中的文件名
import os
str1 = os.getcwd()
list_ = []
print("显示当前文件夹中包含的所有文件绝对路径")
for file in os.listdir(str1):
filepath = os.path.join(str,file)
list1.append(filepath)
print(list1)
文件的复制与删除
- 在Python中,利用
shutil.copy(oldfile,newfile)
方法可以复制文件,其中,oldfile为原来的文件名,newfile副本的文件名。 - 删除文件可以使用 os.remove(file),其中参数file为要删除的文件名
import os
import shutil
#复制文件
str = open("2.txt","w+")
if os.path.exists("2.txt"):
shutil.copy("2.txt","new_2.txt")
str_copy = open("new_2.txt","r")
print(str_copy)
#删除文件
if os.path.exists("new_1.txt"):
os.remove("new_1.txt")
判断文件/文件夹
import os
path = '/path/to/file_or_directory'
if os.path.isfile(path):
print(f'{path} 是一个文件')
elif os.path.isdir(path):
print(f'{path} 是一个文件夹')
else:
print(f'{path} 不存在或不是文件或文件夹')