在 Python 开发中,基础模块(内置模块)是标准库的核心组成部分,直接内置于 Python 解释器中,无需额外安装即可使用。
它们为开发者提供了一系列通用的、跨平台的功能,覆盖了从系统交互到数据处理的广泛需求。以下是常用的18个模块,建议收藏:
1. os(操作系统交互)
- 用途:操作系统交互(文件/目录管理、环境变量等)。
- 常用函数:os.listdir(), os.mkdir(), os.path.join().
import os
# 列出当前目录下的文件和文件夹
print(os.listdir())
# 创建新目录
os.mkdir("new_folder")
# 拼接路径(跨平台兼容)
path = os.path.join("folder", "subfolder", "file.txt")
2. sys(系统参数)
- 用途:访问系统参数(命令行参数、Python解释器等)。
- 常用:sys.argv, sys.exit(), sys.path.
import sys
# 获取命令行参数(例如:python script.py arg1 arg2)
print(sys.argv) # 输出:['script.py', 'arg1', 'arg2']
# 退出程序并返回状态码
sys.exit(0) # 0 表示正常退出
3. datetime(日期时间)
- 用途:日期和时间处理。
- 常用类:datetime.datetime, datetime.timedelta.
from datetime import datetime, timedelta
# 当前时间
now = datetime.now()
# 格式化输出:2025-04-17 19:30:00
print(now.strftime("%Y-%m-%d %H:%M:%S"))
# 时间加减(增加1天)
tomorrow = now + timedelta(days=1)
4. time(时间操作)
- 用途:时间相关操作(计时、休眠等)。
- 常用:time.sleep(), time.time().
import time
# 计时开始
start = time.time()
# 休眠2秒
time.sleep(2)
# 计算耗时 输出:耗时:2.00秒
print(f"耗时:{time.time() - start:.2f}秒")
5. math(数学运算)
- 用途:数学运算(三角函数、对数等)。
- 常用函数:math.sqrt(), math.sin(), math.pi.
import math
# 平方根
print(math.sqrt(16)) # 4.0
# 圆周率
print(math.pi) # 3.141592653589793
6. random(随机数)
- 用途:生成随机数和随机操作。
- 常用:random.randint(), random.choice().
import random
# 生成1到10的随机整数
print(random.randint(1, 10))
# 从列表中随机选择一个元素
colors = ["red", "green", "blue"]
print(random.choice(colors))
7. json(JSON处理)
- 用途:JSON 数据编码与解析。
- 常用函数:json.dumps(), json.loads().
import json
# 将字典转换为JSON字符串
data = {"name": "Alice", "age": 30}
json_str = json.dumps(data)
print(json_str) # {"name": "Alice", "age": 30}
# 解析JSON字符串
parsed_data = json.loads(json_str)
print(parsed_data["name"]) # Alice
8. re(正则表达式)
- 用途:正则表达式匹配。
- 常用:re.search(), re.findall(), re.sub().
import re
text = "电话:123-456-7890"
# 查找所有数字
numbers = re.findall(r'\d+', text)
print(numbers) # ['123', '456', '7890']
# 替换字符
new_text = re.sub(r'-', '', text)
print(new_text) # 电话:1234567890
9. collections(高级数据结构)
- 用途:高级数据结构(命名元组、默认字典等)。
- 常用类:collections.defaultdict, collections.Counter.
from collections import defaultdict, Counter
# 默认字典(自动初始化键)
dd = defaultdict(int)
dd["apple"] += 1
print(dd["apple"]) # 1
# 统计元素出现次数
words = ["apple", "banana", "apple"]
counter = Counter(words)
print(counter) # Counter({'apple': 2, 'banana': 1})
10. argparse(命令行解析)
- 用途:命令行参数解析。
- 核心类:argparse.ArgumentParser.
import argparse
# 创建解析器
parser = argparse.ArgumentParser(description="示例程序")
parser.add_argument("--input", help="输入文件路径")
parser.add_argument("--verbose", action="store_true", help="详细模式")
# 解析参数
args = parser.parse_args()
if args.verbose:
print("详细模式已开启")
11. logging(日志记录)
- 用途:日志记录(调试、错误追踪等)。
- 常用函数:logging.basicConfig(), logging.getLogger().
import logging
# 配置日志格式和级别
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(message)s')
# 记录日志
logging.info("程序启动")
logging.error("发生错误!")
12. subprocess(执行外部命令)
- 用途:执行外部命令(启动进程、管道交互)。
- 常用函数:subprocess.run().
import subprocess
# 执行系统命令(例如:列出文件)
result = subprocess.run(["ls", "-l"], capture_output=True, text=True)
print(result.stdout)
13. socket(网络通信)
- 用途:网络通信(TCP/UDP 编程)。
- 核心类:socket.socket.
import socket
# 创建TCP客户端
client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
client.connect(("www.httpbin.org", 80))
client.send(b"GET /get HTTP/1.1\r\nHost: httpbin.org\r\n\r\n")
response = client.recv(4096)
print(response.decode())
client.close()
14. urllib(URL请求)
- 用途:处理 URL 请求(HTTP/HTTPS 客户端)。
- 子模块:urllib.request, urllib.parse.
from urllib.request import urlopen
from urllib.parse import urlencode
# 发送HTTP GET请求
response = urlopen("https://www.httpbin.org/get")
print(response.read().decode()[:100]) # 输出前100个字符
# 编码URL参数
params = urlencode({"q": "python", "page": 2})
print(params) # q=python&page=2
15. csv(CSV文件读写)
- 用途:读写 CSV 文件。
- 常用类:csv.reader, csv.writer.
import csv
# 写入CSV文件
with open("data.csv", "w", newline='') as f:
writer = csv.writer(f)
writer.writerow(["Name", "Age"])
writer.writerow(["Alice", 30])
# 读取CSV文件
with open("data.csv", "r") as f:
reader = csv.reader(f)
for row in reader:
print(row) # ['Name', 'Age'], ['Alice', '30']
16. pickle(对象序列化)
- 用途:Python 对象序列化与反序列化。
- 常用函数:pickle.dump(), pickle.load().
import pickle
# 序列化对象到文件
data = {"a": 1, "b": 2}
with open("data.pkl", "wb") as f:
pickle.dump(data, f)
# 反序列化
with open("data.pkl", "rb") as f:
loaded_data = pickle.load(f)
print(loaded_data) # {'a': 1, 'b': 2}
17. sqlite3(SQLite数据库)
- 用途:操作 SQLite 数据库。
- 核心类:sqlite3.Connection, sqlite3.Cursor.
import sqlite3
# 连接数据库并创建表
conn = sqlite3.connect("test.db")
cursor = conn.cursor()
sql = "CREATE TABLE IF NOT EXISTS users (id INTEGER PRIMARY KEY, name TEXT)"
cursor.execute(sql)
# 插入数据
cursor.execute("INSERT INTO users (name) VALUES (?)", ("Alice",))
conn.commit()
# 查询数据
cursor.execute("SELECT * FROM users")
print(cursor.fetchall()) # [(1, 'Alice')]
conn.close()
18. hashlib(哈希算法)
- 用途:哈希算法(MD5、SHA256 等)。
- 常用函数:hashlib.md5(), hashlib.sha256().
import hashlib
# 计算字符串的MD5哈希值
text = "Hello, World!"
md5 = hashlib.md5(text.encode()).hexdigest()
print(md5) # 65a8e27d8879283831b664bd8b7f0ad4
# 计算文件的SHA256
with open("file.txt", "rb") as f:
sha256 = hashlib.sha256(f.read()).hexdigest()
print(sha256)
使用场景示例
- 数据处理:json, csv, pickle, collections.
- 系统脚本:os, sys, argparse, subprocess.
- 网络编程:socket, urllib.
- 工具开发:logging, datetime, random.
总结
Python 基础模块是开发者的“瑞士军刀”,覆盖了日常开发中的高频需求。
- 快速解决 80% 的常见问题(如文件操作、数据处理)。
- 写出更简洁、高效、可维护的代码。
- 为学习更复杂的框架和库(如 Django、NumPy)打下坚实基础。