Python SQLAlchemy入门教程

2019 年 11 月 10 日
筆記

本文将以Mysql举例，介绍sqlalchemy的基本用法。其中，Python版本为2.7，sqlalchemy版本为1.1.6。

一. 介绍

SQLAlchemy是Python中最有名的ORM工具。

关于ORM：

全称Object Relational Mapping（对象关系映射）。

特点是操纵Python对象而不是SQL查询，也就是在代码层面考虑的是对象，而不是SQL，体现的是一种程序化思维，这样使得Python程序更加简洁易读。

具体的实现方式是将数据库表转换为Python类，其中数据列作为属性，数据库操作作为方法。

优点：

简洁易读：将数据表抽象为对象（数据模型），更直观易读
可移植：封装了多种数据库引擎，面对多个数据库，操作基本一致，代码易维护
更安全：有效避免SQL注入

为什么要用sqlalchemy?

虽然性能稍稍不及原生SQL，但是操作数据库真的很方便！

二. 使用

概念和数据类型

概念

概念	对应数据库	说明
Engine	连接	驱动引擎
Session	连接池，事务	由此开始查询
Model	表	类定义
Column	列
Query	若干行	可以链式添加多个条件

常见数据类型

数据类型	数据库数据类型	python数据类型	说明
Integer	int	int	整形，32位
String	varchar	string	字符串
Text	text	string	长字符串
Float	float	float	浮点型
Boolean	tinyint	bool	True / False
Date	date	datetime.date	存储时间年月日
DateTime	datetime	datetime.datetime	存储年月日时分秒毫秒等
Time	time	datetime.datetime	存储时分秒

使用步骤

创建数据库表

1.安装

pip install SQLalchemy

2. 创建连接

from sqlalchemy import create_engine    engine = create_engine("mysql://user:password@hostname/dbname?charset=uft8")

这行代码初始化创建了Engine，Engine内部维护了一个Pool（连接池）和Dialect（方言），方言来识别具体连接数据库种类。

创建好了Engine的同时，Pool和Dialect也已经创建好了，但是此时并没有真正与数据库连接，等到执行具体的语句.connect()等时才会连接到数据库。

create_engine还有其它可选的参数，比如：

engine = create_engine("mysql://user:password@hostname/dbname?charset=uft8",                         echo=True,                         pool_size=8,                         pool_recycle=60*30                         )

echo: 当设置为True时会将orm语句转化为sql语句打印，一般debug的时候可用
pool_size: 连接池的大小，默认为5个，设置为0时表示连接无限制
pool_recycle: 设置时间以限制数据库多久没连接自动断开

3. 创建数据库表类（模型）

前面有提到ORM的重要特点，那么我们操作表的时候就需要通过操作对象来实现，现在我们来创建一个类，以常见的用户表举例：

from sqlalchemy.ext.declarative import declarative_base    Base = declarative_base()      class Users(Base):      __tablename__ = "users"        id = Column(Integer, primary_key=True)      name = Column(String(64), unique=True)      email = Column(String(64))        def __init__(self, name, email):          self.name = name          self.email = email

declarative_base()是sqlalchemy内部封装的一个方法，通过其构造一个基类，这个基类和它的子类，可以将Python类和数据库表关联映射起来。

数据库表模型类通过__tablename__和表关联起来，Column表示数据表的列。

4. 生成数据库表

Base.metadata.create_all(engine)

创建表，如果存在则忽略，执行以上代码，就会发现在db中创建了users表。

操作数据

表创建好了就是操作数据了，常见的操作增删改查，我们一一介绍。

session

sqlalchemy中使用session用于创建程序和数据库之间的会话，所有对象的载入和保存都需要通过session对象。

通过sessionmaker调用创建一个工厂，并关联Engine以确保每个session都可以使用该Engine连接资源：

from sqlalchemy.orm import sessionmaker    # 创建session  DbSession = sessionmaker(bind=engine)  session = DbSession()

session的常见操作方法包括：

flush：预提交，提交到数据库文件，还未写入数据库文件中
commit：提交了一个事务
rollback：回滚
close：关闭

增

举个最简单的例子：

add_user = Users("test", "[email protected]")  session.add(add_user)  session.commit()

session.add()将会把Model加入当前session维护的持久空间(可以从session.dirty看到)中，直到commit时提交到数据库。

Q1：add之后如何直接返回对象的属性？

可以在add之后执行db.session.flush()，这样便可在session中get到对象的属性。

Q2：如何进行批量插入，性能比较？

批量插入共有以下几种方法，对它们的批量做了比较，分别是：

session.add_all() < bulk_save_object() < bulk_insert_mappings() < SQLAlchemy_core()

查

查询是最常用的一个操作了，举个最简单的查询例子：

users = session.query(Users).filter_by(id=1).all()  for item in users:      print(item.name)

通常我们通过以上查询模式获取数据，需要注意的是，通过session.query()我们查询返回了一个Query对象，此时还没有去具体的数据库中查询，只有当执行具体的.all()，.first()等函数时才会真的去操作数据库。

其中，query有filter和filter_by两个过滤方法，上述例子也可写为：

users = session.query(Users).filter_by(Users.id == 1).all()

通常这两个方法都会用到的，所以一定要掌握它们的区别：

filter	filter_by
支持所有比较运算符，相等比较用比较用==	只能使用"="，"!="和"><"
过滤用类名.属性名	过滤用属性名
不支持组合查询，只能连续调用filter变相实现	参数是**kwargs，支持组合查询
支持and，or和in等

改

更新数据有两种方法，一种是使用query中的update方法：

session.query(Users).filter_by(id=1).update({'name': "Jack"})

另一种是操作对应的表模型：

users = session.query(Users).filter_by(name="Jack").first()  users.name = "test"  session.add(users)

这两种方式呢，一般批量更新的话我会选前者，而要对查询获取对象属性之后再更新的场景就需要使用后者。

删

和更新数据类似，删除数据也有两种方法，第一种：

delete_users = session.query(Users).filter(Users.name == "test").first()  if delete_users:      session.delete(delete_users)      session.commit()

第二种：

session.query(Users).filter(Users.name == "test").delete()  session.commit()

批量删除时推荐使用第二种。

以上，就是Python sqlalchemy的基本用法。

代码可参照：my github