SQLite：修订间差异

2020年10月24日 (六) 07:29的版本

SQLite是遵守ACID的关系数据库管理系统，它是一个C语言库，实现了小巧、快速、自给、高可靠性、全功能SQL的数据库引擎。完整的SQLite数据库就是一个SQLite格式的文件。因为小巧，常作为嵌入式数据库，集成在应用程序。

SQLite实现了大多数SQL标准。它使用动态的、弱类型的SQL语法。SQLite的源代码和文档都位于公有领域，任何人可以免费自由的用于商业和非商业。

简介

时间轴

2000年8月17日，发布初始版本SQLite 1.0
2001年09年28日，发布SQLite 2.0.0
2004年06年18日，发布SQLite 3.0.0
2019年10日10日，发布SQLite 3.30.1

特点

了解更多 >> SQLite 文档：Features Of SQLite

数据类型

所有存入SQLite数据库的值都被保存为下表5中类型之一：

SQLite类型	描述
NULL	空值
INTEGER	整数，根据值的大小存储，最大8字节，即最大2^63-1=9223372036854775807。
REAL	浮点数, 存储为 8 字节的 IEEE 浮点数字。
TEXT	文本字符串，使用数据库编码（UTF-8、UTF-16BE 或 UTF-16LE）存储。
BLOB	二进制值，直接存储，不经过转换，如存储图片等。

布尔值在SQLite没有单独的存储类，使用INTEGER类的0 (false) 和 1 (true)存储。

SQLite也没有单独的日期时间数据类型，而是通过内置的时间日期函数，使用TEXT, REAL, 或INTEGER数据类型保存值。如下：

TEXT，ISO8601格式的字符串 "YYYY-MM-DD HH:MM:SS.SSS"
REAL，以Julian day numbers(公元前4713年1月1日中午12点)为起点开始计算，整数部分是天数，小数部分是当天时间数。
INTEGER，unix时间戳，以1970-01-01 00:00:00 UTC为起点计算。

一般数据库每列数据为固定类型，但SQLite中可以将不同类型数据存储到同一列。为了最大化与和其他SQL数据库引擎之间的兼容性，SQLite使用一种"类型亲和性"（Type Affinity）概念。列的亲和类型是指该列的主要数据类型，当能够转化为该数据类型就转化，不能转化就按原数据类型存储。

日期和时间

函数

SQLite有5个日期和时间函数，每个函数都有一个参数时间字符串（timestring），后面跟着零个或多个参数修饰符（modifier）字符串。strftime()函数多一个参数格式化字符串（format），作为其第一个参数。其中strftime()函数是最基础函数，其他4个函数都可以用strftime()表示。提供其他4个而不仅一个函数，原因是使用更简单方便。

函数	描述	等同的strftime()
date(timestring, modifier, modifier, ...)	返回日期	strftime('%Y-%m-%d',modifier, modifier, ...)
time(timestring, modifier, modifier, ...)	返回时间	strftime('%H:%M:%S',modifier, modifier, ...)
datetime(timestring, modifier, modifier, ...)	返回日期时间	strftime('%Y-%m-%d %H:%M:%S', modifier, modifier, ...)
julianday(timestring, modifier, modifier, ...)	返回Julian day天数	strftime('%J', modifier, modifier, ...)
strftime(format, timestring, modifier, modifier, ...)	返回格式化的日期时间字符串	strftime(format, timestring, modifier, modifier, ...)

时间字符串 Time Strings

时间字符串（Time Strings）可以为下面任意一种格式：

时间字符串格式	时间字符串例	使用示例
YYYY-MM-DD	'2020-02-20'	date('2020-02-20', 'start of year')
YYYY-MM-DD HH:MM
YYYY-MM-DD HH:MM:SS
YYYY-MM-DD HH:MM:SS.SSS
YYYY-MM-DDTHH:MM
YYYY-MM-DDTHH:MM:SS
YYYY-MM-DDTHH:MM:SS.SSS
HH:MM
HH:MM:SS
HH:MM:SS.SSS
now	'now'	`SELECT date('now');` 计算当前日期
DDDDDDDDDD

修饰符 Modifiers

时间字符串后面可以跟0个或多个修饰符（Modifiers）。修饰符的顺序很重要，修饰符是从左到右依次转换数值。

修饰符	描述	示例
NNN days
NNN hours
NNN minutes
NNN.NNNN seconds
NNN months
NNN years
start of month
start of year
start of day
weekday N
unixepoch
localtime
utc

了解更多 >> SQLite文档：日期与时间函数

SQL

SQLite支持大多数标准的SQL。但是它确实省略了一些功能，同时又增加了一些自己的功能。

选取数据

基本选取

选取数据	语法	描述
选取单表所有数据	SELECT * FROM 表名;	`*` 号为通配符
选取单列数据	SELECT 列名 FROM 表名;
选取多列数据	SELECT 列名1, 列名2, 列名3 FROM 表名;	列名用逗号隔开，最后一个列名不加逗号。

数据库信息查询

查询一个数据库所有表名：

SELECT name FROME sqlite_master WHERE type='table' ORDER BY name;

以下示例，在Python中查询当前文件夹下'example.db'数据库文件所有的表，示例如下：

import sqlite3

conn = sqlite3.connect('example.db') 
c = conn.cursor()

c.execute("SELECT name FROME sqlite_master WHERE type='table' ORDER BY name;")
c.fetchall()

修改数据

删除数据

删除表中数据可以使用DELETE语句，使用时需注意指定删除那些记录，否则表中全部记录，DELETE语句格式如下：

DELETE FROM 表名称 WHERE  条件;

如

了解更多 >> SQLite 文档：SQLite 中的 SQL

进阶教程

数据库文件格式

完整的SQLite数据库是磁盘的一个文件，叫做“主数据库文件”（main database file）。在事务处理期间，SQLite将其他信息存储在称为“回滚日志”（rollback journal）的文件中，或者SQLite为WAL模式时，会有一个预先写入日志文件（write-ahead log file）。

了解更多 >> SQLite 文档：数据库文件格式

Python中使用

标准库 sqlite3

Python 2.5及以上版本内置了sqlite3模块，在Python中使用SQLite，不需要安装任何东西，直接使用。sqlite3 模块由 Gerhard Häring 编写。它提供了符合 DB-API 2.0 规范的接口，这个规范是 PEP 249。

要使用这个模块，必须先创建一个 Connection 对象，它代表数据库。下面例子中，数据将存储在当前文件夹的 example.db 文件中，也可以使用 :memory: 来创建一个内存中的数据库。当有了 Connection 对象后，你可以创建一个 Cursor 游标对象，然后调用它的 execute() 方法来执行 SQL 语句：

import sqlite3

#创建Connection 对象
conn = sqlite3.connect('example.db') 

#创建Cursor 对象
c = conn.cursor()

# 调用execute()方法执行创建表格的sql语句
c.execute('''CREATE TABLE stocks
             (date text, trans text, symbol text, qty real, price real)''')

# 插入一行数据
c.execute("INSERT INTO stocks VALUES ('2006-01-05','BUY','RHAT',100,35.14)")

# 调用commit()方法，保存更改
conn.commit()

# 如果不需要使用可以关闭数据库连接
# 确认所有更改已经保存，不然会丢失。
conn.close()

模块函数和常量

函数或常量	描述	示例
sqlite3.version	这个模块的版本号，是一个字符串。不是 SQLite 库的版本号。	sqlite3.version
sqlite3.version_info	这个模块的版本号，是一个由整数组成的元组。不是 SQLite 库的版本号。	sqlite3.version_info
sqlite3.sqlite_version	模块使用的 SQLite 库的版本号，是一个字符串。	sqlite3.sqlite_version
sqlite3.sqlite_version_info	使用中的 SQLite 库的版本号，是一个整数组成的元组。	sqlite3.sqlite_version_info
sqlite3.PARSE_DECLTYPES	这个常量可以作为 connect() 函数的 detect_types 参数。设置这个参数后，sqlite3 模块将解析它返回的每一列申明的类型。它会申明的类型的第一个单词，比如“integer primary key”，它会解析出“integer”，再比如“number(10)”，它会解析出“number”。然后，它会在转换器字典里查找那个类型注册的转换器函数，并调用它。
sqlite3.PARSE_COLNAMES	这个常量可以作为 connect() 函数的 detect_types 参数。设置此参数可使得 SQLite 接口解析它所返回的每一列的列名。它将在其中查找形式为 [mytype] 的字符串，然后将 'mytype' 确定为列的类型。它将尝试在转换器字典中查找 'mytype' 条目，然后用找到的转换器函数来返回值。在 Cursor.description 中找到的列名并不包括类型，举例来说，如果你在你的 SQL 中使用了像 'as "Expiration date [datetime]"' 这样的写法，那么我们将解析出在第一个 then we will parse out everything until the first '[' 之前的所有内容并去除前导空格作为列名：即列名将为 "Expiration date"。
sqlite3.connect(database[, timeout, detect_types, isolation_level, check_same_thread, factory, cached_statements, uri])	连接 SQLite 数据库。默认返回 Connection 对象，除非使用了自定义的 factory 参数。
sqlite3.register_converter(typename, callable)	注册一个回调对象 callable, 用来转换数据库中的字节串为自定的 Python 类型。所有类型为 typename 的数据库的值在转换时，都会调用这个回调对象。通过指定 connect() 函数的 detect-types 参数来设置类型检测的方式。注意，typename 与查询语句中的类型名进行匹配时不区分大小写。
sqlite3.register_adapter(type, callable)	注册一个回调对象 callable，用来转换自定义Python类型为一个 SQLite 支持的类型。这个回调对象 callable 仅接受一个 Python 值作为参数，而且必须返回以下某个类型的值：int，float，str 或 bytes。
sqlite3.complete_statement(sql)	如果字符串 sql 包含一个或多个完整的 SQL 语句（以分号结束）则返回 True。它不会验证 SQL 语法是否正确，仅会验证字符串字面上是否完整，以及是否以分号结束。
sqlite3.enable_callback_tracebacks(flag)	默认情况下，您不会获得任何用户定义函数中的回溯消息，比如聚合，转换器，授权器回调等。如果要调试它们，可以设置 flag 参数为 True 并调用此函数。之后，回调中的回溯信息将会输出到 sys.stderr。再次使用 False 来禁用该功能。

Connection 对象

sqlite3 数据库连接对象（Connection）可以通过sqlite3.connect()函数创建，Connection 对象有如下的属性和方法：

属性或方法	描述	示例
isolation_level	获取或设置当前默认的隔离级别。表示自动提交模式的 None 以及 "DEFERRED", "IMMEDIATE" 或 "EXCLUSIVE" 其中之一。详细描述请参阅控制事务。
in_transaction	如果是在活动事务中（还没有提交改变），返回 True，否则，返回 False。它是一个只读属性。3.2 新版功能。
cursor(factory=Cursor)	这个方法接受一个可选参数 factory，如果要指定这个参数，它必须是一个可调用对象，而且必须返回 Cursor 类的一个实例或者子类。
commit()	这个方法提交当前事务。如果没有调用这个方法，那么从上一次提交 commit() 以来所有的变化在其他数据库连接上都是不可见的。如果你往数据库里写了数据，但是又查询不到，请检查是否忘记了调用这个方法。
rollback()	这个方法回滚从上一次调用 commit() 以来所有数据库的改变。
close()	关闭数据库连接。注意，它不会自动调用 commit() 方法。如果在关闭数据库连接之前没有调用 commit()，那么你的修改将会丢失！
execute(sql[, parameters])	这是一个非标准的快捷方法，它会调用 cursor() 方法来创建一个游标对象，并使用给定的 parameters 参数来调用游标对象的 execute() 方法，最后返回这个游标对象。
executemany(sql[, parameters])	这是一个非标准的快捷方法，它会调用 cursor() 方法来创建一个游标对象，并使用给定的 parameters 参数来调用游标对象的 executemany() 方法，最后返回这个游标对象。
executescript(sql_script)	这是一个非标准的快捷方法，它会调用 cursor() 方法来创建一个游标对象，并使用给定的 sql_script 参数来调用游标对象的 executescript() 方法，最后返回这个游标对象。
create_function(name, num_params, func, *, deterministic=False)	创建一个可以在 SQL 语句中使用的用户自定义函数，函数名为 name。 num_params 为该函数所接受的形参个数（如果 num_params 为 -1，则该函数可接受任意数量的参数）， func 是一个 Python 可调用对象，它将作为 SQL 函数被调用。如果 deterministic 为真值，则所创建的函数将被标记为 deterministic，这允许 SQLite 执行额外的优化。此旗标在 SQLite 3.8.3 或更高版本中受到支持，如果在旧版本中使用将引发 NotSupportedError。
create_aggregate(name, num_params, aggregate_class)	创建一个自定义的聚合函数。参数中 aggregate_class 类必须实现两个方法：step 和 finalize。step 方法接受 num_params 个参数（如果 num_params 为 -1，那么这个函数可以接受任意数量的参数）；finalize 方法返回最终的聚合结果。 finalize 方法可以返回任何 SQLite 支持的类型：bytes，str，int，float 和 None。
create_collation(name, callable)	使用 name 和 callable 创建排序规则。这个 callable 接受两个字符串对象，如果第一个小于第二个则返回 -1，如果两个相等则返回 0，如果第一个大于第二个则返回 1。注意，这是用来控制排序的（SQL 中的 ORDER BY），所以它不会影响其它的 SQL 操作。注意，这个 callable 可调用对象会把它的参数作为 Python 字节串，通常会以 UTF-8 编码格式对它进行编码。
interrupt()	可以从不同的线程调用这个方法来终止所有查询操作，这些查询操作可能正在连接上执行。此方法调用之后，查询将会终止，而且查询的调用者会获得一个异常。
set_authorizer(authorizer_callback)	此方法注册一个授权回调对象。每次在访问数据库中某个表的某一列的时候，这个回调对象将会被调用。如果要允许访问，则返回 SQLITE_OK，如果要终止整个 SQL 语句，则返回 SQLITE_DENY，如果这一列需要当做 NULL 值处理，则返回 SQLITE_IGNORE。这些常量可以在 sqlite3 模块中找到。
set_progress_handler(handler, n)	此例程注册回调。对SQLite虚拟机的每个多指令调用回调。如果要在长时间运行的操作期间从SQLite调用（例如更新用户界面），这非常有用。
set_trace_callback(trace_callback)	为每个 SQLite 后端实际执行的 SQL 语句注册要调用的 trace_callback。3.3 新版功能。
enable_load_extension(enabled)	此例程允许/禁止SQLite引擎从共享库加载SQLite扩展。 SQLite扩展可以定义新功能，聚合或全新的虚拟表实现。一个众所周知的扩展是与SQLite一起分发的全文搜索扩展。默认情况下禁用可加载扩展。3.2 新版功能。
load_extension(path)	此例程从共享库加载SQLite扩展。在使用此例程之前，必须使用 enable_load_extension() 启用扩展加载。默认情况下禁用可加载扩展。 3.2 新版功能。
row_factory	您可以将此属性更改为可接受游标和原始行作为元组的可调用对象，并将返回实际结果行。这样，您可以实现更高级的返回结果的方法，例如返回一个可以按名称访问列的对象。
text_factory	使用此属性可以控制为 TEXT 数据类型返回的对象。默认情况下，此属性设置为 str 和 sqlite3 模块将返回 TEXT 的 Unicode 对象。如果要返回字节串，可以将其设置为 bytes。	`conn.text_factory = bytes`
total_changes	返回自打开数据库连接以来已修改，插入或删除的数据库行的总数。	`conn.total_changes`
iterdump()	返回以SQL文本格式转储数据库的迭代器。保存内存数据库以便以后恢复时很有用。此函数提供与 sqlite3 shell 中的 .dump 命令相同的功能。
backup(target, *, pages=0, progress=None, name="main", sleep=0.250)	即使在 SQLite 数据库被其他客户端访问时，或者同时由同一连接访问，该方法也会对其进行备份。该副本将写入强制参数 target，该参数必须是另一个 Connection 实例。3.7 新版功能。

Cursor 对象

游标对象（Cursor ）可以通过Connection对象调用cursor()方法创建。Cursor 游标实例具有以下属性和方法。

属性或方法	描述	示例
execute(sql[, parameters])	执行SQL语句。可以是参数化 SQL 语句（即，在 SQL 语句中使用占位符）。sqlite3 模块支持两种占位符：问号（qmark风格）和命名占位符（命名风格）。
executemany(sql, seq_of_parameters)	基于在序列 seq_of_parameters 中找到的所有形参序列或映射执行一条 SQL 命令。 sqlite3 模块还允许使用 iterator 代替序列来产生形参。
executescript(sql_script)	这是一个非标准的便捷方法，可用于一次执行多条 SQL 语句。它会首先执行一条 COMMIT 语句，再执行以形参方式获取的 SQL 脚本。sql_script 可以是一个 str 类的实例。
fetchone()	获取一个查询结果集的下一行，返回一个单独序列，或是在没有更多可用数据时返回 None。
fetchmany(size=cursor.arraysize)	获取下一个多行查询结果集，返回一个列表。当没有更多可用行时将返回一个空列表。每次调用获取的行数由 size 形参指定。如果没有给出该形参，则由 cursor 的 arraysize 决定要获取的行数。此方法将基于 size 形参值尝试获取指定数量的行。如果获取不到指定的行数，则可能返回较少的行。
fetchall()	获取一个查询结果的所有（剩余）行，返回一个列表。请注意 cursor 的 arraysize 属性会影响此操作的执行效率。当没有可用行时将返回一个空列表。
close()	立即关闭 cursor（而不是在当 __del__ 被调用的时候）。从这一时刻起该 cursor 将不再可用，如果再尝试用该 cursor 执行任何操作将引发 ProgrammingError 异常。
rowcount	虽然 sqlite3 模块的 Cursor 类实现了此属性，但数据库引擎本身对于确定 "受影响行"/"已选择行" 的支持并不完善。
lastrowid	这个只读属性会提供最近修改行的 rowid。它只在你使用 execute() 方法执行 INSERT 或 REPLACE 语句时会被设置。对于 INSERT 或 REPLACE 以外的操作或者当 executemany() 被调用时，lastrowid 会被设为 None。在 3.6 版更改: 增加了 REPLACE 语句的支持。
arraysize	用于控制 fetchmany() 返回行数的可读取/写入属性。该属性的默认值为 1，表示每次调用将获取单独一行。
description	这个只读属性将提供上一次查询的列名称。为了与 Python DB API 保持兼容，它会为每个列返回一个 7 元组，每个元组的最后六个条目均为 None。
connection	这个只读属性返回 Cursor 对象所使用的 SQLite 数据库 Connection。

SQLite 与 Python 类型

SQLite类型	Python类型（Python类型转SQLite类型）	Python类型（SQLite类型转为Python类型，默认）
NULL	None	None
INTEGER	int	int
REAL	float	float
TEXT	str	取决于 text_factory , 默认为 str
BLOB	bytes	bytes

了解更多 >> Python 文档：Python标准库 - sqlite3

pandas 函数

Pandas提供了一些SQL数据库接口函数，使用方便。pandas操作SQLite数据库默认使用python的sqlite3模块。主要为下面四个函数或方法：

函数或方法	描述	示例
read_sql()	通过SQL语句或表名读取数据生成DataFrame对象
read_sql_table()	read_sql()函数的封装，通过表名读取数据库生成DataFrame对象
read_sql_query()	read_sql()函数的封装，通过SQL语句读取数据库生成DataFrame对象
DataFrame.to_sql()	DataFrame对象保存到SQL类型数据库

读取数据库

使用read_sql_query()读取数据示例，如查询test.db数据库中stocks表的所有数据：

import pandas as pd
conn = sqlite3.connect('test.db')
df = pd.read_sql_query("select * from stocks;", conn)
print(df)

保存到数据库

了解更多 >> pandas 文档：IO接口 sql-queries

可能出现问题

问题：OperationalError: database is locked

可能由于前面使用写入数据库的连接没有关闭。使用后关闭 Connection 对象，比如前面设置Connection 对象实例的名称conn，调用conn.close()即可。

资源

官网

参考文献

维基百科：SQLite

@@ 第21行： / 第21行： @@
 所有存入SQLite数据库的值都被保存为下表5中类型之一：
+{{SQLite数据类型表}}
-{| class="wikitable" style="width: 100%;
-|-
-! SQLite类型
-! 描述
-|-
-| NULL
-| 空值
-|-
-| INTEGER
-| 整数，根据值的大小存储，最大8字节，即最大2^63-1=9223372036854775807。
-|-
-| REAL
-| 浮点数, 存储为 8 字节的 IEEE 浮点数字。
-|-
-| TEXT
-| 文本字符串，使用数据库编码（UTF-8、UTF-16BE 或 UTF-16LE）存储。
-|-
-| BLOB
-| 二进制值，直接存储，不经过转换，如存储图片等。
-|}
 布尔值在SQLite没有单独的存储类，使用INTEGER类的0 (false) 和 1 (true)存储。