Python信息采集器使用轻量级关系型数据库SQLite

华天清
华天清
华天清
9
文章
0
评论
2020-04-1803:05:00 评论 378 971字
摘要

Python自带一个轻量级的关系型数据库SQLite。这一数据库使用SQL语言。SQLite作为后端数据库,可以搭配Python建网站,或者为python网络爬虫存储数据。

一.引言

SQLite还在其它领域有广泛的应用,比如HTML5和移动端。

Python标准库中的sqlite3提供该数据库的接口。

二.Python对SQLite进行操作示例

以下的代码将创建一个简单的关系型数据库,为一个书店存储书的分类和价格。数据库中包含两个表:category用于记录分类,book用于记录某本书的信息。一本书归属于某一个分类,因此book有一个外键(foreign key),指向catogory表的主键id。

Python信息采集器使用轻量级关系型数据库SQLite

1.创建数据库

首先,创建数据库,以及数据库中的表。在使用connect()连接数据库后,就可以通过定位指针cursor,来执行SQL命令:

Python信息采集器使用轻量级关系型数据库SQLite 

SQLite的数据库是一个磁盘上的文件,如上面的test.db,因此整个数据库可以方便的移动或复制。test.db一开始不存在,所以SQLite将自动创建一个新文件。

利用execute()命令,执行了两个SQL命令,创建数据库中的两个表。创建完成后,保存并断开数据库连接。

2.插入数据

上面创建了数据库和表,确立了数据库的抽象结构。下面将在同一数据库中插入数据:

Python信息采集器使用轻量级关系型数据库SQLite 

插入数据同样可以使用execute()来执行完整的SQL语句。SQL语句中的参数,使用"?"作为替代符号,并在后面的参数中给出具体值。这里不能用Python的格式化字符串,如"%s",因为这一用法容易受到SQL注入攻击。

也可以用executemany()的方法来执行多次插入,增加多个记录。每个记录是表中的一个元素,如上面的books表中的元素。

3.查询

在执行查询语句后,Python将返回一个循环器,包含有查询获得的多个记录。循环读取,也可以使用sqlite3提供的fetchone()和fetchall()方法读取记录:

Python信息采集器使用轻量级关系型数据库SQLite 

4.更新与删除

可以更新某个记录,或者删除记录:

Python信息采集器使用轻量级关系型数据库SQLite 

也可以直接删除整张表:

Python信息采集器使用轻量级关系型数据库SQLite 

如果删除test.db,那么整个数据库会被删除。

三.总结

sqlite3是一个SQLite的接口。想要熟练的使用SQLite数据库,需要学习关系型数据库的知识。在一些场景下,Python网络爬虫可以使用SQLite存储采集到的网页信息。GooSeeker爬虫DS打数机将在7.x版本支持SQLite,不妨想想一下Python网络爬虫与DS打数机连接在一起会怎样。

End

作者:华天清

来源:知乎

本文均已和作者授权,如转载请与作者联系。

  • 我的微信公众号
  • 微信扫一扫
  • weinxin
  • 我的微信公众号
  • 微信扫一扫
  • weinxin
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: