Django 迁移、操作数据库

2019-08-0130748 阅读19 评论

我们已经编写了博客数据库模型的代码,但那还只是 Python 代码而已,django 还没有把它翻译成数据库语言,因此实际上这些数据库表还没有真正的在数据库中创建。

迁移数据库

为了让 django 完成翻译,创建好这些数据库表,我们再一次请出我的工程管理助手 manage.py。切换到 manage.py 文件所在的目录(项目根目录)下,分别运行 pipenv run python manage.py makemigrationspipenv run python manage.py migrate 命令:

> pipenv run python manage.py makemigrations
Migrations for 'blog':
  blog\migrations\0001_initial.py
    - Create model Category
    - Create model Tag
    - Create model Post

> pipenv run python manage.py migrate
Operations to perform:
  Apply all migrations: admin, auth, blog, contenttypes, sessions
Running migrations:
  Applying contenttypes.0001_initial... OK
  Applying auth.0001_initial... OK
  Applying admin.0001_initial... OK
  Applying admin.0002_logentry_remove_auto_add... OK
  Applying admin.0003_logentry_add_action_flag_choices... OK
  Applying contenttypes.0002_remove_content_type_name... OK
  Applying auth.0002_alter_permission_name_max_length... OK
  Applying auth.0003_alter_user_email_max_length... OK
  Applying auth.0004_alter_user_username_opts... OK
  Applying auth.0005_alter_user_last_login_null... OK
  Applying auth.0006_require_contenttypes_0002... OK
  Applying auth.0007_alter_validators_add_error_messages... OK
  Applying auth.0008_alter_user_username_max_length... OK
  Applying auth.0009_alter_user_last_name_max_length... OK
  Applying auth.0010_alter_group_name_max_length... OK
  Applying auth.0011_update_proxy_permissions... OK
  Applying blog.0001_initial... OK
  Applying sessions.0001_initial... OK

当我们执行了 python manage.py makemigrations 后,django 在 blog 应用的 migrations 目录下生成了一个 0001_initial.py 文件,这个文件是 django 用来记录我们对模型做了哪些修改的文件。目前来说,我们在 models.py 文件里创建了 3 个模型类,django 把这些变化记录在了 0001_initial.py 里。

不过此时还只是告诉了 django 我们做了哪些改变,为了让 django 真正地为我们创建数据库表,接下来又执行了 python manage.py migrate 命令。django 通过检测应用中 migrations 目录下的文件,得知我们对数据库做了哪些操作,然后它把这些操作翻译成数据库操作语言,从而把这些操作作用于真正的数据库。

你可以看到命令的输出除了 Applying blog.0001_initial... OK 外,django 还对其它文件做了操作。这是因为除了我们自己建立的 blog 应用外,django 自身还内置了很多应用,这些应用本身也是需要存储数据的。可以在 settings.py 的 INSTALLED_APP 设置里看到这些应用,当然我们目前不必关心这些。

blogproject/settings.py

INSTALLED_APPS = [
    'django.contrib.admin',
    'django.contrib.auth',
    'django.contrib.contenttypes',
    'django.contrib.sessions',
    'django.contrib.messages',
    'django.contrib.staticfiles',
    'blog',
]

对于了解数据库语言的人,你可以运行下面的命令看看 django 究竟为我们做了什么:

> pipenv run python manage.py sqlmigrate blog 0001

你将看到输出了经 django 翻译后的数据库表创建语句,这有助于你理解 django ORM 的工作机制。

选择数据库版本

我们没有安装任何的数据库软件,django 就帮我们迁移了数据库。这是因为我们使用了 Python 内置的 SQLite3 数据库。

SQLite3 是一个十分轻巧的数据库,它仅有一个文件。你可以看一到项目根目录下多出了一个 db.sqlite3 的文件,这就是 SQLite3 数据库文件,django 博客的数据都会保存在这个数据库文件里。

django 在 settings.py 里为我们做了一些默认的数据库配置:

blogproject/settings.py

## 其它配置选项...
DATABASES = {
    'default': {
        'ENGINE': 'django.db.backends.sqlite3',
        'NAME': os.path.join(BASE_DIR, 'db.sqlite3'),
    }
}
## 其它配置选项...

可以看到默认的数据库引擎就是使用的 SQLite3。

当然一些人倾向于使用 MySQL 等大型数据库,至于 django 如何配置 MySQL 这里就不赘述了,你可以自行使用搜索引擎或者查阅 django 的官方文档解决。对于一个小型博客而言,SQLite3 数据库足以胜任。

用 django 的方式操作数据库

数据库最主要的操作就是往里面存入数据、从中取出数据、修改已保存的数据和删除不再需要的数据(合称 CURD)。和创建数据库表一样,django 为这些操作提供了一整套方法,从而把我们从数据库语言中解放出来。我们不用学习如何利用数据库语言去完成这些操作,只要简单地调用几个 Python 函数就可以满足我们的需求。

存数据

先在命令行中来探索一下这些函数,感受一下如何用 django 的方式来操作数据库。在 manage.py 所在目录下运行 pipenv run python manage.py shell 命令:

> pipenv run python manage.py shell
Python 3.6.4 (v3.6.4:d48eceb, Dec 19 2017, 06:54:40) [MSC v.1900 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
(InteractiveConsole)
>>>

这打开了一个交互式命令行。

首先我们来创建一个分类和一个标签:

>>> from blog.models import Category, Tag, Post
>>> c = Category(name='category test')
>>> c.save()
>>> t = Tag(name='tag test')
>>> t.save()

我们首先导入 3 个之前写好的模型类,然后实例化了一个 Category 类和一个 Tag 类,为他们的属性 name 赋了值。为了让 django 把这些数据保存进数据库,调用实例的 save 方法即可。

再创建一篇文章试试,但创建文章之前,我们需要先创建一个 User,用于指定文章的作者。创建 User 的命令 django 已经帮我们写好了,依然是通过 manage.py 来运行。首先按住 Ctrl + c 退出命令交互栏(一次退不出就连续多按几次),运行 pipenv run python manage.py createsuperuser 命令并根据提示创建用户:

> pipenv run python manage.py createsuperuser
Username (leave blank to use 'zmrenwu@163.com'): myuser
Email address: a@aa.com
Password:
Password (again):
Superuser created successfully.

运行 python manage.py createsuperuser 开始创建用户,之后会提示你输入用户名、邮箱、密码和确认密码,按照提示输入即可。注意一点的是密码输入过程中不会有任何字符显示,不要误以为你的键盘出问题了,正常输入即可。最后出现 Superuser created successfully. 说明用户创建成功了。

再次运行 python manage.py shell 进入 Python 命令交互栏,开始创建文章:

>>> from blog.models import Category, Tag, Post
>>> from django.utils import timezone
>>> from django.contrib.auth.models import User

>>> user = User.objects.get(username='myuser')
>>> c = Category.objects.get(name='category test')

>>> p = Post(title='title test', body='body test', created_time=timezone.now(), modified_time=timezone.now(), category=c, author=user)
>>> p.save()

由于我们重启了 shell,因此需要重新导入了 CategoryTagPost 以及 User。我们还导入了一个 django 提供的辅助模块 timezone,这是因为我们需要调用它的 now() 方法为 created_timemodified_time 指定时间,容易理解 now 方法返回当前时间。然后我们根据用户名和分类名,通过 get 方法取出了存在数据库中的 UserCategory(取数据的方法将在下面介绍)。接着我们为文章指定了 titlebodycreated_timemodified_time值,并把它和前面创建的 Category 以及 User 关联了起来。允许为空 excerpttags 我们就没有为它们指定值了。

注意:

我们这里使用 get 方法根据 Categoryname 属性的值获取分类的一条记录。Category.objects.get(name='category test') 的含义是从数据库中取出 name 的值为 category test 的分类记录。确保数据库中只有一条值为 category test 的记录,否则 get 方法将返回一个 MultipleObjectsReturned 异常。如果你不小心已经存了多条记录,请删掉多余的记录。如何删除数据请看下文。

取数据

数据已经存入数据库了,现在要把它们取出来看看:

>>> Category.objects.all()
<QuerySet [<Category: Category object>]>
>>> Tag.objects.all()
<QuerySet [<Tag: Tag object>]>
>>> Post.objects.all()
<QuerySet [<Post: Post object>]>
>>>

objects 是我们的模型管理器,它为我们提供一系列从数据库中取数据方法,这里我们使用了 all 方法,表示我们要把对应的数据全部取出来。可以看到 all 方法都返回了数据,这些数据应该是我们之前存进去的,但是显示的字符串有点奇怪,无法看出究竟是不是我们之前存入的数据。为了让显示出来的数据更加人性化一点,我们为 3 个模型分别增加一个 __str__ 方法:

blog/models.py

class Category(models.Model):
    ...

    def __str__(self):
        return self.name

class Tag(models.Model):
    ...

    def __str__(self):
        return self.name

class Post(models.Model):
    ...

    def __str__(self):
        return self.title

定义好 __str__ 方法后,解释器显示的内容将会是 __str__ 方法返回的内容。这里 Category 返回分类名 nameTag 返回标签名,而 Post 返回它的 title

先按 Ctrl + c 退出 Shell,再重新运行 python manage.py shell 进入 Shell。

>>> from blog.models import Category, Tag, Post
>>> Category.objects.all()
<QuerySet [<Category: category test>]>

>>> Tag.objects.all()
<QuerySet [<Tag: tag test>]>

>>> Post.objects.all()
<QuerySet [<Post: title test>]>

>>> Post.objects.get(title='title test')
<Post: title test>

可以看到返回的是我们之前存入的数据。

此外我们在创建文章时提到了通过 get 方法来获取数据,这里 all 方法和 get 方法的区别是:all 方法返回全部数据,是一个类似于列表的数据结构(QuerySet);而 get 返回一条记录数据,如有多条记录或者没有记录,get 方法均会抛出相应异常。

改数据

尝试修改数据:

>>> c = Category.objects.get(name='category test')
>>> c.name = 'category test new'
>>> c.save()
>>> Category.objects.all()
<QuerySet [<Category: test category new>]>

首先通过 get 方法根据分类名 name 获取值为 category test 到分类,修改它的 name 属性为新的值 category test new,然后调用 save 方法把修改保存到数据库,之后可以看到数据库返回的数据已经是修改后的值了。TagPost 的修改也一样。

删数据

删除掉数据:

>>> p = Post.objects.get(title='title test')
>>> p
<Post: title test>
>>> p.delete()
(1, {'blog.Post_tags': 0, 'blog.Post': 1})
>>> Post.objects.all()
<QuerySet []>

先根据标题 title 的值从数据库中取出 Post,保存在变量 p 中,然后调用它的delete 方法,最后看到 Post.objects.all() 返回了一个空的 QuerySet(类似于一个列表),表明数据库中已经没有 Post,Post 已经被删除了。

这就是 django 对数据库增、删、改、查的操作。除了上述演示的方法外,django 还为我们提供了大量其它的方法,这些方法有一部分会在教程中使用,用到时我会讲解它们的用法。但以后你开发自己的项目时,你就需要通过阅读 django 的官方文档 来了解有哪些方法可用以及如何使用它们。

-- EOF --

19 评论
登录后回复
niyanglishuang
2021-06-23 19:02:00

p = Post(title='title test', body='body test', created_time=timezone.now(), modified_time=timezone.now(), category=c, author=user)这句报错:TypeError: Post() got an unexpected keyword argument 'category'是什么原因呢?

回复
LowSing3721
2021-04-25 10:22:10

created_time和modified_time为什么不用自带选项auto_now_add和auto_now来自动生成呢

回复
LowSing3721 LowSing3721
2021-04-27 15:59:03

已解决,看到后面才知道,后面要用Faker批量造数据,如果使用这些选项后新生成Post的created_time和modified_time将只能在创建后修改而不能在构造时指定

回复
Cercis-chinensis
2021-04-15 18:07:47

嘻嘻,特意登陆来感谢博主

回复
无限星空灿烂
2021-03-19 18:13:32

博主,我执行pipenv run python manage.py makemigrations总是报错,Error: the command puython could not be found within PATH or Pipfile's [scripts].这个是什么原因啊,万分期待帮忙解答

回复
追梦人物 无限星空灿烂
2021-04-11 20:10:18

删了虚拟环境再重新创建一下试试看?

回复
simpelbill
2020-06-26 21:14:59

博主写的真的很细很全,多谢了

回复
叫我萧先森啊
2020-04-07 12:25:10

AttributeError at /admin/blog/post/add/
'Post' object has no attribute 'name'
Request Method: POST
Request URL: http://127.0.0.1:8000/admin/blog/post/add/
Django Version: 2.2.3
Exception Type: AttributeError
Exception Value:
'Post' object has no attribute 'name'
Exception Location: D:\xuni\Django-blog\blog\models.py in str, line 30
Python Executable: D:\xuni.virtualenvs\blogproject_virtualenv\Scripts\python.exe
Python Version: 3.7.4
Python Path:
['D:\xuni\Django-blog',
'D:\xuni\.virtualenvs\blogproject_virtualenv\Scripts\python37.zip',
'd:\anaconda\DLLs',
'd:\anaconda\lib',
'd:\anaconda',
'D:\xuni\.virtualenvs\blogproject_virtualenv',
'D:\xuni\.virtualenvs\blogproject_virtualenv\lib\site-packages']
Server time: 星期二, 7 四月 2020 12:23:58 +0800

回复
叫我萧先森啊 叫我萧先森啊
2020-04-07 12:26:01

请问一下这是怎么回事?
post那边的代码是:

class Post(models.Model):
    #文章标题
    title = models.CharField(max_length = 70)
    #文章正文
    body = models.TextField()
    #这两个列分别表示文章的创建时间和最后一次修改的时间
    created_time = models.DateTimeField()
    modified_time = models.DateTimeField()
    #文章摘要
    excerpt = models.CharField(max_length = 200 , blank = True)
    #分类与标签
    category = models.ForeignKey(Category , on_delete = models.CASCADE)
    tags = models.ManyToManyField(Tag , blank = True)
    #文章作者
    author = models.ForeignKey(User , on_delete = models.CASCADE)
    def __str__(self):
        return self.name

回复
追梦人物 叫我萧先森啊
2020-04-10 19:46:34

Post 没有 name 这个属性呀!

回复
Cercis-chinensis 叫我萧先森啊
2021-04-15 18:07:14

def str(self):
return self.name
可以改成
def str(self):
return self.title

回复
Ipfirn
2020-02-27 17:55:02

TypeError Traceback (most recent call last)
in
----> 1 p = Post(title='title test', body='body test', created_time=timezone.now(), modified_time=timezone.now(), category=c, author=user)

~\AppData\Local\Programs\Python\Python36\lib\site-packages\django\db\models\base.py in init(self, args, *kwargs)
499 pass
500 for kwarg in kwargs:
--> 501 raise TypeError("%s() got an unexpected keyword argument '%s'" % (cls.name, kwarg))
502 super().init()
503 post_init.send(sender=cls, instance=self)

TypeError: Post() got an unexpected keyword argument 'category'
不知道为什么在 p = Post(title='title test', body='body test', created_time=timezone.now(), modified_time=timezone.now(), category=c, author=user)错误了

回复
追梦人物 Ipfirn
2020-02-28 11:04:18

怀疑你的 Post model 中 category 拼错了或者没有 category?

回复
Ipfirn 追梦人物
2020-03-05 17:11:58

没有,已经解决了

回复
一口一块曲奇 Ipfirn
2020-03-09 17:55:25

怎么解决的呀

回复
719923505
2019-09-03 17:17:14

1、from blog.models import Category, Tag, Post

这个是基于哪个目录导入的,是不是必须我现在在manage.py这个文件所在的目录,这样导入才没有问题?

2、Ctrl + c 退出命令交互栏 ,这个只使用windows下的交互栏吧
3、```
python manage.py shell 
运行这个命令进入不了shell,加 pipenv run 才可以的,为啥? 4、
from django.utils import timezone
```
这个获取时间的方法,跟python自带的datetime 有区别吗?

回复
chenjoy0911 719923505
2019-09-11 15:48:36

1.

from blog.models import Category, Tag, Post

因为我们启动command命令框是在HelloDjango-blog-tutorial这个项目目录下,blog也正好在这个根目录;所以我们这里 从(from) 文件夹(blog)下的models.py文件引入(import)Category,Tag,Post三个属性,这三个属性是上一章的内容(点击传送上章),非常不幸的是,博主居然把上一章节的内容给漏掉了...[捂脸],我是从HelloGitHub公众号过来的,哈哈哈,上一章补上估计你就看懂了。
----->>>
2.
如果你是在python的IDLE里面是可以用这个命令的,但是command是不行的哦,可能分版本吧,具体我也不知道,这里你可以用quit()或者exit()
----->>>
3.
这里博主可能复制粘贴的时候忘记了更正了,实际上应该为

pipenv run python manage.py shell

可能指的是用pipenv命令run 虚拟环境下的manage文件调用shell环境来执行python命令吧,学艺不精,因为我们本来就是用虚拟环境来做项目的,所以当然要用虚拟环境嘛[哭笑]
----->>>
4.
这个我没去了解过,应该是有格式适配吧,你可以(百度一下)先看看

回复
chenjoy0911 chenjoy0911
2019-09-11 17:22:24

-_-。sorry!看漏了,博主是有上一篇的(第三篇在这里

回复
追梦人物 719923505
2019-09-12 07:03:45

楼上回答的很详细了,补充第4点,timezone模块相比于自带的datetime,多了对时区的处理。

回复