Git 时光机穿梭
我们已经可以将文件添加到git仓库了,下面我们试着修改这个文本文件,看看会有什么结果:
修改完成后,保存,然后运行 git status
看看有什么结果:
这样,返回的信息就会告诉我们,现在有文件被修改了,但是还没有被提交(changes not staged for commit)。
虽然git status
可以告诉我们当前仓库的状况,但是并不能清楚的告诉我们修改了哪些地方。这时候,我们就需要用到git diff
命令:
现在,我们知道了readme.txt中只修改了一行内容。所以我们就可以安心的提交更改了:
这时候,我们再来看一下git仓库的状态,使用git status
命令:
这时,系统告诉我们,将要被提交的修改包含了readme.txt文件。
现在我们就提交这次修改,使用git commit
命令:
提交完成后,我们再使用git status
来查看一下仓库的状态:
这时,返回的信息告诉我们,没有需要提交的修改,而且工作目录是干净的。
版本回退
现在我们已经学会了如何修改文件并且将修改提交到git仓库了,下面再联系一次:
然后提交修改:
像这样,你不断对文件进行修改,然后不断提交修改到版本库里,就好比玩RPG游戏时,每通过一关就会自动把游戏状态存盘,如果某一关没过去,你还可以选择读取前一关的状态。有些时候,在打Boss之前,你会手动存盘,以便万一打Boss失败了,可以从最近的地方重新开始。Git也是一样,每当你觉得文件修改到一定程度的时候,就可以“保存一个快照”,这个快照在Git中被称为commit
。一旦你把文件改乱了,或者误删了文件,还可以从最近的一个commit
恢复,然后继续工作,而不是把几个月的工作成果全部丢失。
好,现在我们回顾一下我们一共有多少个版本了:
版本1: add readme file
版本2: add distributed
版本3: append GPL
在git中,我们可以使用git log
命令来查看历史记录,它可以告诉我们每次都修改了些什么:
如果觉得输出的信息太多了,可以试着使用git log --pretty=online
,这样,就能看到最精简的信息了。
这里的commit 7b235af1f06c6952dd4cd41eea8c77bb02be5dce
就是版本号了,和SVN不一样,git的版本号不是1,2,3,4这样递增的数字,而是一个SHA1计算出来的非常大的数字,用16进制表示。为什么commit id
需要用这么一大串数字表示呢?因为Git是分布式的版本控制系统,后面我们还要研究多人在同一个版本库里工作,如果大家都用1,2,3,4作为版本号,那肯定就冲突了。
好了,现在我们知道了这些版本的历史记录之后,就可以启动时光穿梭机了。我们准备把readme.txt回退到上一个版本,即”add distributed”的那个版本,需要怎么做呢?
首先,必须知道当前版本是哪个版本,在git中,使用HEAD
表示当前的版本,上一个版本就是HEAD^
,上上个版本就是HEAD^^
,但是如果是上100个版本呢?我们可以写成HEAD~100
。
现在我们要把当前版本”append GPL”回退到上一个版本”add distributed”,我们需要使用到git reset
命令:
--hard
的含义,后续会讲到,先来看看readme.txt
是否回到了add distributed
版本:
可以发现,现在我们确实回到了add distributed
那个版本,我们还可以继续回到上一个版本,不过我们先停一下,使用git log
查看一下版本记录:
什么?!我们的append GPL
的版本怎么不见了呢?好比你从21世纪坐时光穿梭机来到了19世纪,想再回去已经回不去了,肿么办?
办法其实还是有的,只要上面的命令行窗口还没有被关掉,你就可以顺着往上找啊找啊,找到那个append GPL
的commit id
是9b51472…,于是就可以指定回到未来的某个版本:
版本号没必要写全,前几位就可以了,Git会自动去找。当然也不能只写前一两位,因为Git可能会找到多个版本号,就无法确定是哪一个了。
再小心翼翼地看看readme.txt的内容:
果然,我胡汉三又回来了。
Git的版本回退速度非常快,因为Git在内部有个指向当前版本的HEAD
指针,当你回退版本的时候,Git仅仅是把HEAD从
指向append GPL
:
改为指向add distributed
:
然后顺便把工作区的文件更新了。所以你让HEAD
指向哪个版本号,你就把当前版本定位在哪。
现在,你回退到了某个版本,关掉了电脑,第二天早上就后悔了,想恢复到新版本怎么办?找不到新版本的commit id
怎么办?
在Git中,总是有后悔药可以吃的。当你用$ git reset --hard HEAD^
回退到add distributed
版本时,再想恢复到append GPL
,就必须找到append GPL
的commit id
。Git提供了一个命令git reflog
用来记录你的每一次命令:
从返回的信息可以看出来,append GPL
的commit id
为9b51472
。这样,我们就又可以回到未来啦!
工作区和暂存区
Git和其他版本控制系统如SVN的一个不同之处就是有暂存区的概念。
先来看名词解释。
工作区(Working Directory)
就是你在电脑里能看到的目录,比如我的learngit
文件夹就是一个工作区:
版本库(Git Repository)
工作区有一个隐藏目录.git
,这个不算工作区,而是Git的版本库。
Git的版本库里存了很多东西,其中最重要的就是称为stage(或者叫index)的暂存区,还有Git为我们自动创建的第一个分支master
,以及指向master
的一个指针叫HEAD
。
分支和HEAD
的概念我们以后再讲。
前面讲了我们把文件往Git版本库里添加的时候,是分两步执行的:
第一步是用git add
把文件添加进去,实际上就是把文件修改添加到暂存区;
第二步是用git commit
提交更改,实际上就是把暂存区的所有内容提交到当前分支。
因为我们创建Git版本库时,Git自动为我们创建了唯一一个master
分支,所以,现在,git commit
就是往master
分支上提交更改。
你可以简单理解为,需要提交的文件修改通通放到暂存区,然后,一次性提交暂存区的所有修改。
俗话说,实践出真知。现在,我们再练习一遍,先对readme.txt
做个修改,比如加上一行内容:
然后,在工作区新增一个LICENSE
文件:
现在,我们用git status
查看一下仓库的状态:
返回的信息清楚的告诉了我们,readme.txt
被修改了,而LICENSE
是第一次出现,所以状态是Untracked
。
现在,使用两次git add
,把两个文件都添加后,再使用git status
查看一下:
现在,暂存区的状态就变成这样了:
所以,git add
命令实际上就是把要提交的所有修改放到暂存区(Stage),然后,执行git commit
就可以一次性把暂存区的所有修改提交到分支。
一旦提交成功后,这时你的工作区就是干净的了:
现在,版本库就变成了这样:
管理修改
现在,我们已经掌握了暂存区的概念。接下来,我们讨论一下,为什么Git比其他版本控制系统设计的优秀,因为Git跟踪并管理的是修改,而非文件。
那什么是修改呢?比如你新增了一行,这就是一个修改;删除了一行,也是一个修改;更改了某些字符,也是一个修改;删了一些又加了一些,也是一个修改;甚至创建一个新文件,也算一个修改。
为什么说Git管理的是修改,而不是文件呢?我们还是做实验。第一步,对readme.txt做一个修改,比如加一行内容:
然后,添加到暂存区:
然后,再次修改readme.txt
:
提交:
提交后,再看看状态:
为什么这里第二次的修改没有被提交呢?
我们来回顾一下整个操作过程:
第一次修改 -> git add
-> 第二次修改 -> git commit
我们前面讲了,Git管理的是修改,当你使用git add
命令后,在工作区的第一次修改被放入暂存区,准备提交,但是,在工作区的第二次修改并没有放入暂存区,所以,git commit
只负责把暂存区的修改提交了,也就是第一次的修改被提交了,第二次的修改不会被提交。
提交后,用git diff HEAD -- readme.txt
命令可以查看工作区和版本库里面最新版本的区别:
可见,第二次修改确实没有被提交。那怎么才能提交第二次的修改呢?只有继续使用git add
将修改提交到暂存区,然后再使用git commit
将暂存区的修改提交。现在可以了解到,每一次修改,如果不add
到暂存区,那就不会加入到commit
中。
撤销修改
自然,你是不会犯错的。不过现在是凌晨两点,你正在赶一份工作报告,你在readme.txt
中添加了一行:
在你准备提交前,一杯咖啡起了作用,你猛然发现了“stupid boss”可能会让你丢掉这个月的奖金!
既然错误发现得很及时,就可以很容易地纠正它。你可以删掉最后一行,手动把文件恢复到上一个版本的状态。如果用git status
查看一下:
从返回的信息可以发现,你可以使用git checkout -- readme.txt
来丢弃工作区的修改:
命令git checkout -- readme.txt
意思就是,把readme.txt
文件在工作区的修改全部撤销,这里有两种情况:
一种是readme.txt
自修改后还没有被放到暂存区,现在,撤销修改就回到和版本库一模一样的状态;
一种是readme.txt
已经添加到暂存区后,又作了修改,现在,撤销修改就回到添加到暂存区后的状态。
总之,就是让这个文件回到最近一次git commit
或git add
时的状态。
现在,看看readme.txt
的文件内容:
文件内容果然复原了。
git checkout -- file
命令中的--
很重要,没有--
,就变成了“切换到另一个分支”的命令,我们在后面的分支管理中会再次遇到git checkout
命令。
现在假定是凌晨3点,你不但写了一些胡话,还git add
到暂存区了:
这时,使用git status
查看一下当前的状态:
Git同样告诉我们,用命令git reset HEAD file
可以把暂存区的修改撤销掉(unstage),重新放回工作区:
git reset
命令既可以回退版本,也可以把暂存区的修改回退到工作区。当我们用HEAD
时,表示最新的版本。
再用git status
查看一下,现在暂存区是干净的,工作区有修改:
还记得如何撤销工作区的修改吗?
现在,假设你不但改错了东西,还从暂存区提交到了版本库,怎么办呢?还记得版本回退一节吗?可以回退到上一个版本。不过,这是有条件的,就是你还没有把自己的本地版本库推送到远程。还记得Git是分布式版本控制系统吗?我们后面会讲到远程版本库,一旦你把“stupid boss”提交推送到远程版本库,你就真的惨了……
场景1:当你改乱了工作区某个文件的内容,想直接丢弃工作区的修改时,用命令git checkout -- file
。
场景2:当你不但改乱了工作区某个文件的内容,还添加到了暂存区时,想丢弃修改,分两步,第一步用命令git reset HEAD file
,就回到了场景1,第二步按场景1操作。
场景3:已经提交了不合适的修改到版本库时,想要撤销本次提交,参考版本回退一节,不过前提是没有推送到远程库。
删除文件
在Git中,删除也是一个修改操作,我们实战一下,先添加一个新文件test.txt到Git并且提交:
一般情况下,你通常直接在文件管理器中把没用的文件删了,或者用rm
命令删了:
这个时候,Git知道你删除了文件,因此,工作区和版本库就不一致了,git status
命令会立刻告诉你哪些文件被删除了:
现在你有两个选择,一是确实要从版本库中删除该文件,那就用命令git rm
删掉,并且git commit
:
现在,文件就从版本库中被删除了。
另一种情况是删错了,因为版本库里还有呢,所以可以很轻松地把误删的文件恢复到最新版本:
git checkout
其实是用版本库里的版本替换工作区的版本,无论工作区是修改还是删除,都可以“一键还原”。