05.进阶 1:HEAD、master 与 branch
进阶 1:HEAD、master 与 branch
这一节主要是几个概念的解释:HEAD、master 以及 Git 中非常重要的一个概念: branch。
引用:commit 的快捷方式
首先,再看一次 log
:
git log
第一行的 commit
后面括号里的 HEAD -> master, origin/master, origin/HEAD
,是几个指向这个 commit
的引用。在 Git 的使用中,经常会需要对指定的 commit
进行操作。每一个 commit
都有一个它唯一的指定方式——它的 SHA-1 校验和,也就是上图中每个黄色的 commit
右边的那一长串字符。两个 SHA-1 值的重复概率极低,所以你可以使用这个 SHA-1 值来指代 commit
,也可以只使用它的前几位来指代它(例如第一个 78bb0ab7d541…16b77
,你使用 78bb0ab
甚至 78bb
来指代它通常也可以),但毕竟这种没有任何含义的字符串是很难记忆的,所以 Git 提供了「引用」的机制:使用固定的字符串作为引用,指向某个 commit
,作为操作 commit
时的快捷方式。
HEAD:当前 commit 的引用
上一段里说到,图中括号里是指向这个 commit
的引用。其中这个括号里的 HEAD
是引用中最特殊的一个:它是指向当前 commit
的引用。所谓**当前 commit
**这个概念很简单,它指的就是当前工作目录所对应的 commit
。
例如上图中的当前 commit
就是第一行中的那个最新的 commit
。每次当有新的 commit
的时候,工作目录自动与最新的 commit
对应;而与此同时,HEAD
也会转而指向最新的 commit
。事实上,当使用 checkout
、reset
等指令手动指定改变当前 commit
的时候,HEAD
也会一起跟过去。
总之,当前 commit
在哪里,HEAD
就在哪里,这是一个永远自动指向当前 commit
的引用,所以你永远可以用 HEAD
来操作当前 commit
。
branch
HEAD
是 Git 中一个独特的引用,它是唯一的。而除了 HEAD
之外,Git 还有一种引用,叫做 branch
(分支)。HEAD
除了可以指向 commit
,还可以指向一个 branch
,当它指向某个 branch
的时候,会通过这个 branch
来间接地指向某个 commit
;另外,当 HEAD
在提交时自动向前移动的时候,它会像一个拖钩一样带着它所指向的 branch
一起移动。
例如上面的那张图里,HEAD -> master
中的 master
就是一个 branch
的名字,而它左边的箭头 ->
表示 HEAD
正指向它(当然,也会间接地指向它所指向的 commit
)。
如果我在这时创建一个 commit
,那么 HEAD
会带着 master
一起移动到最新的 commit
:
git commit
通过查看 log
,可以对这个逻辑进行验证:
git log
从图中可以看出,最新的 commit
(提交信息:”Add feature1”)被创建后,HEAD
和 master
这两个引用都指向了它,而在上面第一张图中的后两个引用 origin/master
和 origin/HEAD
则依然停留在原先的位置。
master: 默认 branch
上面的这个 master
,其实是一个特殊的 branch
:它是 Git 的默认 branch
(俗称主 branch
/ 主分支)。
所谓的「默认 branch」,主要有两个特点:
新创建的 repository(仓库)是没有任何
commit
的。但在它创建第一个commit
时,会把master
指向它,并把HEAD
指向master
。当有人使用
git clone
时,除了从远程仓库把.git
这个仓库目录下载到工作目录中,还会checkout
(签出)master
(checkout
的意思就是把某个commit
作为当前commit
,把HEAD
移动过去,并把工作目录的文件内容替换成这个commit
所对应的内容)。
另外,需要说一下的是,大多数的开发团队会规定开发以 master
为核心,所有的分支都在一定程度上围绕着 master
来开发。这个在事实上构成了 master
和其它分支在地位上的一个额外的区别。
branch 的通俗化理解
尽管在 Git 中,branch
只是一个指向 commit
的引用,但它有一个更通俗的理解:你还可以把一个 branch
理解为从初始 commit
到 branch
所指向的 commit
之间的所有 commit
s 的一个「串」。例如下面这张图:
master
的本质是一个指向 3
的引用,但你也可以把 master
理解为是 1
2
3
三个 commit
的「串」,它的起点是 1
,终点是 3
。
这种理解方式比较符合 branch
这个名字的本意(branch 的本意是树枝,可以延伸为事物的分支),也是大多数人对 branch
的理解。不过如果你选择这样理解 branch
,需要注意下面两点:
所有的
branch
之间都是平等的。例如上面这张图,
branch1
是1
2
5
6
的串,而不要理解为2
5
6
或者5
6
。其实,起点在哪里并不是最重要的,重要的是你要知道,所有branch
之间是平等的,master
除了上面我说的那几点之外,并不比其他branch
高级。这个认知的理解对于branch
的正确使用非常重要。换个角度来说,上面这张图我可以用别的画法来表达,它们的意思是一样的:
通过这张动图应该能够对「平等」这个概念更好地理解了吧?
branch
包含了从初始commit
到它的所有路径,而不是一条路径。并且,这些路径之间也是彼此平等的。像上图这样,
master
在合并了branch1
之后,从初始commit
到master
有了两条路径。这时,master
的串就包含了1
2
3
4
7
和1
2
5
6
7
这两条路径。而且,这两条路径是平等的,1
2
3
4
7
这条路径并不会因为它是「原生路径」而拥有任何的特别之处。
如果你喜欢用「树枝」的概念来理解 Git 的 branch
,一定要注意上面说的这两点,否则在今后使用 branch
的时候就可能与出现理解偏差或者使用方式不当的问题。事实上我本人并不喜欢用这种方式来理解 branch
,因为觉得它有点舍近求远的味道:我为了「直观」地思考,给它了一个形象的比喻,但由于它的本质含义其实更加简单,导致我的这种比喻反而增加了思考它时的复杂度,未免有点画蛇添足。不过这是我自己的感受,怎么理解 branch
是个个人偏好的问题,这两种理解方式你选一个喜欢的就好。
branch 的创建、切换和删除
创建 branch
如果你想在某处创建 branch
,只需要输入一行 git branch 名称
。例如你现在在 master
上:
你想在这个 commit
处创建一个叫做 “feature1” 的 branch
,只要输入:
git branch feature1
你的 branch
就创建好了:
切换 branch
不过新建的 branch
并不会自动切换,你的 HEAD
在这时依然是指向 master
的。你需要用 checkout
来主动切换到你的新 branch
去:
git checkout feature1
然后 HEAD
就会指向新建的 branch
了:
除此之外,你还可以用 git checkout -b 名称
来把上面两步操作合并执行。这行代码可以帮你用指定的名称创建 branch
后,再直接切换过去。还以 feature1
为例的话,就是:
git checkout -b feature1
在切换到新的 branch
后,再次 commit
时 HEAD
就会带着新的 branch
移动了:
...
git commit
而这个时候,如果你再切换到 master
去 commit
,就会真正地出现分叉了:
git checkout master
...
git commit
删除 branch
删除 branch
的方法非常简单:git branch -d 名称
。例如要删除 feature1
这个 branch:
git branch -d feature1
需要说明的有两点:
HEAD
指向的branch
不能删除。如果要删除HEAD
指向的branch
,需要先用checkout
把HEAD
指向其他地方。由于 Git 中的
branch
只是一个引用,所以删除branch
的操作也只会删掉这个引用,并不会删除任何的commit
。(不过如果一个commit
不在任何一个branch
的「路径」上,或者换句话说,如果没有任何一个branch
可以回溯到这条commit
(也许可以称为野生commit
?),那么在一定时间后,它会被 Git 的回收机制删除掉。)出于安全考虑,没有被合并到
master
过的branch
在删除时会失败(因为怕你误删掉「未完成」的branch
啊):这种情况如果你确认是要删除这个
branch
(例如某个未完成的功能被团队确认永久毙掉了,不再做了),可以把-d
改成-D
,小写换成大写,就能删除了。
「引用」的本质
所谓「引用」(reference),其实就是一个个的字符串。这个字符串可以是一个 commit
的 SHA-1 码(例:c08de9a4d8771144cd23986f9f76c4ed729e69b0
),也可以是一个 branch
(例:ref: refs/heads/feature3
)。
Git 中的 HEAD
和每一个 branch
以及其他的引用,都是以文本文件的形式存储在本地仓库 .git
目录中,而 Git 在工作的时候,就是通过这些文本文件的内容来判断这些所谓的「引用」是指向谁的。
小结
这一节介绍了 Git 中的一些「引用」:HEAD
、master
、branch
。这里总结一下:
HEAD
是指向当前commit
的引用,它具有唯一性,每个仓库中只有一个HEAD
。在每次提交时它都会自动向前移动到最新的commit
。branch
是一类引用。HEAD
除了直接指向commit
,也可以通过指向某个branch
来间接指向commit
。当HEAD
指向一个branch
时,commit
发生时,HEAD
会带着它所指向的branch
一起移动。master
是 Git 中的默认branch
,它和其它branch
的区别在于:- 新建的仓库中的第一个
commit
会被master
自动指向; - 在
git clone
时,会自动checkout
出master
。
- 新建的仓库中的第一个
branch
的创建、切换和删除:- 创建
branch
的方式是git branch 名称
或git checkout -b 名称
(创建后自动切换); - 切换的方式是
git checkout 名称
; - 删除的方式是
git branch -d 名称
。
- 创建