您可以捐助,支持我们的公益事业。

1元 10元 50元





认证码:  验证码,看不清楚?请点击刷新验证码 必填



  求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Model Center   Code  
会员   
   
 
     
   
 
 订阅
手撕Git,告别盲目记忆
 
作者:噜噜呀
   次浏览      
 2022-7-13
 
编辑推荐:
本文主要介绍了Git的分区(工作区,暂存区,版本库)、 Git的原理、 Git分支 版本的回滚(revert,reset)、 代码暂存(stash),希望对你的学习有帮助。
本文来自于知乎,由火龙果软件Linda编辑、推荐。

引言

Git在工作中经常用到,但是指令太多,网上的说法又不太通俗。总会让想要学习的同学抓不到重点,或者望而却步。这篇文章的目的就是希望读后能够按照原理,系统地记忆一些常用/关键的命令。也算是我这个刚入互联网的小白对社会的一些小小福报~

其中若有不当之处,欢迎大佬指出。

开局一个赞 ,内容一看就懂~

文章导读

Git的分区(工作区,暂存区,版本库)

Git的原理

Git分支

版本的回滚(revert,reset)

代码暂存(stash)

小概述-何为Git

Git是一个分布式版本控制系统,为了快速高效地处理小到大型项目的所有内容。通过对信息的压缩和摘要,使得所占空间非常小,但能够支持项目版本迅速迭代的开发工具。

一、Git的分区

本章主要从基础入手,先介绍git的分区。

1.1 三大分区

工作区,也叫Working Directory

暂存区,也叫stage,index

版本库,也叫本地仓库,commit History

当我们把代码从git hub档下来或者说初始化git项目后,便有了这三个分区的概念。

文件在Git不同分区中的表现

工作区

工作区应该不陌生,就是我们能看见,直接编辑的区域。对于一些新增的文件,如果没有被add到暂存区,就会以红色的形式放置在工作区。

暂存区

数据暂时存放的区域,对于add git版本控制的文件,就算是进入暂存区啦。可以理解为数据进入本地代码仓库之前存放的区域。由于还没对本地仓库生效,所以是数据暂时存放的区域。

对暂存区的文件修改后,会以蓝色的形式显示。如果第一次创建并add到暂存区的文件,由于远程仓库没有同步,所以会显示绿色。

注:存放在 ".git目录下" 下的index文件(.git/index)中

版本库

在暂存区commit的代码会被放入版本库中。可以理解为一个本地的代码仓库,push的时候,才会把版本库的数据全都发送到远程仓库中。

注:存放在工作区中“.git”目录下。

图片来源于网络

扩展阅读:

https://juejin.im/post/5b6c4eeff265da0f4d0da3fa

https://www.runoob.com/git/git-workspace-index-repo.html

1.2 涉及指令

1.2.1 分区转换指令

git add

数据从工作区转移至暂存区

git commit

数据从暂存区转移至版本库,也就是本地仓库

git push

数据从版本库中发送到远程仓库

指令太多?一张图就能记下~

1.2.2 分区对比指令

git diff

工作区与暂存区对比

git diff head

工作区与版本库对比

git diff --cached

暂存区与版本库对比

指令太多?一张图就能记下~

二、Git的原理

操作Git代码库前,一定要了解Git是怎么记录每次提交的代码变化的?换句话说,每一次commit在保证开发效率的前提下,都提交了什么?

2.1 git如何存储文件/目录信息

首先我们使用git init,初始化一个新的git项目。这个目录会在项目的根目录下创建.git的隐藏目录,相信大家都不陌生。

MacBook-Pro:wuya eleme$ git init
已初始化空的 Git 仓库于 /Users/eleme/wuya/.git/

 

然后查看一下.git的目录树

MacBook-Pro:wuya eleme$ tree -a
.
└── .git
├── HEAD
├── config
├── description
├── hooks
│ ├── applypatch-msg.sample
│ ├── commit-msg.sample
│ ├── fsmonitor-watchman.sample
│ ├── post-update.sample
│ ├── pre-applypatch.sample
│ ├── pre-commit.sample
│ ├── pre-push.sample
│ ├── pre-rebase.sample
│ ├── pre-receive.sample
│ ├── prepare-commit-msg.sample
│ └── update.sample
├── info
│ └── exclude
├── objects
│ ├── info
│ └── pack
└── refs
├── heads
└── tags

9 directories, 15 files

 

我们会发现,有一个叫Objects的目录。这个目录就是存储文件变化的核心。我们往工作区中存入一个测试文件a.md和一个test文件夹并查看objects发生的变化。

MacBook-Pro:wuya eleme$ echo 'test1' > a.md
MacBook-Pro:wuya eleme$ mkdir test
MacBook-Pro:wuya eleme$ echo 'test2' > test/b.md
MacBook-Pro:wuya eleme$ git add a.md test
MacBook-Pro:wuya eleme$ tree -a .git/objects
.git/objects
├── 18
│ └── 0cf8328022becee9aaa2577a8f84ea2b9f3827
├── 9d
│ └── aeafb9864cf43055ae93beb0afd6c7d144bfa4
├── info
└── pack

4 directories, 2 files

 

注意,文件夹放入到暂存区后,并不会马上在objects中显示,commit后才会。此时多了两个文件,其实就是修改过的两个文件以及修改内容。

Objects下存放的文件名就是根据SHA1算法哈希的“指纹”,为了能够在本仓库中和其他文件区分出来。文件内容就是Git将信息压缩后形成的二进制文件。

通过git cat-file [-t] [-p],可以看到Object的类型与文件的内容。

MacBook-Pro:wuya eleme$ git cat-file -t 9dae

blob

MacBook-Pro:wuya eleme$ git cat-file -p 9dae

test1

 

通过git hash-object a.md能够显示该文件在本仓库生成的hash值,与之前的目录树显示是对应的。

MacBook-Pro:wuya eleme$ git hash-object a.md

9daeafb9864cf43055ae93beb0afd6c7d144bfa4

 

2.2 git Object的类型

git Object有三种类型:

Blob

Tree

Commit

简单来说,文件都被存储为Blob类型,文件夹则为Tree类型,每次提交的节点被存储为Commit类型数据。因此,Git会以这三种类型来存储我们的文件。简单看下目录存储的映射关系:

初步猜想,如果把这些文件都commit到代码库,objects目录应该会有4个目录。即2个blob,1个tree,1个commit。

MacBook-Pro:wuya eleme$ git commit -a -m "加入到代码库中,观察objects目录变化"
[master(根提交) a16b538] 加入到代码库中,观察objects目录变化
2 files changed, 2 insertions(+)
create mode 100644 a.md
create mode 100644 test/b.md
MacBook-Pro:wuya eleme$ tree -a .git/objects
.git/objects
├── 18
│ └── 0cf8328022becee9aaa2577a8f84ea2b9f3827
├── 21
│ └── d0758079bdf2c8f7514687174454c804eb0c74
├── 9d
│ └── aeafb9864cf43055ae93beb0afd6c7d144bfa4
├── a1
│ └── 6b5382a9b646a7df8d21301391f29b2f7bfb65
├── a7
│ └── 6c93bb75184ef4b34c88a301c2351ae2219407
├── info
└── pack

7 directories, 5 files

 

然鹅事实却是....5个目录!多出的那一个是什么?一个一个输出看看。

MacBook-Pro:wuya eleme$ git cat-file -p 9dae
test1
MacBook-Pro:wuya eleme$ git cat-file -p 180c
test2
MacBook-Pro:wuya eleme$ git cat-file -p 21d0
100644 blob 180cf8328022becee9aaa2577a8f84ea2b9f3827 b.md
MacBook-Pro:wuya eleme$ git cat-file -p a16b
tree a76c93bb75184ef4b34c88a301c2351ae2219407
author eleme <xxxx@qq.com> 1576979515 +0800
committer eleme <xxxx@qq.com> 1576979515 +0800

加入到代码库中,观察objects目录变化
MacBook-Pro:wuya eleme$ git cat-file -p a76c
100644 blob 9daeafb9864cf43055ae93beb0afd6c7d144bfa4 a.md
040000 tree 21d0758079bdf2c8f7514687174454c804eb0c74 test

 

整理一下各自类型:

9dae-blob

180c-blob

21d0-tree

a16b-commit

a76c-tree

仔细一想其实也就通了,两个tree是git根目录和test目录。

可以得出这样一个结论:每一次commit,都会生成与之对应的commit hash值。查看历史commit也很容易得出这个结论:

扩展阅读:

https://mp.weixin.qq.com/s/d4WA02Y22gdWRbmmwfPEHQ

三、Git分支

3.1 初探Git分支

在学习Git分支之前,还是从git的目录树入手。

MacBook-Pro:wuya eleme$ tree -a .git
.git
├── ......
├── HEAD
└── refs
├── heads
│ └── master
├── remotes
│ └── origin
│ └── HEAD
└── tags

 

不难看出refs目录就是用来记录当前对分支的引用信息,包括本地分支,远程分支,标签。

heads记录的是本地所有分支,remotes和HEAD一样,指向对应的某个远程分支。

MacBook-Pro:wuya eleme$ cat .git/refs/heads/master
a16b5382a9b646a7df8d21301391f29b2f7bfb65

 

细心些就会发现,这个hash值就是commit节点的hash值。

而HEAD就是存储当前在哪个本地分支。查看其内容,可以发现:

MacBook-Pro:.git eleme$ cat HEAD

ref: refs/heads/master

 

也就意味着,我们在本地的master上。除此之外,还可以通过git branch来创建其他分支。

MacBook-Pro:.git eleme$ git branch feature/dev

MacBook-Pro:.git eleme$ git branch feature/wuya

 

切换到其他分支并查看分支信息:

elemedeMacBook-Pro:wuya eleme$ git checkout feature/dev
切换到分支 'feature/dev'
elemedeMacBook-Pro:wuya eleme$ git branch -vv
* feature/dev a16b538 加入到代码库中,观察objects目录变化
feature/wuya a16b538 加入到代码库中,观察objects目录变化
master a16b538 加入到代码库中,观察objects目录变化

 

因此可知分支当前的指针指向最近一次commit的节点。通过谁创建的分支,就沿用谁的指针。注:未被放入代码库的文件会在分支切换时被抛弃,造成严重后果。

3.2 分支的合并

分支的合并有两种方式,merge和rebase。

相同点:都是从一个分支获取并合并到当前分支。

merge:自动创建一个新的commit,如果遇到冲突,仅需要修改后重新commit。

每次都记录了真实详细的commit,但是在commit频繁的时候,会看到分支比较乱。比如这样,全是merge产生的节点:

rebase:找公共的节点,直接合并之前commit历史。

这样能得到简洁的分支发展历史,去掉了merge commit。但是如果合并时出现了问题,没有留下痕迹,不好定位。

git rebase --abort:遇到冲突时放弃合并,回到rebase操作之前的状态。

git rebase --continue:合并冲突,结合"git add 文件"命令一起,一步一步地解决冲突。

git rebase --skip:将引起冲突的commits丢弃掉。

小例子

这里引用一个网上归纳的git rebase工作流:

git rebase
while(存在冲突) {
//找到当前冲突文件,编辑解决冲突
git status
git add -u
git rebase --continue
if( git rebase --abort )
break;
}

 

注:最好不要在公共分支上使用rebase,如果前后基本上不会有别人改动你的分支,那么推荐rebase。

扩展阅读:

https://blog.csdn.net/chenansic/article/details/44122107

3.3 分支的冲突

冲突的产生

冲突是从合并的时候产生的。git分支的合并,其实就是tree和tree的合并。我们在feature/dev上执行git merge master时。git会先找到这两个分支是从哪个指针创建出来的,称之为“merge base”。然后检查这两次的tree是否一致,如果不一致说明一定有文件发生了修改。接下来,对于某一个文件来说,分几种情况:

文件在节点6,节点3,merge base中的hash值都相同。说明没有被修改过。不会有冲突。

文件在节点6和merge base或者节点3和merge base的hash值相同时,此时直接更新文件的变化。

文件在节点6,merge request,master上的hash值都不同,冲突就产生了。

此时就需要开发人员商定,解决冲突。

四、版本的回滚

如果想要版本回退,就离不开reset和revert。

4.1 revert

这个就一目了然了,执行git revert后,将回退到上一个commit的版本。

4.2 reset

前段时间,线上出了好多空指针的bug,当我查看日志定位到某一代码行时,发现该行定位不到对应的方法中。这时候就必须切换到线上的代码版本进行排查了。

git reset分为三种模式:

soft

mixed

hard

由于每一次的commit都会产生与之对应的hash值,所以借助这个进行重置就轻松多了。

git reset --hard commit的hash值

会重置暂存区和工作区,完全重置为指定的commit节点。当前分支没有commit的代码必然会被清除。

git reset --soft commit的hash值

会保留工作目录,并把指定的commit节点与当前分支的差异都存入暂存区。也就是说,没有被commit的代码也能够保留下来。

git reset commit的hash值

不带参数,也就是mixed模式。将会保留工作目录,并且把工作区,暂存区以及与reset的差异都放到工作区,然后清空暂存区。因此执行后,只要有所差异,文件都会变成红色,变得难以区分。

一般情况下,我们使用soft模式,既能保留暂存区,又能reset到某个分支。

五、代码暂存

当我们在当前分支工作时,不得已需要切换到其他分支处理事情而不想commit时(如果commit多了,会污染log),可以使用git stash 将那些数据都暂存到Git提供的栈中。用法很简单~

git stash

暂存修改过的代码,保存在Git栈中,然后将工作区还原成上一次commit的内容。

MacBook-Pro:young eleme$ git stash

保存工作目录和索引状态 WIP on wuya: 82371a5 上一次commit写的message

 

git stash list

显示之前压栈的所有记录。

MacBook-Pro:young eleme$ git stash list
stash@{0}: WIP on aaa: 82371a5 上一次commit写的message

 

git stash clear

清空Git栈。

git stash apply

从Git栈中读取上一次暂存的那些代码,恢复工作区。

MacBook-Pro:young eleme$ git stash apply
位于分支 wuya
您的分支与上游分支 'origin/wuya' 一致。

尚未暂存以备提交的变更:
(使用 "git add <文件>..." 更新要提交的内容)
(使用 "git checkout -- <文件>..." 丢弃工作区的改动)

修改: src/main/java/com/young/test/test1.java

修改尚未加入提交(使用 "git add" 和/或 "git commit -a")

 

 
   
次浏览       
相关文章

每日构建解决方案
如何制定有效的配置管理流程
配置管理主要活动及实现方法
构建管理入门
相关文档

配置管理流程
配置管理白皮书
CM09_C配置管理标准
使用SVN进行版本控制
相关课程

配置管理实践
配置管理方法、工具与应用
多层次集成配置管理
产品发布管理

最新活动计划
SysML和EA系统设计与建模 1-16[北京]
企业架构师(业务、应用、技术) 1-23[北京]
大语言模型(LLM)Fine Tune 2-22[在线]
MBSE(基于模型的系统工程)2-27[北京]
OpenGauss数据库调优实践 3-11[北京]
UAF架构体系与实践 3-25[北京]
 
 
最新文章
git原理图解
Git分支管理实践
Git学习和项目应用实例
Git 天天用 但是 Git 原理你了解吗?
对比 Git 与 SVN,这篇讲的很易懂
最新课程
Git版本控制系统
配置管理与持续集成实践
配置管理方法、实践、工具与应用
持续集成与敏捷开发
配置管理实践(从组织级到项目级)
更多...   
成功案例
某单位研发中心 产品集成与服务平台
某电子制造商 配置管理与持续集成
北京 配置管理与持续集成实践
金雅拓 分布式持续集成工具链
北京 持续集成测试最佳实践
更多...