在Git内部原理之Git对象哈希中,讲解了Git对象hash的原理,接下来的这篇文章讲一讲Git对象如何存储。
原理
数据对象、树对象和提交对象都是存储在.git/objects目录下,目录的结构如下:
- .git
- |-- objects
- |-- 01
- | |-- 55eb4229851634a0f03eb265b69f5a2d56f341
- |-- 1f
- | |-- 7a7a472abf3dd9643fd615f6da379c4acb3e3a
- |-- 83
- |-- baae61804e65cc73a7201a7252750c76066a30
从上面的目录结构可以看出,Git对象的40位hash分为两部分:头两位作为文件夹,后38位作为对象文件名。所以一个Git对象的存储路径规则为:
- .git/objects/hash[0, 2]/hash[2, 40]
这里就产生了一个疑问:为什么Git要这么设计目录结构,而不直接用Git对象的40位hash作为文件名?原因是有两点:
在Git内部原理之Git对象哈希中,我们知道Git对象会在原内容前加个一个头部:
- store = header + content
Git对象在存储前,会使用zlib的deflate算法进行压缩,即简要描述为:
- zlib_store = zlib.deflate(store)
压缩后的zlib_store按照Git对象的路径规则存储到.git/objects目录下。
总结下Git对象存储的算法步骤:
Nodejs实现
接下来,我们使用Nodejs来实现git hash-object -w的功能,即计算Git对象的hash值并存储到Git文件系统中:
- const fs = require('fs')
- const crypto = require('crypto')
- const zlib = require('zlib')
- function gitHashObject(content, type) {
- // 构造header
- const header = `${type} ${Buffer.from(content).length}\0`
- // 构造Git对象
- const store = Buffer.concat([Buffer.from(header), Buffer.from(content)])
- // 计算hash
- const sha1 = crypto.createHash('sha1')
- sha1.update(store)
- const hash = sha1.digest('hex')
- // 压缩Git对象
- const zlib_store = zlib.deflateSync(store)
- // 存储Git对象
- fs.mkdirSync(`.git/objects/${hash.substring(0, 2)}`)
- fs.writeFileSync(`.git/objects/${hash.substring(0, 2)}/${hash.substring(2, 40)}`, zlib_store)
- console.log(hash)
- }
- // 调用入口
- gitHashObject(process.argv[2], process.argv[3])
***,测试下能否正确存储Git对象:
- $ node index.js 'hello, world' blob
- 8c01d89ae06311834ee4b1fab2f0414d35f01102
- $ git cat-file -p 8c01d89ae06311834ee4b1fab2f0414d35f01102
- hello, world
由此可见,我们生成了一个合法的Git数据对象,证明算法是正确的。
自15年前共同创立身份管理公司SailPoint以来,该公司首席执行官Mark McClain了解...
站在行业的角度,这两年间,智慧城市也有着不小的变化。 在人们越来越广泛达成的...
随着《长江三角洲区域一体化发展规划纲要》审议通过,长三角一体化高质量发展再...
全球领先的存储解决方案提供商希捷科技(NASDAQ:STX)日前在北京举办 数能怒放从...
Web 开发中的 cookie 是什么? cookie 是后端可以存储在用户浏览器中的小块数据。...
在欧洲地区,德国云服务器的租用是相当热门的,因为德国是老牌发达国家,网络发...
HBase概述 HBase是一个分布式存储、数据库引擎,可以支持千万的QPS、PB级别的存...
随着云计算的发展,网站服务器租用价格的普通降低,越来越多的企业和个人站长开...
预算、人才储备、网络威胁现在和不久的将来,技术领导者及其团队都将面临诸多挑...
随着数据中心快速发展以更低的延迟处理更多数据,AEC(建筑、工程和施工)行业迎来...