赞
踩
Git是如今最受欢迎的分布式版本控制系统,可以帮助开发者有效地追踪和管理源代码历史。然而,有时,敏感信息,例如密码、API密钥或别的密文,可能误以为是普通的代码添加到版本库中,这在开源项目中是个常见问题,可能会导致严重的隐私和安全问题。
这种状况下,你可能想要从Git历史数据中彻底删除这些敏感信息。在这个过程中,BFG Repo-Cleaner就发挥了重要作用。BFG是一个工具,比git-filter-branch更快、更简单,专为清理你的Git Repositor而设计。
BFG拿来就可以使用,它更加效率,并且有一个合理的安全模式。它能快速录取历史提交,查找和修改指定文件或文件类型,然后再自动清理和最小化Git存储库。
下面就是一些简单的步骤,可以帮助你使用BFG清理敏感信息:
步骤一:安装BFG Repo-Cleaner
你可以在你的机器上使用以下命令安装BFG:
$ brew install bfg
或者,你也可以从BFG的GitHub页面下载.jar文件。
步骤二:克隆一个裸存储库
假设你的项目存储库地址为:https://github.com/username/myrepo.git ,使用以下命令生成裸存储库:
$ git clone --mirror https://github.com/username/myrepo.git
这将在你的当前目录下创建一个 myrepo.git
目录。记住,这是一个裸存储库,你不会在其中看到通常的工作目录文件。
步骤三:运行BFG来清除数据
接下来,我们将具体操作BFG来清除已知的敏感文件。使用以下命令:
$ bfg --delete-files mysecrets.txt myrepo.git
其中,mysecrets.txt
是你想要从所有Git历史记录中删除的文件。
步骤四:清洗你的存储库
现在,删除所有标签(引用)到你的旧提交:
- $ cd myrepo.git
- $ git reflog expire --expire=now --all && git gc --prune=now --aggressive
这会清理你的存储库并从中删除所有的旧提交。
步骤五:推送清洗后的存储库
最后,你可以把清洗过的存储库推送回远端:
$ git push --all
请注意,这会覆盖你远端的Git历史,所以在推送之前,确保其他人都已经拉取了最新的更改,以防他们在你删除历史之后又重新推送它回去。
在上述所有步骤中,一个值得注意的细节是,尽管BFG可以删除文件或文本,但它不会修改你的最新提交,这意味着如果敏感数据存在于你最近的提交之中,你需要手动删除,在这之后再运行BFG。
通过使用BFG Repo-Cleaner,你可以确保你的Git历史记录自由于敏感数据,而不需要为手动清理每一个提交而烦恼。不仅如此,BFG的效率极高,对于大型的存储库和长期的提交历史,其表现出色,即使在处理数万个提交和GB级别的数据时,也能快速和有效的清理Git历史。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。