当前位置:   article > 正文

使用Git子模块和开发模式管理Python项目_python的common_lib

python的common_lib

目录

挑战

什么是开发模式?

什么是Git子模块?

设置项目

设置commonlib的Git存储库

设置myproj的Git存储库

设置Git子模块

将存储库添加为子模块

更新子模块

使用Git子模块设置开发模式

工作流

设置阶段

工作阶段

结论


作为一个软件工程师,我们在一个依赖于另一个同时也在工作的项目上工作的情况并不少见。场景可能如下:

我们有两个项目,每个项目都有其Git存储库:

  • 例如commonlib,许多项目使用的通用库。该库是独立的,并具有其测试套件和文档。
  • myproj是依赖commonlib的项目。

当我们在myproj上工作时,我们可能还需要同时进行更新commonlib。如果commonlibmyproj同时碰巧是Python项目,我们可以使用安装工具(setuptools)发展模式(开发模式)和Git的子模块(子模块),使工作更容易。本文演示了如何使用开发模式和子模块来处理这种情况。希望需要处理此类示例的人员可以发现本文有所帮助。

commonlibmyproj在本文的其余部分用作示例,并且该示例假定代码在具有以下条件的虚拟环境中运行:

  • Ubuntu 18.04
  • Python 3.7
  • Git 2.17

挑战

首先,对于Python项目开发,我们通常首先设置一个虚拟环境,并将所有依赖项安装到虚拟环境中。然后,在这种情况下,我们开始进行myproj项目。但是,myproj需要commonlib,我们也在同一时间对其进行处理。如果commonlib以正常方式安装,例如,pip install,我们将无法使用Git来跟踪commonlib的更改。这是开发模式来解决的问题。

其次,commonlib被许多项目使用,包括myproj。一方面,在开发过程中,myproj可能需要坚持使用commonlib的特定版本或分支。另一方面,其他项目可能需要不同版本的commonlib。另外,为了确保在处理myproj时使用正确的commonlib分支或版本,可以将依赖项设置为Git子模块。

什么是开发模式?

开发模式允许安装和编辑项目。

通常,我们从PyPi上安装Python包。

$ pip install <package_name>  

或者,我们从本地软件包安装它。

$ pip install <path_to_local_archive>  

无论哪种方式,软件包都将安装到我们的(虚拟)环境中。例如,当我们将Python软件包安装到虚拟环境中时,该软件包将被复制到/virtual_environment/lib/python3.7/site-packages/。如果要安装commonlib到虚拟环境中,可以执行以下操作:

  1. $ git clone https://github.com/shunsvineyard/commonlib.git
  2. $ pip install commonlib/

安装后,commonlib将在site-packages文件夹中显示为已安装的软件包。我们可以使用ls命令来检查它。例如,结果可能如下所示:

  1. (demo_env) shunsvineyard@remote-ubuntu:~$ ls -l demo_env/lib/python3.7/site-packages/
  2. total 40
  3. drwxrwxr-x 2 shunsvineyard shunsvineyard 4096 Dec 23 05:00 __pycache__
  4. drwxrwxr-x 3 shunsvineyard shunsvineyard 4096 Dec 23 05:01 commonlib
  5. drwxrwxr-x 2 shunsvineyard shunsvineyard 4096 Dec 23 05:01 commonlib-0.0.1.egg-info
  6. -rw-rw-r-- 1 shunsvineyard shunsvineyard 126 Dec 23 05:00 easy_install.py
  7. drwxrwxr-x 11 shunsvineyard shunsvineyard 4096 Dec 23 05:00 pip
  8. drwxrwxr-x 2 shunsvineyard shunsvineyard 4096 Dec 23 05:00 pip-9.0.1.dist-info
  9. drwxrwxr-x 5 shunsvineyard shunsvineyard 4096 Dec 23 05:00 pkg_resources
  10. drwxrwxr-x 2 shunsvineyard shunsvineyard 4096 Dec 23 05:00 pkg_resources-0.0.0.dist-info
  11. drwxrwxr-x 6 shunsvineyard shunsvineyard 4096 Dec 23 05:00 setuptools
  12. drwxrwxr-x 2 shunsvineyard shunsvineyard 4096 Dec 23 05:00 setuptools-39.0.1.dist-info

开发模式会创建一个从程序包到虚拟环境的链接。在开发模式下,可以以允许我们在安装后编辑代码的方式安装Python软件包。因此,当我们对代码进行任何更改时,该更改将在虚拟环境中立即生效。

要将Python软件包安装为开发模式,请使用以下命令

$ pip install -e <path to the package>  

commonlib为例,结果可能如下所示:

 

  1. (demo_env) shunsvineyard@remote-ubuntu:~$ pip install -e commonlib/
  2. Obtaining file:///home/shunsvineyard/commonlib
  3. Installing collected packages: commonlib
  4. Running setup.py develop for commonlib
  5. Successfully installed commonlib
  6. (demo_env) shunsvineyard@remote-ubuntu:~$ ls -l demo_env/lib/python3.7/site-packages/
  7. total 40
  8. drwxrwxr-x 2 shunsvineyard shunsvineyard 4096 Dec 23 05:08 __pycache__
  9. -rw-rw-r-- 1 shunsvineyard shunsvineyard 31 Dec 23 05:09 commonlib.egg-link
  10. -rw-rw-r-- 1 shunsvineyard shunsvineyard 30 Dec 23 05:09 easy-install.pth
  11. -rw-rw-r-- 1 shunsvineyard shunsvineyard 126 Dec 23 05:08 easy_install.py
  12. drwxrwxr-x 11 shunsvineyard shunsvineyard 4096 Dec 23 05:08 pip
  13. drwxrwxr-x 2 shunsvineyard shunsvineyard 4096 Dec 23 05:08 pip-9.0.1.dist-info
  14. drwxrwxr-x 5 shunsvineyard shunsvineyard 4096 Dec 23 05:08 pkg_resources
  15. drwxrwxr-x 2 shunsvineyard shunsvineyard 4096 Dec 23 05:08 pkg_resources-0.0.0.dist-info
  16. drwxrwxr-x 6 shunsvineyard shunsvineyard 4096 Dec 23 05:08 setuptools
  17. drwxrwxr-x 2 shunsvineyard shunsvineyard 4096 Dec 23 05:08 setuptools-39.0.1.dist-info

如果打开文件commonlib.egg-link,我们将看到它链接到的位置。例如,

  1. (demo_env) shunsvineyard@remote-ubuntu:~$ cat demo_env/lib/python3.7/site-packages/commonlib.egg-link
  2. /home/shunsvineyard/commonlib

请注意,开发模式仅适用于本地项目或VCS URL。如果我们尝试以开发模式从PyPi安装软件包,则会显示以下错误消息。使用numpy为例,

  1. $ pip install -e numpy
  2. numpy should either be a path to a local project or a VCS url beginning with svn+, git+, hg+, or bzr+

什么是Git子模块?

Git子模块是另一个Git存储库中的Git存储库。就像一个Git存储库引用了另一个Git存储库一样。例如,myprojcommonlib有依赖。如果commonlibmyprojGit子模块,下图说明了它们之间的关系。  

Git子模块允许我们将Git存储库保留为另一个Git存储库的子目录。当我们执行git clone myproj时,Myproj子模块引用commonlib中定义的的特定版本将从commonlib存储库下载。这样,我们可以将另一个存储库(即commonlib)克隆到我们的项目(即myproj)中,并使提交分开。

以下各节以commonlibmyproj作为示例来演示开发模式和子模块的设置和工作流程。以下各节还假设我们从头开始做所有事情,包括设置Git存储库。

设置项目

假设commonlib提供了一个非常简单且唯一的功能:greeting。项目布局和代码如下所示:

  1. commonlib/
  2. ├── LICENSE
  3. ├── README.rst
  4. ├── commonlib
  5. │ ├── __init__.py
  6. │ └── greeting.py
  7. └── setup.py

greeting.py

  1. def greeting(name: str):
  2. """Print a simple greeting with the name."""
  3. print(f"Howdy, {name}")

setup.py

  1. import pathlib
  2. import setuptools
  3. # The directory containing this file
  4. HERE = pathlib.Path(__file__).parent
  5. # The text of the README file
  6. README = (HERE / "README.rst").read_text()
  7. # This call to setup() does all the work
  8. setuptools.setup(
  9. name="commonlib",
  10. version="0.0.1",
  11. description="A simple Python package",
  12. long_description=README,
  13. long_description_content_type="text/x-rst",
  14. author="Author Name",
  15. author_email="author@email.com",
  16. license="MIT",
  17. classifiers=[
  18. "License :: OSI Approved :: MIT License",
  19. "Programming Language :: Python"
  20. ],
  21. packages=setuptools.find_packages(),
  22. python_requires=">=3.7"
  23. )

commonlib的完整示例可以在https://github.com/shunsvineyard/commonlib找到)

现在,我们准备设立两个Git仓库commonlibmyproj。在此之前,我们需要设置一个Git服务器。此示例使用本地主机(即127.0.0.1)作为Git服务器。

  1. $ sudo useradd git
  2. $ sudo passwd git
  3. $ su git
  4. $ cd ~
  5. $ git init --bare commonlib
  6. $ git init --bare myproj

设置commonlibGit存储库

拥有Git服务器之后,我们可以将现有commonlib服务器添加到Git服务器中。返回到本地用户。

  1. user:~$ cd commonlib/
  2. user:~/commonlib$ git init
  3. user:~/commonlib$ git add –all
  4. user:~/commonlib$ git commit -a -m "Initialize commonlib repository"
  5. user:~/commonlib$ git remote add origin git@127.0.0.1:commonlib
  6. user:~/commonlib $ git push -u origin master

设置myprojGit存储库

对于myproj,我们可以做类似commonlib的事情。项目布局和代码如下:

  1. myproj/
  2. ├── LICENSE
  3. ├── README.rst
  4. ├── app.py
  5. └── setup.py

app.py

  1. from commonlib import greeting
  2. def run():
  3. greeting.greeting("Git Submodule")
  4. if __name__ == "__main__":
  5. run()

setup.py

  1. import pathlib
  2. import setuptools
  3. # The directory containing this file
  4. HERE = pathlib.Path(__file__).parent
  5. # The text of the README file
  6. README = (HERE / "README.rst").read_text()
  7. # This call to setup() does all the work
  8. setuptools.setup(
  9. name="myproj",
  10. version="0.0.1",
  11. description="A simple Python project",
  12. long_description=README,
  13. long_description_content_type="text/x-rst",
  14. url="https://github.com/shunsvineyard/myproj",
  15. author="Author Name",
  16. author_email="author@email.com",
  17. license="MIT",
  18. classifiers=[
  19. "License :: OSI Approved :: MIT License",
  20. "Programming Language :: Python"
  21. ],
  22. packages=setuptools.find_packages(),
  23. python_requires=">=3.7"
  24. )

然后,将现有代码添加到Git服务器。

  1. user:~$ cd myproj/
  2. user:~/myproj$ git init
  3. user:~/myproj$ git add –all
  4. user:~/myproj$ git commit -a -m "Initialize myprojrepository"
  5. user:~/myproj$ git remote add origin git@127.0.0.1: myproj
  6. user:~/myproj$ git push -u origin master

设置Git子模块

尽管Git子模块为各种情况提供了许多功能,但使用最多的两个用例是:1.将存储库添加为子模块;以及2.更新子模块。

将存储库添加为子模块

通过以下命令可以简单地将现有存储库添加为另一个存储库的子模块:

  1. user:~$ cd myproj/
  2. user:~/myproj$ git submodule add git@127.0.0.1:commonlib
  3. user:~/myproj$ git submodule init
  4. user:~/myproj$ git commit -a -m "Add commonlib as submodule"
  5. user:~/myproj$ git push

添加子模块后,将创建一个子模块引用,即.gitmodules文件。它看起来可能如下所示:

  1. shunsvineyard@remote-ubuntu:~/workspace/myproj$ ls -al
  2. total 40
  3. drwxrwxr-x 4 shunsvineyard shunsvineyard 4096 Dec 20 07:20 .
  4. drwxrwxr-x 10 shunsvineyard shunsvineyard 4096 Dec 20 06:47 ..
  5. drwxrwxr-x 9 shunsvineyard shunsvineyard 4096 Dec 20 07:22 .git
  6. -rw-rw-r-- 1 shunsvineyard shunsvineyard 1233 Dec 20 06:44 .gitignore
  7. -rw-rw-r-- 1 shunsvineyard shunsvineyard 73 Dec 20 07:20 .gitmodules
  8. -rw-rw-r-- 1 shunsvineyard shunsvineyard 1067 Dec 20 06:44 LICENSE
  9. -rw-rw-r-- 1 shunsvineyard shunsvineyard 278 Dec 20 06:58 README.rst
  10. -rw-rw-r-- 1 shunsvineyard shunsvineyard 123 Dec 20 06:57 app.py
  11. drwxrwxr-x 3 shunsvineyard shunsvineyard 4096 Dec 20 07:20 commonlib
  12. -rw-rw-r-- 1 shunsvineyard shunsvineyard 724 Dec 20 06:57 setup.py

如果打开文件.gitmodules,我们可以看到它记录了子模块的信息。

  1. $ cat .gitmodules
  2. [submodule "commonlib"]
  3. path = commonlib
  4. url = git@127.0.0.1:commonlib

注意:.gitmodules中的子模块的url可以是相对路径。例如,commonlibmyproj都位于Git服务器的同一文件夹中。url可以简化为../commonlib

如果我们使用Github托管我们的存储库,则子模块可能如下所示:

(示例myproj可以在https://github.com/shunsvineyard/myproj上找到)

更新子模块

通常,在两种情况下,我们可能需要更新子模块:1.由于某些代码更改,因此更新了子模块。2.将子模块更新为较新的或特定的版本。

情况1:由于代码更改而更新子模块

子模块只是另一个Git存储库中的一个Git存储库。当我们在子模块上进行一些代码更改时,我们将执行与通常在常规Git存储库上相同的操作。

例如,我们添加了一个调用greeting2commonlib的新功能。

greeting.py

  1. def greeting2(name: str):
  2. """Print a simple greeting with the name."""
  3. print(f"How are you, {name}?")

我们对子模块执行的操作与常规存储库相同:提交更改并推送更改。

  1. user:~$ cd myproj/commonlib
  2. user:~/myproj/commonlib$ git status
  3. On branch master
  4. Your branch is up to date with 'origin/master'.
  5. Changes not staged for commit:
  6. (use "git add <file>..." to update what will be committed)
  7. (use "git checkout -- <file>..." to discard changes in working directory)
  8. modified: greeting.py
  9. no changes added to commit (use "git add" and/or "git commit -a")
  10. user:~/myproj/commonlib$ git commit -a -m "Added a new greeting function."
  11. user:~/myproj/commonlib$ git push

提交并推送子模块的更改后,我们可以看到主项目的子模块引用,即myproj,也已更改,然后我们可以做同样的事情来更新引用。然后,myproj将附加较新的commonlib

  1. user:~/myproj/commonlib$ cd ../
  2. user:~/myproj$ git status
  3. On branch master
  4. Your branch is up to date with 'origin/master'.
  5. Changes not staged for commit:
  6. (use "git add <file>..." to update what will be committed)
  7. (use "git checkout -- <file>..." to discard changes in working directory)
  8. modified: commonlib (new commits)
  9. no changes added to commit (use "git add" and/or "git commit -a")
  10. user:~/myproj$ git commit -a -m "Update submodule, commonlib"
  11. user:~/myproj$ git push

情况2:将子模块更新为较新的或特定的版本

当其他人修改commonlib或添加了新功能时,我们可能需要将commonlib子模块更新为较新的版本。

例如,有人就加了一个新的功能greeting3commonlib

greeting.py

  1. def greeting3():
  2. """Print a simple greeting with the name."""
  3. print("How's going?")

提交哈希7735cf8460acd03f92e7c0529486c86ec83b2c0e如下所示。

  1. user2:~$ git clone git@127.0.0.1:commonlib
  2. user2:~$ cd commonlib
  3. user2:~/commonlib$ vim commonlib/greeting.py # add greeting3 function as the following
  4. user2:~/commonlib$ git commit -a -m "Added greeting3 function."
  5. user2:~/commonlib$ git push
  6. user2:~/commonlib$ git log
  7. commit 7735cf8460acd03f92e7c0529486c86ec83b2c0e (HEAD -> master, origin/master, origin/HEAD)
  8. Author: user2 <user2@email.com>
  9. Date: Sun Dec 22 00:27:09 2019 +0000
  10. Added greeting3 function.

我们将子模块更新为较新版本或特定版本的方法是更新子模块指向的提交哈希。

Git子模块官方文档说:子模块存储库处于指向特定提交的分离HEAD状态。更改提交仅涉及签出其他标签或提交,然后将更改添加到父存储库。

以下是更新子模块以提交的示例hash7735cf8460acd03f92e7c0529486c86ec83b2c0e

  1. user:~/myproj$ cd commonlib
  2. user:~/myproj/commonlib$ git pull
  3. user:~/myproj/commonlib$ git checkout 7735cf8460acd03f92e7c0529486c86ec83b2c0e
  4. Note: checking out '7735cf8460acd03f92e7c0529486c86ec83b2c0e'.
  5. You are in 'detached HEAD' state. You can look around, make experimental
  6. changes and commit them, and you can discard any commits you make in this
  7. state without impacting any branches by performing another checkout.
  8. If you want to create a new branch to retain commits you create, you may
  9. do so (now or later) by using -b with the checkout command again. Example:
  10. git checkout -b <new-branch-name>
  11. HEAD is now at 7735cf8 Added greeting3 function.
  12. user:~/myproj/commonlib$ cd ..
  13. user:~/myproj$ git status
  14. On branch master
  15. Your branch is up to date with 'origin/master'.
  16. Changes not staged for commit:
  17. (use "git add <file>..." to update what will be committed)
  18. (use "git checkout -- <file>..." to discard changes in working directory)
  19. modified: commonlib (new commits)
  20. no changes added to commit (use "git add" and/or "git commit -a")
  21. user:~/myproj$ git commit -a -m "Update submodule, commonlib, to the newer one."
  22. user:~/myproj$ git push

使用Git子模块设置开发模式

开发模式是安装工具(setuptools)提供的功能,因此与编写用于打包Python项目的setup.py没什么不同。但是,当一个Python项目中有另一个Python项目作为子模块,而我们想将该子模块安装为开发模式时,则需要将该子模块添加到主项目的requirements.txt文件中。例如,myprojrequirements.txt可以是以下内容。

  1. # Install commonlib as development mode
  2. -e ./commonlib # Path to the submodule

因此,当我们安装myproj的依赖项时,commonlib将自动安装为开发模式。

工作流

当我们处理包含多个较小项目的大项目时,会同时需要同时处理主项目及其从属项目。在这种情况下,我们通常与其他团队一起工作。针对这种情况的建议工作流程分为两个阶段:设置阶段和工作阶段。

设置阶段

此阶段准备代码和工作环境。

1.创建一个虚拟环境

2.使用 --recurse-submodules下载源代码。--recurse-submodules将下载所有子模块。

$ git clone --recurse-submodules <URL_to_the_repository>

3.签出分支。通常,当我们处理某个功能或修复错误时,我们将为该工作创建一个分支。我们应该避免直接与master(或develop)分支工作。关于此的更多信息可以在https://guides.github.com/introduction/flow/找到

$ git checkout <branch_name>

4.将依赖项安装到虚拟环境中。

$ pip install -r requirements.txt

工作阶段

这一阶段表明我们正努力解决我们的问题。除了代码更改外,还有两种情况需要修改子模块。

情况1:如果我们需要对子模块进行一些代码更改:

  1. 创建此更改的分支,并为子模块代码更改创建pull请求(PR)。
  2. PR被批准并且分支合并之后,将子模块更新为PR刚刚合并的提交。

情况2:某人更新了一个存储库,这是我们的子模块,我们想将该子模块更新为较新的提交:

  1. git pull在子模块文件夹上使用进行更改。
  2. 将子模块的提交哈希更新为所需的哈希。
  3. cd 到主项目并提交子模块的更改

结论

当我们同时从事多个相关项目时,很容易出错。当我们必须在这种情况下工作时,开发模式和子模块提供了一种管理项目的简便方法。一开始使用开发模式和子模块可能并不容易。但是一旦我们熟悉了它的使用,开发模式和子模块的结合不仅可以防止我们犯错误,而且可以提高生产率。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/530031
推荐阅读
相关标签
  

闽ICP备14008679号