本文共 4145 字,大约阅读时间需要 13 分钟。
最近 NPM 圈发生了“一个 17 行代码的模块引发的血案”。 工具模块被作者从 NPM 上撤下,所有直接或者间接依赖这个模块的 NPM 包就忧伤的挂掉了,包括 babel 这样的热门项目。
而其中的原因大概是这样:作者 Azer 写了一个叫 的工具和某个公司同名了,这天公司的律师要求其删掉这个模块,把 kik 这个名字“让”给他们,作者不答应,律师就直接找 NPM 了,而 NPM 未经作者同意就把包的权限转移给了这家公司。于是,Azer 一怒冲冠,将他所有的 NPM 包全部删掉了。
我们不打算讨论这件事中的价值观、自由之精神、法律细节等等,我只想站在一个程序员的角度来凑个热闹,聊聊看法。
有人会觉得就这几行函数有必要单独抽取成一个模块吗?我觉得有必要,原因如下:
所以,NPM 一直提倡和推动的 small module 的理念并没有什么错,我们不应该因为这个事件就把各种“小模块”的依赖从自己项目中去掉,甚至自己也不写“小模块”了。
如果我们真想构建稳定的应用,非常重要的一点就是“不要将自己的全部身家都拴在别人的裤腰带”上,你永远不知道那个别人什么时候会“扑街”。其实在代码实现中,我们一直都被教导要小心强依赖,依赖过强会导致我们不够灵动。“牵一发而动全身”是很可怕的一件事。
具体到 Node 模块的依赖这件事上,太依赖他人会有些什么“可怕”的事情?
~a.b.c
这种表示法(意思是小版本我都要),这表示每次 npm install 时其实获取到的模块依赖很可能是和你测试后发布的版本不一致的(依赖模块频繁发布了新的小版本),心里慌慌的。注:对 3、4 有疑问的可以查看:
是不是有点“细思极恐”?那这里抛出一个解决方案。如果有更好的方案,欢迎讨论。
先来列出我们需要些什么:
冻结依赖模块的版本号最简单的办法就是直接在 package.json 里面写死版本号,但是这解决不了深度依赖的问题。我们来看个例子。
假设有下面这样的依赖:
A@0.1.0└─┬ B@0.0.1 └── C@0.0.1
A 模块依赖了 B 模块,B 模块又依赖了 C 模块。我们可以将 B 模块的依赖写死成 0.0.1
版本,但是如果 B 模块对 C 模块的依赖写的是 C: ~0.0.1
,会怎样?
这时候 C 模块更新到了 0.0.2
版本,虽然我们安装的 B 模块是 B@0.0.1
,但是安装的 C 模块却是 C@0.0.2
。如果不巧这个 C@0.0.2
刚好有 bug,那我们的模块很有可能就不能正常工作了。
实际上,NPM 提供了一个叫做 npm shrinkwrap
的命令来解决这个问题:
NAME npm-shrinkwrap -- Lock down dependency versionsSYNOPSIS npm shrinkwrapDESCRIPTION This command locks down the versions of a package's dependencies so that you can control exactly which versions of each dependency will be used when your package is installed.
这条命令会根据目前我们 node_modules
目录下的模块来生成一份“冻结”住的模块依赖(npm-shrinkwrap.json)。
还是上面的例子,我们在模块 A 的根目录执行 npm shrinkwrap
后,生成的 npm-shrinkwrap.json
文件内容大概是下面这样:
{ "name": "A", "dependencies": { "B": { "version": "0.0.1", "resolved": "http://registry.npmjs.com/B-0.0.1.tgz", "dependencies": { "C": { "version": "0.0.1", "resolved": "http://registry.npmjs.com/C-0.0.1.tgz" } } } }}
然后,当我们执行 npm install
时,依赖查找的“来源”不再是 package.json
,而是我们生成的 npm-shrinkwrap.json
,再也不会突然装上什么 C@0.0.2
了,依赖里面的模块版本都是我们验证、测试后的版本,让人安心。
注:npm shrinkwrap
默认只会生成 dependencies
的依赖,不会生成 devDependencies
的依赖,如果你真的需要,可以加 --dev
参数。
我们解决了依赖模块版本号的问题,但是每次安装时其实还是会去 NPM 的 registry 获取模块的 tgz 包然后进行安装。我们需要将这些依赖都打包进我们的项目。这可能会带来一些问题(比如:项目体积的增大),但是好处也是显而易见的。
上面生成的 npm-shrinkwrap.json
里面有个 resolved
字段,表示模块所在的位置,实际上这个字段完全可以写一个文件路径。所以,我们可以递归的遍历 npm-shrinkwrap.json
文件,将所有的 tgz 包先下载到我们项目的某个目录,然后改写 resolved
字段为对应的文件路径。这样的功能有开发者已经实现了,我们可以直接享用:
还是上面的例子:
A@0.1.0└─┬ B@0.0.1 └── C@0.0.1
执行 shrinkpack
后,会生成下面的打包目录:
node_shrinkpack - B-0.0.1.tgz - C-0.0.1.tgz
和 node-shrinkwrap.json
文件:
{ "name": "A", "dependencies": { "B": { "version": "0.0.1", "resolved": "./node_shrinkpack/B-0.0.1.tgz", "dependencies": { "C": { "version": "0.0.1", "resolved": "./node_shrinkpack/C-0.0.1.tgz" } } } }}
于是,我们以后再进行 npm install --loglevel=http
时会发现依赖模块的安装根本没有网络请求了(因为依赖都在我们自己的仓库里了嘛)。
可能有人会说,为啥不直接把 node_modules
目录提交进仓库算了?原因主要是这样:
node_modules
目录里面啥东西都有,太凌乱,很容易把提交给搅乱。diff 时突然 diff 出 node_modules
下的源代码、README,你应该不想这样吧?只存储模块的 tgz 包,安装编译的过程交给 NPM 命令更明智。
于是,现在我们使用 NPM 模块的正确姿势应该是这样了:
npm shrinkwrap
将依赖模块的版本冻结shrinkpack .
将依赖模块打包进仓库npm-shrinkwrap.json
和 node_shrinkpack
一起提交哦)如果你觉得这样很繁琐,可以定义一个 NPM 命令:
"scripts": { "pack": "npm shrinkwrap & shrinkpack ."}
npm shrinkwrap
(冻结依赖模块的版本) 加 shrinkpack
(打包依赖模块到自己项目) 来解决依赖模块的不确定性转载地址:http://jpbuo.baihongyu.com/