webpack源码阅读之Compiler
- 2019 年 12 月 4 日
- 筆記
本文作者:IMWeb llunnn 原文出处:IMWeb社区 未经同意,禁止转载
本篇记录了阅读Compiler.js过程中的一些笔记。(Webpack版本4.41.0)
阅读前需要先对tapable有一定的了解,可参考Tapable github.
这里主要对webpack调用了Compiler.run()到资源输出完毕后经历的过程及其代码进行了一些梳理。
代码特点
webpack的异步代码基本采用回调函数的形式进行书写,tapable实际上也是注册callback的形式,需要仔细区分各个部分对应的callback。
Compiler类成员变量的类型、含义都比较清晰,也有足够的文档支持,这里不做具体解读了。
大致流程
Compiler中的方法调用顺序大致如下(以.run为入口):
Compiler.run(callback) 开始执行构建
Compiler.readRecord(callback) 读取之前的构建记录
Compiler.compile(callback) 进行编译
Compiler.newCompilationParams() 创建Compilation的参数
Compiler.newCompilation() 创建新的Compilation
Compiler.emitAssets(compilation, callback) 输出构建资源
Compiler.emitRecords(callback) 输出构建记录
源码阅读
Compiler.run(callback)
Compiler.run()是整个编译过程启动的入口,在lib/webpack.js中被调用。
// Compiler.run(callback) run(callback) { // 如果编译正在进行,抛出错误(一个webpack实例不能同时进行多次编译) if (this.running) return callback(new ConcurrentCompilationError()); // 定义运行结束的回调 const finalCallback = (err, stats) => { this.running = false; // 正在运行的标记设为false if (err) { // 若有错误,执行failed钩子上的方法 // 我们可以通过compiler.hooks.failed.tap()挂载函数方法 // 其余hooks类似 this.hooks.failed.call(err); } if (callback !== undefined) return callback(err, stats); }; const startTime = Date.now(); // 标记开始运行 this.running = true; // 调用this.compile传入的回调函数 const onCompiled = (err, compilation) => { // ... }; // 执行beforeRun钩子上的方法 this.hooks.beforeRun.callAsync(this, err => { if (err) return finalCallback(err); // 执行run钩子上的方法 this.hooks.run.callAsync(this, err => { if (err) return finalCallback(err); // 读取之前的records this.readRecords(err => { if (err) return finalCallback(err); // 执行编译 this.compile(onCompiled); }); }); }); }
Compiler.readRecord(callback)
readRecords用于读取之前的records的方法,关于records,文档的描述是pieces of data used to store module identifiers across multiple builds(一些数据片段,用于储存多次构建过程中的module的标识)可参考recordsPath。
// Compiler.readRecord(callback) readRecords(callback) { // recordsInputPath是webpack配置中指定的读取上一组records的文件路径 if (!this.recordsInputPath) { this.records = {}; return callback(); } // inputFileSystem是一个封装过的文件系统,扩展了fs的功能 // 主要是判断一下recordsInputPath的文件是否存在 存在则读取并解析,存到this.records中 // 最后执行callback this.inputFileSystem.stat(this.recordsInputPath, err => { // It doesn't exist // We can ignore this. if (err) return callback(); this.inputFileSystem.readFile(this.recordsInputPath, (err, content) => { if (err) return callback(err); try { this.records = parseJson(content.toString("utf-8")); } catch (e) { e.message = "Cannot parse records: " + e.message; return callback(e); } return callback(); }); }); }
Compiler.compile(callback)
compile是真正进行编译的过程,创建了一个compilation,并将compilation传给make钩子上的方法,注册在这些钩子上的函数方法会调用compilation上的方法,执行构建。在compilation结束(finish)和封装(seal)完成后,便可以执行传入回调,也就是在Compile.run()中定义的的onCompiled函数。
// Compiler.compile(callback) compile(callback) { // 创建了compilation的初始参数 const params = this.newCompilationParams(); // 执行beforeCompile钩子上的方法 this.hooks.beforeCompile.callAsync(params, err => { if (err) return callback(err); // 执行compile钩子上的方法 this.hooks.compile.call(params); // 创建一个新的compilation const compilation = this.newCompilation(params); // 执行make钩子上的方法 this.hooks.make.callAsync(compilation, err => { if (err) return callback(err); // 若compilation的finish阶段抛出错误,调用callback处理错误 compilation.finish(err => { if (err) return callback(err); // 若compilation的seal阶段抛出错误,调用callback处理错误 compilation.seal(err => { if (err) return callback(err); // seal完成即编译过程完成 // 执行afterCompile钩子上的方法,传入本次的compilation this.hooks.afterCompile.callAsync(compilation, err => { if (err) return callback(err); return callback(null, compilation); }); }); }); }); }); }
Compiler.run(callback) -> onCompiled
onCompiled是在Compiler.run中定义的,传给Compiler.compile的回调函数。在compile过程后调用,主要用于输出构建资源。
// Compiler.run(callback) -> onCompiled const onCompiled = (err, compilation) => { // finalCallback前面定义的运行结束时回调 if (err) return finalCallback(err); // 执行shouldEmit钩子上的方法,若返回false则不输出构建资源 if (this.hooks.shouldEmit.call(compilation) === false) { // stats包含了本次构建过程中的一些数据信息 const stats = new Stats(compilation); stats.startTime = startTime; stats.endTime = Date.now(); // 执行done钩子上的方法,并传入stats this.hooks.done.callAsync(stats, err => { if (err) return finalCallback(err); return finalCallback(null, stats); }); return; } // 调用Compiler.emitAssets输出资源 this.emitAssets(compilation, err => { if (err) return finalCallback(err); // 判断资产在emit后是否需要进一步处理 if (compilation.hooks.needAdditionalPass.call()) { compilation.needAdditionalPass = true; const stats = new Stats(compilation); stats.startTime = startTime; stats.endTime = Date.now(); // 执行done钩子上的方法 this.hooks.done.callAsync(stats, err => { if (err) return finalCallback(err); // 执行additionalPass钩子上的方法 this.hooks.additionalPass.callAsync(err => { if (err) return finalCallback(err); // 再次compile this.compile(onCompiled); }); }); return; } // 输出records this.emitRecords(err => { if (err) return finalCallback(err); const stats = new Stats(compilation); stats.startTime = startTime; stats.endTime = Date.now(); // 执行done钩子上的方法 this.hooks.done.callAsync(stats, err => { if (err) return finalCallback(err); return finalCallback(null, stats); }); }); }); };
Compiler.emitAssets(compilation, callback)
emitAssets负责的是构建资源输出的过程,其中emitFiles是具体输出文件的方法。
// Compiler.emitAssets(compilation, callback) emitAssets(compilation, callback) { let outputPath; // 输出打包结果文件的方法 const emitFiles = err => { // ... }; // 执行emit钩子上的方法 this.hooks.emit.callAsync(compilation, err => { if (err) return callback(err); // 获取资源输出的路径 outputPath = compilation.getPath(this.outputPath); // 递归创建输出目录,并输出资源 this.outputFileSystem.mkdirp(outputPath, emitFiles); }); }
// Compiler.emitAssets(compilation, callback) -> emitFiles const emitFiles = err => { if (err) return callback(err); // 异步的forEach方法 asyncLib.forEachLimit( compilation.getAssets(), 15, // 最多同时执行15个异步任务 ({ name: file, source }, callback) => { // let targetFile = file; const queryStringIdx = targetFile.indexOf("?"); if (queryStringIdx >= 0) { targetFile = targetFile.substr(0, queryStringIdx); } // 执行写文件操作 const writeOut = err => { // ... }; // 若目标文件路径包含/或,先创建文件夹再写入 if (targetFile.match(//|\/)) { const dir = path.dirname(targetFile); this.outputFileSystem.mkdirp( this.outputFileSystem.join(outputPath, dir), writeOut ); } else { writeOut(); } }, // 遍历完成的回调函数 err => { if (err) return callback(err); // 执行afterEmit钩子上的方法 this.hooks.afterEmit.callAsync(compilation, err => { if (err) return callback(err); // 构建资源输出完成执行回调 return callback(); }); } ); };
Compiler.emitAssets(compilation, callback) -> emitFiles -> writeOut
writeOut函数进行具体的写文件操作。
其中涉及到的两个内部Map:
_assetEmittingSourceCache用于记录资源在不同目标路径被写入的次数。
_assetEmittingWrittenFiles用于标记目标路径已经被写入的次数,key是targetPath。每次targetPath被文件写入,其对应的value会自增。
/** @private @type {WeakMap<Source, { sizeOnlySource: SizeOnlySource, writtenTo: Map<string, number> }>} */ this._assetEmittingSourceCache = new WeakMap(); /** @private @type {Map<string, number>} */ this._assetEmittingWrittenFiles = new Map();
关于futureEmitAssets配置项可参考output.futureEmitAssets,这里对基于垃圾回收做的内存优化(SizeOnlySource部分)还是比较有意思的。
// Compiler.emitAssets(compilation, callback) -> emitFiles -> writeOut const writeOut = err => { if (err) return callback(err); // 解析出真实的目标路径 const targetPath = this.outputFileSystem.join( outputPath, targetFile ); // TODO webpack 5 remove futureEmitAssets option and make it on by default if (this.options.output.futureEmitAssets) { // check if the target file has already been written by this Compiler // 检查目标文件是否已经被这个Compiler写入过 // targetFileGeneration是targetFile被写入的次数 const targetFileGeneration = this._assetEmittingWrittenFiles.get( targetPath ); // create an cache entry for this Source if not already existing // 若cacheEntry不存在,则为当前source创建一个 let cacheEntry = this._assetEmittingSourceCache.get(source); if (cacheEntry === undefined) { cacheEntry = { sizeOnlySource: undefined, writtenTo: new Map() // 存储资源被写入的目标路径及其次数,对应this._assetEmittingWrittenFiles的格式 }; this._assetEmittingSourceCache.set(source, cacheEntry); } // if the target file has already been written // 如果目标文件已经被写入过 if (targetFileGeneration !== undefined) { // check if the Source has been written to this target file // 检查source是否被写到了目标文件路径 const writtenGeneration = cacheEntry.writtenTo.get(targetPath); if (writtenGeneration === targetFileGeneration) { // if yes, we skip writing the file // as it's already there // (we assume one doesn't remove files while the Compiler is running) // 如果等式成立,我们跳过写入当前文件,因为它已经被写入过 // (我们假设Compiler在running过程中文件不会被删除) compilation.updateAsset(file, cacheEntry.sizeOnlySource, { size: cacheEntry.sizeOnlySource.size() }); return callback(); } } // TODO webpack 5: if info.immutable check if file already exists in output // skip emitting if it's already there // get the binary (Buffer) content from the Source // 获取source的二进制内容content /** @type {Buffer} */ let content; if (typeof source.buffer === "function") { content = source.buffer(); } else { const bufferOrString = source.source(); if (Buffer.isBuffer(bufferOrString)) { content = bufferOrString; } else { content = Buffer.from(bufferOrString, "utf8"); } } // Create a replacement resource which only allows to ask for size // This allows to GC all memory allocated by the Source // (expect when the Source is stored in any other cache) // 创建一个source的代替资源,其只有一个size方法返回size属性(sizeOnlySource) // 这步操作是为了让垃圾回收机制能回收由source创建的内存资源 // // 这里是设置了output.futureEmitAssets = true时,assets的内存资源会被释放的原因 cacheEntry.sizeOnlySource = new SizeOnlySource(content.length); compilation.updateAsset(file, cacheEntry.sizeOnlySource, { size: content.length }); // Write the file to output file system // 将content写到目标路径targetPath this.outputFileSystem.writeFile(targetPath, content, err => { if (err) return callback(err); // information marker that the asset has been emitted compilation.emittedAssets.add(file); // cache the information that the Source has been written to that location // 缓存source已经被写入目标路径,写入次数自增 const newGeneration = targetFileGeneration === undefined ? 1 : targetFileGeneration + 1; // 将这个自增的值写入cacheEntry.writtenTo和this._assetEmittingWrittenFiles两个Map中 cacheEntry.writtenTo.set(targetPath, newGeneration); this._assetEmittingWrittenFiles.set(targetPath, newGeneration); // 执行assetEmitted钩子上的方法 this.hooks.assetEmitted.callAsync(file, content, callback); }); } else { // webpack4的默认配置output.futureEmitAssets = false // 若资源已存在在目标路径 则跳过 if (source.existsAt === targetPath) { source.emitted = false; return callback(); } // 获取资源内容 let content = source.source(); if (!Buffer.isBuffer(content)) { content = Buffer.from(content, "utf8"); } // 写入目标路径并标记 source.existsAt = targetPath; source.emitted = true; this.outputFileSystem.writeFile(targetPath, content, err => { if (err) return callback(err); // 执行assetEmitted钩子上的方法 this.hooks.assetEmitted.callAsync(file, content, callback); }); } };
至此,Compiler完成了启动构建到资源输出到过程。