First of all
一个人维护一个项目很久了, 差不多是时候总结一些经验做一些些输出了。因此来汇总一下这些年我对我的开源项目TRPG Engine
做的工程化实践。
首先,我们要明确一点,即为什么要做工程化:
- 提升开发效率
- 降低开发成本
- 提升产品质量
- 降低企业成本
所有的代码, 所有的技术都依托于业务, 所有的手段都是为了最终目的而服务的。因此我们工程化最终目的就是提高产出。
Git workflow
参考文章:
- Understanding the GitHub flow
- https://nvie.com/posts/a-successful-git-branching-model/
- https://www.atlassian.com/git/tutorials/comparing-workflows/gitflow-workflow
Commitlint
使用 Commitlint
来保证项目成员或者外部贡献者的提交确保同样的格式。
TRPG Engine
是使用 commitlint
来实现的提交内容校验
一般常用的一种提交方式是 angular
格式。
例:
1 | fix: some message |
参考文档: https://github.com/angular/angular/blob/master/CONTRIBUTING.md#-commit-message-format
提交的类型说明:
1 | feat:新功能(feature) |
https://github.com/angular/angular/blob/master/CONTRIBUTING.md#type
通过标准的 commit message 可以生成Change log
基于git commit message来自动收集并生成CHANGELOG
在升版本时可以通过standard-version
来实现package.json
version和changelog一起生成
Prettier and Eslint
确保项目有一个统一的格式是非常重要, 可以有效的防止贡献者因为不统一的格式带来的提交变更过大。
试想一下,一个人用的是4空格缩进,另一个人用的是2空格缩进。那么会来带的协作上的问题并导致code review
无法正常进行
目前前端流行使用prettier
+ eslint
的组合来确保项目的格式统一。
prettier
是目前前端流行的Formatter
工具, 用于保证项目能具有统一的格式,各大编辑器平台都具有插件支持,同时也支持许多语言
- 官方文档: https://prettier.io/
eslint
是一款确保你的代码质量的工具,特别是融合了tslint
后更加成为了前端代码质量保证的唯一选择。其功能与prettier有部分交集,因此在同时使用两者时需要使用eslint
的prettier
预设来确保不会出现冲突
另外推荐一个跨语言的格式工具, EditorConfig, 虽然功能没有prettier
这么强大,但是他的优势是跨语言,更加具有通用性。
使用 lint-staged 来在工程化运行时中确保格式正确
Testing and benchmark
单元测试与基准测试是程序员要面对的两大关键测试方式。
单元测试应当用于几乎所有的代码, 来确保代码不出错(主要是可以防止其他协作者无意间改坏你的代码)
而基准测试用于对性能要求较高的场合,比如后端的高并发场景,以及前端的高CPU计算(By the way, 对于前端的高CPU场景我建议是使用web worker来处理,这样可以使用多线程而不会影响用户正常操作)
如何写单元测试
总所周知,一个纯函数是最好测的。那么单元测试的存在就相当于监督我们时刻注意将一些可以抽象出来的纯函数抽象出来,来方便写单元测试。能有效提高代码质量。
而对于一些副作用比较大的场景,我们需要想办法构建其上下文。比如TRPG Engine
的后端代码,单元测试就是真实起了一个空白的数据库, redis, 和后端实例,通过数据库操作以及及时清理测试过的数据库代码来保证环境干净
对于比较难以测试的前端组件, TRPG Engine
的做法是打快照,通过快照的变更告知开发者是否有一个 预期/非预期 的变更出现
单元测试的存在也应当集成到CI中,以确保每次执行都可用。
Bundler
在现代前端编程中, 打包编译是前端不得不重视的一环。
从less scss等css拓展语言, 到ts, coffee的js拓展。
从babel的es6,7,8,9支持, 到各种动态加载, 各种优化压缩。
面对日益复杂的现状,前端已经离不开打包工具的存在。
一般来说,我们常用的打包工具是webpack
。webpack
大而全,并提供足够的自定义化能力。是目前来说前端业务开发打包的不二之选。但成也萧何败萧何,webpack
虽然十分强大, 但是配置非常非常复杂,甚至有webpack工程师这一说法,因此在一些特殊场景下, 我也十分推荐一些其他的打包工具。
- 如果是开发一个依赖库,我推荐 rollup,小巧轻便,也兼容多种导出方式。
- 如果是开发一个小项目,不想写很多
webpack
配置, 我推荐parcel - 如果受限于系统资源,在开发环境下因为webpack的大量资源占用, 很难有一个良好的开发体验,那么我推荐snowpack, 可以见我的另一篇博文: 从 Webpack 到 Snowpack, 编译速度提升十倍以上——TRPG Engine迁移小记
至于
vite
, 我没有用过很难给出一个比较好的评价.
CI/CD
Continuous Integration and Continuous Delivery
持续集成与持续交付
市面上有很多免费的CI系统, 比如 travis
, appveyor
, circleci
, github action
等等, 再比如gitlab自带的ci系统。
总的来说都大同小异, 我们使用CI系统无非是关注单元测试有没有跑通,如何可以的话顺便输出一份coverage覆盖率报告。如果再可以的话可以把代码编译了以后输出编译报告。来方便衡量每一次提交的代码质量。
一般来说CI/CD都放在一起来讲,因为只是最终的输出不一样罢了。
CD可以做一些每次提交都编译文件, 或者往特殊分支提交就部署页面的功能。(比如每次向docs
提交代码都编译文档并部署到远程服务器上)
Analytics and Monitor
一些现成的分析服务:
Google Analytics
Datadog
Posthog
Sentry Tracking
Grafana
uptimerobot
这些工具是帮助你的项目在上线后能分析或监控的方式。通过这些工具可以收集用户的行为,检测服务可用性等。
监控可以帮助你的服务稳定可靠,发生宕机的情况能够第一时间发现,减少用户损失。没有监控的服务就是没有地图和罗盘的轮船 —— 什么时候沉默?天知道!
而用户行为收集是下一步迭代的重要依据,如果是用户比较少用的功能则可以考虑减慢开发进度。
对于监控,我推荐posthog
,这是一款新兴的分析系统。推荐的理由很简单,因为他是开源的,我们可以自己部署,然后把他的数据进行二次加工与处理。
Performance
性能是提升用户体验的重要一环,即常规感知中的“卡不卡”。
我们有很多方式去提升性能,比如采集用户的首屏渲染时间,比如手动打开devtool去对具体某个操作进行堆栈分析,再比如用Lighthouse跑个分 —— google的工具都非常棒。
参考文档:
Logging
日志应当是我们分析问题最关键的一步,重视日志是一个有一定规模的项目最基本的一步。
大部分项目都会记录本地日志,但本地日志过于原始,很难产生一定价值。目前业内流行的方案是为日志单独准备一个elasticsearch
服务, 所有日志中心化到一个数据库,再通过配套的 kibana
进行数据检索。
另外使用外部日志中心的好处在于项目的微服务化与集群化。因为项目离开单实例部署后日志分散在各地,更加难以查询问题。
对于 TRPG Engine
来说,目前使用的第三方日志服务是 Loggly
, 因为ELK
部署较耗资源,而其他大多数的日志服务都是收费的。Loggly
具有一定的免费额度, 但是对中文编码不是很友好。
相关资源:
- local file
Loggly
ELK
- 阿里云日志腾讯云日志等服务商…
Error Report
除了日志, 我们可能需要一个单独的错误汇报中心。因为日志是一种被动式的、托底的问题查找方式。一个主动的错误汇报会让我们更早介入问题以防止更大的错误扩散。
TRPG Engine
使用了Sentry
作为错误汇报中心。开源,云服务具有一定免费额度,错误汇报可以带上堆栈信息和相关上下文,并且新的错误会发送邮件到相关人员。
开源对于企业的意义在于能够自己部署,企业也可以部署自己的sentry,就像是gitlab一样
Sentry
Develop for Distributed
有一点比较重要的就是在开始一个项目的时候就要考虑到之后的场景。在开发时就需要考虑分布式部署的场景。至少对于可能有分布式的场景进行一层抽象,就算现在不做,以后也要做。这点TRPG Engine
走过很多弯路。
- 比如日志,需要考虑使用外部日志的情况
- 比如文件管理,需要考虑使用云文件
- 比如配置,需要考虑使用外部的配置中心
- 比如缓存,少用内存缓存而用外部缓存
- 比如数据库 —— 当然这个大多数情况不用操心,除非用的是sqlite
因为现代的程序架构早就不是以前一台服务器打天下的时候了。有效组合各个服务可以帮助程序快速增长。
Coding with config
基于配置的代码会使你的程序更加灵活。特别是线上情况往往不适合发布,或者长期故障。通过配置我们可以将一部分代码关闭以保证整体代码可用性。
很多公司的功能开发分成两种管理方案,一种是做功能时切出一个功能分支,等到开发完毕后再合并到主分支。
还有一种方案是持续合并到主干分支,但是由配置来将新功能关闭。
说不清那种方案好,但是基于配置进行开发给与工程化代码更加灵活。
Read with Document and Comment
文档也是工程化代码的实践
一个静态文档网站可以帮助使用者快速理解整个项目
一行注释可以帮助代码阅读者理解你的用意,更重要的是可以防止其他的协作者在不了解你的用意的情况下改坏代码。
好的开源项目一定有足够文档,而一个好的企业项目代码中一定有很多注释。
对于企业业务项目来说,文档可能没有办法强制要求,但是需要明确一点的是注释是为自己写的,试想一下,一个复杂一点的方法,等一个月后,还能保证自己能理解当时自己的用意么?
Flexible Architecture
可变、灵活架构。
一个项目想要换底层架构是非常困难且痛苦的,想要解决这个问题,只有架构预先进行足够的设计,提前预想未来5年10年的业务变更。
比如插件化的架构就能保证业务代码的可拓展性。
MiniStar: 一个用于实现微内核(插件化)架构的前端框架
Dockerize
docker
是现在开发的趋势,统一且单一的环境。
做过以前代码部署的工程师一定了解在不同环境下部署程序的痛苦,就算打包成一个war
包也可能会有各种环境导致的奇怪问题。而docker就是解决这个问题的工具。
在实际中有很多使用场景:
- 统一开发环境(统一开发环境)
- 快速部署(无需搭建环境)
- 集群部署(k8s, docker swarm)