翟志军 Jack Zhai

程序员想告赢开发商一户一表违约

导言正如标题所言，我是一名程序员。2023年5月之前，我是一个法盲，不懂起诉的流程，更不懂开庭的步骤。但在过去的一年中，我以各种身份参与庭审多次，包括：以被告的公民代理的身份，为被告辩护，参加庭审：1次以原告的公民代理的身份，为原告辩护，参加庭审：1次以原告的身份起诉开发商：2次以起诉人身份参加二审：1次以旁听的身份参加庭审：2次多次为小区其他业主免费写起诉状、答辩状、再审申请书等多份文书。但是结果是什么呢？后文会说。如果你只想知道官司输赢，可以直接划到文章最后。本文比较长，你可以挑选自己感兴趣的部分开始。如果您觉得本文有意义，还请转发给其他遇到相同问题的业主，以帮助更多的人。如果帮到你，还请用实际行动赞赏本文。你我的权益，需要法制社会来保护，也需要你我的努力。背景介绍我是2017年购买的商品房，坐落在一个18线的县城。开发商是市里的一家房地产开发商。但是直到现在小区还是由物业代抄电表，代收电费交给开发商。在2020年和2022年的两次水灾中，其它实现了一户一表的小区，供电局很快就恢复供电了。但是我们小区停电了半个多月，因为开发商需要自己找人去修该变压器。这里有两个背景知识：开发商需要将小区的变压器的产权无偿移交给供电局，变压器的维护才由供电局负责；一户一表：说大白话就是由业主与供电局直接发生供用电关系，而不是由开发商代缴电费。业主是2020后才知道小区并不是一户一表的。所以，部分小区业主从那时开始拒绝“交电费”。开发商只能为这部分业主“垫付”电费。 2023年5月，开发商不再为业主“垫付”电费。小区因此被供电局停电。接下来，小区业主与开发商、镇政府、供电局、住建局等多方，进行长时间地“拉扯”（中间的故事可以再写一篇文章，但是考虑到篇幅，本文不详写）。虽然现在小区有电用，但至今小区依然没有实现一户一表。这就是多方拉扯的结局。懂的都懂。其间，我开始研究业主与开发商之间的合同《商品房买卖合同》（由国家住建部和国家工商局2014年制定的格式合同），商品房验收条件中，关于电的部分，合同上的原文是这样的：供电：交付时纳入城市供电网络并正式供电。也就是合同里并没有写明“一户一表”。也请读者朋友拿出自己的合同，找到相关条文确认。因为合同一字之差就差个十万八千里。根据这条合同条文，我们不能以“未实现一户一表”来起诉开发商。只能起诉开发商没有实现“交付时纳入城市供电网络并正式供电”。本文为了方便，会将两“一户一表”与“交付时纳入城市供电网络并正式供电”混用，但是它们意思大致相同。注意，在庭审过程，它们不是同一事物。这里再次提醒读者：起诉开发商，必须以合同为依据起诉。以上简单介绍了背景知识（实际情况更复杂）。接下来解答一些读者会提出来疑问：为什么要写下这些在前几天，我刚刚结束了二审（判决结果还没有出），我决定将整个经历写下来。原因有二：一是因为我这人记性不好，想记录下这段有意义的经历；二是希望为法制社会做出一点点微薄的贡献。为什么不找律师？我在找律师前做了很多功课，比如起诉开发商涉及的法律条文、开发商会如何抗辩等。但是，在找过多家律师所后，我最终决定不找律师。原因有：本县城的律师不愿意为我们打官司，有律师认为钱太少，有律师听到小区名字就说不打。部分业主甚至愿意与律师平分违约金。隔壁县城的律师找了两个，我个人判断不可靠。当我拿出《合同》与他们讨论其中的条文时，他们并没有给出令我满意的答案，而且整个市的律师都在同一个律师协会里，懂的都懂；省会的律师不太可能受理我们这种小金额官司。连他们的差旅费，我们可能都给不起；小区里并不是所有的人都愿意打这个官司（这个是关键）。我以个人名义打官司，就不会有以上问题了。为什么不是起诉物业？说白了，小区物业就是开发商的一家子公司。所以很多业主经常误以为物业就是开发商，毕竟“交电费”是直接交给的物业的。小区的几次停电，部分业主跑去物业那里“闹”，这是找错对象了。因为我们小区的供电主体是开发商，不是物业。再多说一句，如果物业没有代缴电费的权力（具体要看物业合同），所以他们也无法起诉你不交电费给他们。为什么不是起诉开发商不移交变压器？这在上文已经说明了，要以合同为依据来起诉。合同里并没有写“移交变压器”的条文。集体诉讼，还是一个个单独诉讼？在没有接触真正的诉讼流程前，我也以为我们是可以集体诉讼的。但是在学习后，发现中国是没有集体诉讼的概念的。只能单独诉讼。如果我错了，还请纠正我。多谢。假如有律师接受整个小区对开发商的诉讼，律师也是分别和每一位业主签法务合同。律师只不过是批量操作，并不是真正意义的集体诉讼。我可以代理其他人的诉讼吗？如果没有集体诉讼，那么，我将面临两个问题：我是自己起诉开发商，还是和其业主一起？我可以代理其他业主的起诉吗？并不是每一个业主都有时间。对于问题1，经过深思熟虑，我做出的策略是：我以个人名义单独起诉。因为我完全没有诉讼经验，不知道法官和开发商会如何抗辩。即使我本人这次官司输了，其他人也可以以我的诉讼经验发起另一次诉讼，直到打赢。关于问题2，你是可以以公民代理的身份代理你的邻居或者亲戚的诉讼。中国不允许没有律师执照的人为其他人代理诉讼，公民代理算是对这机制的补充。如果我理解错了，还请纠正，谢谢。公民代理的方法是：取得证明你们关系。如果是邻居关系，就拿双方的购房合同或者房产证去当地居委会开证明；如果是亲戚关系，就拿双方的户口去公安局、居委会或者村委会。可能每个地方不一样，你需要咨询当地的居委会或者村委会；准备授权委托书，即你的邻居或者亲戚将案件委托给你的证明；在提交起诉状或者开庭前向法庭提交双方身份证复印件、委托书和关系证明。以上是我个人的总结。但是，还是建议有需求的读者，请咨询当地法院。题外话，我在给邻居代理时，发生了两件“有趣”的事情。一件是当我给其中邻居代理房产证逾期的诉讼时，负责立案的”漂亮“的小姐姐，气急败坏似地不给任何理由地拒绝了我的代理。这超出了我认知。她不是在法院知法犯法吗？另一件也是这个“漂亮”的小姐姐，我在立案时，故意刁难我，本来可以使用微信线上交纳诉讼费的，却跟我说法院规定月底最后三天，需要线下去银行柜台汇款。当时，我不清楚，天真去线下交了，浪费了我大量时间。后来有一次也是月底，我看到其他所有人都不需要线下汇款。我想法院应该是没有任何理由拒绝我线上支付的。如果有懂相关法律的读者可以告诉我。 ...

Setting up EKS with Bazel, Jsonnet and Terraform

Overview In this document, I’ll describe my solution from the following parts: Part1 Architecture: describe the desired state of the architecture Part2 Implementation: Code Structure Introduce How to Build it Deploy Nginx Controller using Helm Part1: Architecture We assume that the project has a project named: health. Here’s the architecture graph, which draw by Excalidraw Network Architecture I created 4 subnets that are evenly distributed to 2 Availability Zones. Each availability zone has 2 subnets, one is public subnet,and another one is private subnet. The public subnet goes out through the Internet gateway and the private subnet goes out through the NAT gateway. ...

Bazel使用案例：构建Springboot工程

本文是关于如何使用Bazel搭建Springboot 3.1.0工程（基于JDK17）。为什么使用Bazel，而不是使用Maven或者Gradle？可以看我之前关于Bazel的介绍文章。前期准备在根目录加入.bazelversion文件，并加入6.2.0，指定当前工程使用的Bazel的版本。这样，Bazel命令自动使用该版本的Bazel进行构建。在根目录加入.bazelrc文件，并指定构建和测试时使用JDK17，内容如下： build --java_language_version=17 --java_runtime_version=17 --tool_java_language_version=17 --tool_java_runtime_version=17 test --java_language_version=17 --java_runtime_version=17 --tool_java_language_version=17 --tool_java_runtime_version=17 外部依赖准备在根目录中创建以下两个文件： WORKSPACE：在Bazel中，所有的外部依赖统一定义WORKSPACE文件中； BUILD.bazel：内容留空即可，用于告诉Bazel当前目录也是一个Package。 Bazel本身是支持多语言的。所以，我们需要特定语言的rule来帮助我们在WORKSPACE中定义外部依赖。对于Java工程，我们使用rules_jvm_external进行外部依赖的管理。它的使用步骤如下：步骤1：在WORKSPACE中增加rules_jvm_external配置以下配置指定了rules_jvm_external的下载位置，并进行rule的初始化： load("@bazel_tools//tools/build_defs/repo:http.bzl", "http_archive") RULES_JVM_EXTERNAL_TAG = "4.5" RULES_JVM_EXTERNAL_SHA = "<sha hash value>" http_archive( name = "rules_jvm_external", strip_prefix = "rules_jvm_external-%s" % RULES_JVM_EXTERNAL_TAG, sha256 = RULES_JVM_EXTERNAL_SHA, url = "https://github.com/bazelbuild/rules_jvm_external/archive/%s.zip" % RULES_JVM_EXTERNAL_TAG, ) load("@rules_jvm_external//:repositories.bzl", "rules_jvm_external_deps") rules_jvm_external_deps() load("@rules_jvm_external//:setup.bzl", "rules_jvm_external_setup") rules_jvm_external_setup() load("@rules_jvm_external//:defs.bzl", "maven_install") maven_install( artifacts = [ # The project's dependencies "junit:junit:4.12", "org.hamcrest:hamcrest-library:1.3", ], repositories = [ # Private repositories are supported through HTTP Basic auth # "http://username:password@localhost:8081/artifactory/my-repository", "https://maven.aliyun.com/repository/public", ], ) 以上采用了非Bzlmod的管理rule。 ...

DevOps架构师是如何看待Github Actions的共享制品解决方案的？

前言 Github Actions是Github提供的一个CICD Pipeline服务。除了Pipeline，它还提供Secret和简单的配置管理。本文并不是它的一个完整介绍和知识的罗列。而是我在实际使用Github Actions后，对Github Actions的“共享问题”的解决方案的总结。不要小看这个问题，它是所有的Pipeline平台（包括Gitlab CI）都会遇到的问题。只要对这一问题深入理解，所有的平台一通百通。提示1：下文可能会是Workflows和Pipeline两个术语共用。因为它们本质上就是同一个东西，只是不同平台不同的叫法。提示2：下文可能会共用DevOps平台和Pipeline平台，虽然它们可能是完全不同的平台，但是在本文中，它们都是能提供Pipeline的平台。共享问题只要是Pipeline平台，都会遇到共享问题。那么，什么是共享问题？共享问题就是Pipeline中不同的位置之间共享资源，以实现不重复执行、生成准确结果的目标。定义听起来有些枯燥。我们列举一个有共享的场景，就比较好理解了：比如对于一个单仓库，它同时包含多个前端工程，这些前端工程同时依赖于一个common模板。其它前端工程只有等它构建完成，并取得构建，才能开始自己的构建。如果common模板的构建结果不能被其它工程构建共享使用，就会存在构建结果不一致、重复构建的问题；比如一个Pipeline中，版本号是有特定格式的，需要在第一步骤计算出来后，其它步骤取得这个版本号，进行打包工作。如果没有实现版本号在多个步骤之间共享，很可能会导致版本号不一致问题。我们稍微对共享问题进行抽象和理解，根据共享的范围，共享问题，可以分为： Workflows之间进行共享； Workflow内的Jobs之间进行共享； Job内的Step之间进行共享。根据共享的内容，可以分为：共享源码；共享制品；共享变量。 Github Actionsr制品的定义在Github Actions中的制品（Artifact）的概念和我们平时所说的“制品”有一定的区别。在Github Actions中，制品指的是Job生成的文件或者文件夹。我们平时所说的，更广意的“制品”，在Github Actions叫Packages。 Workflows之间的共享制品一般只有在大型项目才会存在Workflows之间的共享。而我个人是不建议将依赖Pipeline实现大型项目的构建的，而是依赖构建工具本身的能力。由于笔者时间有限，不再亲身做实验，本节内容，请读者自行测试。如果Workflow是由workflow_run事件触发的情况下，它们就可以直接使用actions/upload-artifact和actions/download-artifact两个actions来实现制品的共享。相关文档：https://docs.github.com/en/actions/using-workflows/storing-workflow-data-as-artifacts#downloading-artifacts-during-a-workflow-run 有趣的是Github Actions提供了一种reusable的Workflow概念。说到底是一种模板化Workflow的方式。但是这种方式不适合用来实现共享制品。因为它并不是共享制品。相关文档：https://docs.github.com/en/actions/using-workflows/reusing-workflows#using-outputs-from-a-reusable-workflow Jobs之间共享制品在同一个Workflow中，多个Job进行制品共享。如下代码： jobs: // 生成制品的job build: runs-on: ubuntu-latest steps: - name: Set up Docker Buildx uses: docker/setup-buildx-action@v3 - name: Build and export uses: docker/build-push-action@v5 with: context: . tags: myimage:latest outputs: type=docker,dest=/tmp/myimage.tar - name: Upload artifact uses: actions/upload-artifact@v3 with: name: myimage path: /tmp/myimage.tar // 使用制品的job use: runs-on: ubuntu-latest needs: build steps: - name: Download artifact uses: actions/download-artifact@v3 with: name: myimage path: /tmp - name: Load image run: | docker load --input /tmp/myimage.tar docker image ls -a 以上案例来自：https://docs.docker.com/build/ci/github-actions/share-image-jobs/ ...

Ebean：一款被低估的ORM框架

ORM框架为什么不香？对ORM框架的偏见看了一些MyBaties与Hibernate进行对比的文章。可能是因为一些Hibernate历史原因，国内对于Hibernate普遍存在偏见，我摘抄了几点： hibernate是全自动，而mybatis是半自动 hibernate完全可以通过对象关系模型实现对数据库的操作，拥有完整的JavaBean对象与数据库的映射结构来自动生成sql。而mybatis仅有基本的字段映射，对象数据以及对象实际关系仍然需要通过手写sql来实现和管理。 sql直接优化上，mybatis要比hibernate方便很多由于mybatis的sql都是写在xml里，因此优化sql比hibernate方便很多。而hibernate的sql很多都是自动生成的，无法直接维护sql 应用场景 MyBatis 适合需求多变的互联网项目，例如电商项目、金融类型、旅游类、售票类项目等。 Hibernate 适合需求明确、业务固定的项目，例如 OA 项目、ERP 项目和 CRM 项目等。也不知道是不是因为这些对Hibernate的偏见，导致大家对ORM框架也普遍存在偏见。现状是不论大小公司，国内清一色地使用MyBaties。有时，我都不敢说，我喜欢使用ORM框架。本文并不是一篇为Hibernate洗地的文章，而是介绍另一款比较小众的ORM框架：Ebean。领域问题分析介绍Ebean之前，我们需要弄清楚一个问题：为什么会有MyBaties和ORM这些框架？对于这个问题，我们无从下手，那么，我们将问题倒置：如果没有这些框架，会怎么样？问题倒置的好处是我们立马就有了可下手的方向。我们找到了不使用框架的情况下，Java代码与数据库进行交互的代码： public static void viewTable(Connection con) throws SQLException { String query = "select COF_NAME, SUP_ID, PRICE, SALES, TOTAL from COFFEES"; try (Statement stmt = con.createStatement()) { ResultSet rs = stmt.executeQuery(query); while (rs.next()) { String coffeeName = rs.getString("COF_NAME"); int supplierID = rs.getInt("SUP_ID"); float price = rs.getFloat("PRICE"); int sales = rs.getInt("SALES"); int total = rs.getInt("TOTAL"); } } catch (SQLException e) { JDBCTutorialUtilities.printSQLException(e); } } 这样的代码存在什么问题呢？ ...

PostgreSQL15 Public Schema没有权限问题解决

PostgreSQL15后，Public Schema的权限发生了变化：普通用户默认在Public schema中不再有CREATE的权限。当他们执行CREATE TABLE命令时，就会报以下错误： ERROR: permission denied for schema public 所以，我们需要为该用户再分配权限。命令如下： GRANT USAGE, CREATE on SCHEMA PUBLIC to <username>; 因为某些应用程序的sql的migration是自动的，你可能还需要为用户分配更多权限，命令如下： grant all on database <db_name> to <username>; ALTER DATABASE <db_name OWNER to <username>;

使用Mxroute和Sendgrid实现邮箱服务和邮件发送服务

最近在做一个产品，需要用邮箱服务和邮件发送服务。本文以Mxroute和Sendgrid为例介绍邮箱服务和邮件发送服务的配置。但是所有的这类产品，思路都应该是一致的。 Mxroute是邮箱服务，类似Web服务，只不过，它是专门为邮箱协议而设计的。Sendgrid就是邮件发送服务，也就是你需要批量向一堆邮箱发送邮件时，就需要用邮件发送服务。本质上Sendgrid与Mxroute是两回事。但是，通常我们先配置邮箱服务，再配置邮件发送服务。本文只为记录一下，将来忘记了可以重新拾起。配置邮箱服务首先，邮箱服务需要MX类型的域名解析记录。这能让邮箱服务能在整个互联网被解析到。每一个在Mxroute付费的用户，都会被分配到一个独立的MX域名，如first.mxrouting.net 。他们应该会发邮件给你，你需要留意。在Mxroute上配置的步骤如下：创建一个域名。比如example.com。如果你使用的是子域名，也可以是mail.example.com。拿到DKIM Keys等信息。在Mxroute的左边菜单中可以找到链接在域名提供商中，再配置以下这些DNS记录记录类型 name content 优先级 MX _dmac v=DMARC1; p=none CNAME mail <mxroute分配的独立MX域名> MX mail <mxroute分配的独立MX域名> 10 MX mail <mxroute分配的独立MX域名> 20 TXT mail <从mxroute上获取> TXT x._domainkey <从mxroute上获取> 如果你使用的是子域名，那么，还需要在 _dmas和x.domainkey 后加上 . 。例如mail子域名，就是 x.domainkey.mail。通过以上配置，只证明我们的“邮箱服务器”已经配置好了。现在在上面创建账号，并进行测试了。如果你可以向这个账号收发邮件，就证明，你的邮箱服务已经配置完成。配置邮件发送服务当你有了一个邮箱账号后，你就可以Sendgrid上配置了。登录后，从左边菜单“Senders”进入列表页。然后再点击按钮“Create new Sender”，即可创建。这部分就不细说了。因为太简单了。

使用Google OSV工具扫描依赖安全漏洞

安全漏洞是软件工程化能力的试金石 2021年年底，Log4j的漏洞陆续被公开。因为该框架被大量的开源软件依赖，所以，漏洞影响面非常大。面对这个漏洞，我们遇到的第一个问题是：如何知道我们哪些工程使用了Log4j？在我看来，这个漏洞是企业软件工程化的一颗非常好的试金石。因为：如何第一时间了解到这个漏洞，反应这家企业的安全能力；如何第一时间能找到所有使用了Log4j的位置，体现了这家企业第三方软件依赖管理能力；替换Log4j的速度，体现企业的持续集成、持续部署的能力。 Google的开源软件安全漏洞扫描工具今天介绍的OSC-Scanner，能加强我们第1项和第2项能力。 OSV-Scanner是Google在2022年12月13日推出的一款免费的安全扫描工具。它具有以下特点：支持多生态系统，包括：Go、PyPI、RubyGens、Linux、Maven等16个生态系统；同时支持直接依赖的扫描和间接依赖的扫描；采用标准的漏洞记录格式；从当前最大的开源软件漏洞数据库（https://osv.dev/）获取信息。这也是DenpencyTrack和Flutter安全工具的漏洞数据库。 OSV-Scanner是一款命令行工具，我们可以将它集成到我们的构建工具或者CICD Pipeline中。目前它已经被集成到Scorecard中。Scorecard是一款为开发源软件的安全健康度打分的开源软件。我们可以在Github Actions中使用它：https://github.com/ossf/scorecard/tree/main?tab=readme-ov-file#scorecard-github-action OSV-Scanner的安装 Windows： scoop install osv-scanner Mac Homebrew: brew install osv-scanner 也可以直接下载二进制包：https://github.com/google/osv-scanner/releases 具体安装文档：https://google.github.io/osv-scanner/installation/ OSV-Scanner的使用 Keras是一个使用Python编写的开源人工神经网络库。我们以它为例。命令行里运行以下命令： ./osv-scanner_1.3.6_linux_amd64 --format json keras/ 输出内容说明：keras存在一个“潜在内存泄漏”的漏洞。当拿到json结果后，我们的DevOps平台就可以进行一些告警监控的操作。后记 osv-scanner目前需要连osv.dev，才能使用。但是，已经开放实验功能，允许用户离线使用osv-scanner。这是自建DevOps平台的福音！

不出事故，没有人知道你重要

有同学在知乎上提问：“线上无事故，运维还重要吗？”，描述如下：本人运维行业，本部门在近几年一直保持效率增长且极少出现重大saas生产事故，并且为其他部门输出提升方法以及友好协同提升，但是最近从各层面接到反馈说对运维的投入减少，着实想不通，线上出了事故要运维背锅，产品出了bug要运维陪着到最晚，为什么把线上环境搞得稳定了，却不重视运维岗了？这是原贴：https://www.zhihu.com/question/497361582 以上提问的是一个运维的同学。言下之义是不出事故，没有人知道运维重要。这位同学的的感受，过去几年，我感同深受。我相信因为这个标题而点进这篇博客的同学，也有同样的感受。但是，为什么出事故后，是运维重要呢？而不是测试、开发或者手机端开发呢？通常是因为运维这个角色：线上环境，他们最清楚，通常也只有他们有权限操作线上环境，可以紧急加一个数据库索引；他们掌握了部署能力，可以发起回滚操作；有权限查看各个组件的情况，并诊断根因；为团队准备基础设施能力，如金丝雀发布能力；搭建告警监控系统、CMDB、DevOps平台等。等等但是，这些与是否出事故，有多大的关联性呢？我们应该统计各种事故的根因的类型的比例，才有答案。就目前而言，我们并不能说因为我们看重运维，就不出事故。以上的问题是从个人感受出发的提问。只是更深层次问题的表象。从企业层面上，我的疑问是：为什么在企业里，稳定性建设通常都是一阵阵的。即出一次事故，就立个项，就加班加点去完成“稳定性”项目。比起讨论个人感受，从企业层面讨论这个问题，似乎更有趣。其实，除了稳定性，软件的质量建设也是一阵阵的。想想，不是吗？不出Bug，没有人知道测试重要。也许这是所有企业的正常表现。就像人的身体，痛风（一种慢性病）不发作时，你是不会感受它的存在，也自然就不会想到要去治疗或者预防它。然而，如果平时不注意饮食和锻炼，痛风经常复发。线上事故就如同企业的痛风。企业应对“痛风”，容易好了伤疤忘了痛。虽说可能是所有企业的正常表现，但不是一种健康的表现。预防痛风，只能通过健康的生活方式如：限制或避免饮酒，尤其是啤酒。限制或者避免饮用含糖饮料，尤其是含高果糖玉米糖浆的饮料。限制肉类摄入量，尤其是红肉、内脏和海鲜。保持健康的体重。如果您需要减肥，请避免断食或过快地减肥，因为这可能会暂时增加尿酸水平。增加水和低脂乳制品的摄入量。这些有预防痛风的作用。一个人应对痛风的健康表现应该是采用健康的生活方式。说回企业的稳定性建设，也是一样的道理。稳定性不是通过“一阵阵的运动”或者“一阵阵的表演”来建设的，而是通过平时健康的企业活动来实现（我无意指导别人的企业，这只是我个人的思考）。当然，现实中，对于有些人，要维持健康的生活方式是一件很难的事情（想想有身边有多少人做到早睡早起），而另一些人是一件很自然的事。为什么呢？相同的，一家企业为什么无法自然地做到健康的企业活动？一定要出事故，才知道X的重要性呢？（X代表任何东西）这个问题就很大了。希望对各位读者有启发。

Bazel作为构建工具之王，将会颠覆你对CI的认知

说到构建工具，不同语言技术栈的人，想起的构建工具不同。 Java程序员想到的是Maven，前端程序员想的是NPM或者Webpack、Android程序员想到的是Gradle、Rust程序想到的是Cargo、C++程序员想到的是Make等等。然而这些工具在Bazel面前，层次有些低。所以，我愿称Bazel是构建工具之王。 P.S. Android平台的构建，2020年已经开始了迁移到Bazel的工作。具体地址：https://blog.bazel.build/2020/11/12/aosp_migrating_to_bazel.html Bazel介绍 Bazel是Google在2015年开源的一款构建工具。目前使用Bazel的知名公司有：Esty、Canva、Databricks、Dropbox、Huawei、Line、LinkedIn、Stripe、Twitter、Tinder、Uber、VMware、Wix等。具体可以看：https://bazel.build/community/users 。其中Twitter是从自家的Pants迁移到的Bazel的，具体迁移过程介绍：https://opensourcelive.withgoogle.com/events/bazelcon2020/watch?talk=day1-talk2 Facebook使用的是其自研的Buck2，但是，其与Bazel使用的是相同的远程执行的API。除了公司，某些著名的开源软件也使用Bazel构建，包括自动化测试领域的Selenium，AI领域的TensorFlow，容器编排领域的Kubernetes等。具体还有：https://bazel.build/community/users#open-source-projects-using-Bazel 相对于其它构建工具，它的显著的特点有：支持多语言；支持远程分布式构建；支持增量构建；支持强大的密闭性；支持构建缓存；支持并行构建。假设存在一个复杂的软件工程假设存在一个软件工程中，它包含5部分：Web前端、Android端、Java后端、Go后端、嵌入式端。作为Java后端的程序员，他们修改了一个API。但是他作为个人，他无法预知到底发生了哪些影响。所以，他把这个问题交给了持续集成（CI），让它去发现集成问题。在过去很长一段时间里，行业里只有一种CI模式，我称之为传统的CI模式。殊不知，还有另一种模式。传统的CI模式目前行业里比较传统的CI架构，通常如下：在这样的架构下，实现CI的步骤如下：开发人员提交代码； Gitlab检测到开发人员提交代码，然后触发Jenkins controller执行； Jenkins controller根据该代码仓库预先设计的pipeline执行； Jenkins controller根据pipeline中的任务所需要的构建环境，将任务分配给不同的Jenkins agent；在agent构建完成后，将制品release到制品仓库中。如果开发者希望验证自己写的代码，就必须将代码commit到Gitlab中。因为整个验证环境被定义在CI环境的Pipeline中。而且这个过程，越大的工程，集成速度越慢。开发者也无法在本地进行全量验证。作为Pipeline的维护者，他需要清楚知道哪些任务是可以并行执行的，并手工配置并行，这样才能加快构建速度。比如前端构建和后端构建可以并行进行。也就是说在传统的CI模式下，开发者的效率会随着软件的规模越大而降低。换句话，这样的模式，开发效率无法scale。案例希望以下案例可以给你一个感性的认知。下图是Google在2010年到2015年的周commit数量。绿线代表commit总数，黄线是人数。我们取离我们最近的2015年的数据来讨论。2015年的代码量如下：在这个代码量下，每周能达到300左右的commit。如下图：根据持续集成的原则，每一个commit都必须构建通过。20亿行代码一次全量构建需要多久？我们以一个开源项目作参考。apitable是一个开源的数据表格项目，它有200万左右的代码，全量构建一次需要20分钟左右。那么，根据不准确的类推，20亿行代码，全量构建一次需要：20/2,000,000 * 2000,000,000=200,000,000分钟，也就是13天左右。在传统的CI模式下，是尽量避免执行全量构建这样庞大的代码量的。所以，传统CI模式下，通常是多仓库模式管理代码。那么Bazel呢？Bazel如果真要构建这样庞大的代码量，估计也够呛。但是由于Bazel天然支持并行构建、构建缓存和增量构建，所以，Bazel通常不会遇到真正意义的全量构建的情况。为什么其它公司不使用Bazel 也许有人会问：为什么阿里2018年新增的代码行(https://zhuanlan.zhihu.com/p/54435171)就有12亿，不也没有使用Bazel吗？这个是一个好问题。但是，无法简单的回答这个问题，而是需要深入到各自组织内部才能分析清楚。个人觉得可以从以下维度分析：在代码仓库上工作的人员的规模：同样的代码量，不同的组织需要不同数量的人维护；代码管理方式：阿里使用多仓库的管理办法，不需要统一的版本号；持续集成的程度不同：阿里可能不需要对每一个commit跑一次全量。为什么Bazel会颠覆你对CI的认知 Bazel是如何解决传统CI模式下开发效率无法scale的问题呢？其主要通过它的六个特性来解决。首先，Bazel支持远程分布式构建。在一个使用Bazel构建的仓库中，开发者写好代码后，不用commit代码到Git仓库，只要在本地命令行执行bazel run --remote_executor=grpc://localhost:8980 //... ，代码仓库中所有构建和测试任务都将运行在远程执行服务器。远程执行服务器越多，构建速度越快。这一特性可以明显地提高开发者本地的开发效率。因为开发者在本地就可以执行全量构建和全量测试。传统CI模式下，无法提升开发者本地的开发效率。第二，Bazel支持增量构建和增量测试（精准测试）。开发者在本地执行build命令时，Bazel检测出修改了a.java文件，所以，Bazel只将构建a.java的任务及其相关的构建任务给远程执行服务器执行。这就是增量构建。如果开发者执行test命令，Bazel则能检测出被影响的测试，然后只运行这些测试。其实这就是精准测试了。在Bazel中，精准测试实现起来并不难。传统CI模式下，它是不关心增量构建和增量测试的。所以，每次运行都是全量。这是一种极大的浪费。 ...