此胶囊旅馆非彼胶囊旅馆。虽说我对现实中的胶囊旅馆很感兴趣,但至今都没有睡过一次,去开张一家真正的胶囊旅馆更是无稽之谈。标题中的「胶囊旅馆」指的是通过 Gemini 协议提供内容的独立信息集合。
我的胶囊旅馆开张了
此胶囊旅馆非彼胶囊旅馆。虽说我对现实中的胶囊旅馆很感兴趣,但至今都没有睡过一次,去开张一家真正的胶囊旅馆更是无稽之谈。标题中的「胶囊旅馆」指的是通过 Gemini 协议提供内容的独立信息集合。
想必有些读者看到 Gemini,第一时间想到的是同名的,由谷歌开发的多模态大型语言模型,亦或者是同由谷歌开发的生成式 AI 聊天机器人了吧。实则不然,本篇文章所说的 Gemini 指的都是 Gemini 协议,一个轻量级的互联网应用层通信协议。
一个常见的误解是,将「互联网」和「万维网」混为一谈。很多人认为,浏览器就是互联网,或者说互联网只有 HTTPS。这些都是认知盲区,但也怪不了谁。现代万维网极度繁荣,承载了普通用户所有的线上活动,但也掩盖了底层网络架构的多样性。
互联网是由全球无数计算机网络相互连接而成的庞大基础设施,它的核心职责是数据的路由和传输,其基石是 TCP / IP 协议族。
在计算机网络的体系结构中,网络通信被严密地划分为不同的层级。从下往上分别是「链接层」、「网络层」、「传输层」、「应用层」。
底层协议负责处理物理信号、IP 寻址和数据包在路由器之间的接力,而最顶层的应用层协议定义了运行在不同设备上的应用程序如何相互传递报文、直接决定了数据在终端用户面前的呈现和交互方式。
为了让同一台服务器能够同时处理多种不同的网络服务,传输层引入了「端口」的概念。当我们在浏览器中输入 https:// 时,实际上要求了操作系统使用超文本传输协议安全版(HTTP over TLS,也就是 HTTPS),去连接目标服务器的 443 端口。
HTTP 协议最初仅仅是为了在研究人员之间共享简单的学术超文本文档而设计的。但随着数十年的发展,为了满足复杂的现代 Web 应用程序的需求,它被不断追加了 Cookie 会话管理、CORS、Service Worker 等庞杂的机制,最终造就了今天功能强大但也极其臃肿的 Web 生态。
不过应用层是一个相当宽广的领域,HTTP 仅仅是其中的一个居民。互联网上时刻运行着大量与 HTTP 平级的应用层协议,它们各自服务于高度专一的通信需求。例如:构建全球电子邮件系统的核心是 SMTP 和 IMAP / POP3 协议;远程管理 Linux 服务器时,系统管理员会依赖运行在 22 端口的 SSH 协议;服务器之间进行时间同步,依赖于 NTP 协议。这些协议支撑着互联网的底层运转,却鲜为人知,很大缘故是它们通常在后台静默工作,或者需要特定的客户端而非通用浏览器来访问。
今天的主角 Gemini 协议也是与 HTTP 完全平行的应用层协议。它拥有着自己专属的通信规则、状态码体系和数据格式,并且默认运行在 TCP 1965 端口(纪念 1965 年的「双子星号」载人航天任务)。
在深入 Gemini 的技术基层之前,有必要了解它的精神前身:Gopher 协议。
在万维网尚未一统天下的二十世纪,Gopher 是互联网上最流行的信息检索系统。它采用严格的层级菜单结构来组织纯文本信息:
1 | Welcome to Gopherspace |
大概就是这样吧,是不是看着很像早些年的文字游戏呢?
其实我最初学习编程语言,写的第一个项目就是一个类似于这样的文字冒险游戏 —— 可惜源代码被我删除了,之后考虑使用 Python 重构却没有写下去。
Gopher 的客户端界面之所以是这么个列表形态,是因为服务端返回的原始数据本身就是一种以制表符分割的结构化纯文本。每一行代表菜单中的一项,行首的单个字符定义了该项的资源类型。
然而随着带有图形界面、支持内嵌图像和复杂排版的早期 Web 浏览器的出现,加之 Gopher 的发源地明尼苏达大学曾短暂尝试其服务端软件收取许可费,Gopher 迅速走向了衰落。
Gemini 正是诞生于对现代 Web 日益臃肿和商业化,以及对 Gopher 历史教训的深度反思之中。其核心设计理念被概括为「比 Gopher 重,比 HTTP 轻」。很聪明地,它并不打算取代现有的 Web,而是想要构建一个被称为 Geminispace 的独立、纯粹的文本网络生态。对于偏好纯文本与自托管服务的极客们而言,Gemini 是个相当具备吸引力的信息分发与获取方案。
与 HTTP 不同的是,Gemini 强制要求使用 TLS 加密连接,不允许任何明文传输,确保了基础的通信安全。同时它在实践中广泛接受 TOFU(Trust on First Use,首次信任)模式或自签发证书,大幅降低了个人站长维护基础设施的门槛。
其请求和响应模型被设计为一次性的单向事务,连接在响应完成后立即关闭。服务端的响应头部极简,仅包含一个两位数的状态码、一个空格、一段元数据(在请求成功时通常是 MIME 类型,如 text/gemini),从根本上抛弃了 HTTP 中复杂的头部字段。
更为彻底的是,Gemini 规范中没有 Cookie,没有 User-Agent 嗅探,不支持任何形式的客户端脚本执行。如果服务端应用需要维持会话状态或进行身份验证,协议规定直接使用 TLS 客户端证书来实现。这意味着在体系结构上,任何人都无法在 Gemini 页面中嵌入追踪探针、广告代码或第三方分析工具。
与该协议深度绑定的是一种名为 Gemtext 的专属轻量级标记语言(文件后缀通常为 .gmi)。Gemtext 的语法相较于 Markdown,仅支持三级标题、无序列表、引用块、预格式化文本以及链接。
三级标题对我而言,不是什么大问题,因为我现在使用的主题的原作者 Infinity 这么认为:
实际上,Hexo-theme-apollo 只支持两种标题:
h1~h3大标题,h4~h6小标题,也就是说,# 和 ###的样式是一样的。之所以这么处理,是因为就个人感觉而言,我们不应该为文章设置过多的层级消耗读者的阅读精力。这相当于强制使用 Hexo-theme-apollo 的用户在写文章时注意文章结构,最多只能使用两层结构。
不过我印象里,这个「两种标题」并不准确,实际上是三种标题:h1 一个,h2~h3 一个,h4~h6 一个才对。我并不记得我特意修改了这一点,也有可能是我记错了。总之,我在写博客的时候就已经慢慢培养出来了不滥用标题层级的习惯。
特殊的是,Gemtext 还严格禁止在段落文本中内嵌链接,所有超链接必须作为独立的代码行存在。
我个人算是半个脚注的反对者。脚注在实体书籍上出现没问题,但展示在互联网的文章上,阅读起来相当难受。如果可以的话,我会希望文章都尽量是从头到尾、瀑布般的排版,不需要让读者去别的地方才能收获完整的阅读体验。不过为了漂亮,我还是会在文本内嵌入链接,给它们附加文本。这个做法我会深思熟虑一下,是否应当完全参照 Gemini 协议希望的那样。
先前说过,Capsule 是通过 Gemini 协议提供内容的独立信息集合。它的概念完全等同于万维网中的 Website。正如一个 Website 是由多个通过 HTTP 协议传输的 HTML 页面和资源组成,一个 Capsule 则是通过 Gemini 协议传输的 Gemtext 文件及其他媒体文件的集合。
虽然它的命名出处来自于阿波罗计划中的「双子星号」太空舱,但结合我给个人网络附加的设定,最终将我自己的 Capsule 其称为「胶囊旅馆」。莫要搞混了,它的意思是太空舱,而不是我二次创作出来的胶囊旅馆!
因为 Capsule 等同于 Website,所以通过 Gemini 客户端访问他人搭建的服务器时,最好不要称其为「Gemini 站点」,而是说「Gemini 胶囊」会更好些。因为「站」这个概念属于 HTTP 协议,胶囊严格来说也不属于「网站」—— 网站是依附于万维网生态、基于 HTTP / HTTPS 协议和 HTML 标记语言构建的产物。
访问 Gemini 地址
由于 Gemini 协议从根本上切断了与 HTTP 的联系,常规的现代 Web 浏览器是无法撬开这些太空舱的。我们需要借助专门支持 Gemini 协议的客户端工具。
在终端环境中,Amfora 是一款功能完备的命令行客户端。如果依然偏好图形界面的便捷性,Lagrange 则是目前生态中非常优秀的桌面端选择。
如果你要问我,我选了哪个的话。莫要忘了,我是一个 typical Emacs user(经典 Emacs 用户)—— 其实只要使用 Elpher 包就可以访问 Gemini 胶囊啦,太方便了!
1 | M-x package-install RET elpher RET |
接着你可以在 Elpher 界面上,使用 g 命令,然后输入我的胶囊旅馆地址 gemini://cytrogen.icu 便可以访问了。
博文生成和部署
我的写作流程因为相当私人化,所以仅供参考了。
Org Mode 文件是所有文章的上游。写好 Org Mode 文件,我会转换它为 Markdown 和 Gemtext 文件。这里只说 Gemtext 的转换:我引用的是 ox-gemini 这个导出后端,不过我有很多额外的定制化需求,因此进行了一些魔改。比方说在我的月刊内,有个「日记片段」板块,那里理论上来说是 Hexo 框架在构建文件时,自动从 Fediverse 应用上获取数据、嵌入 HTML 文件内。这意味着 Org Mode 文件里没有这些日记内容,转换成的 Gemtext 文件也不会有。但我目前并不希望 Gemtext 文件在构建时进行过多的操作,导致流程愈来愈复杂,最终决定只放一个 Mastodon 主页链接。
接着我会将 Gemini 项目 git push 到 VPS 的 bare repo,并触发它的构建命令。说是构建命令,其实也就是帮我部署到 Gemini 服务器,然后镜像到 Sourcehut 仓库。
我选用的是 Agate 这个由 Rust 写的 Gemini 协议服务器。它会自动生成并管理 TLS 证书,不需要额外配置 Let's Encrypt,运行内存要求很低,我自己搭建后实际用的连 500KB 都不到。
不过它仅适用于纯静态 gemtext 文件 capsule。想要动态内容支持的话,可以考虑一下 Gemserv 或者 Molly Brown 这些服务器。
在 VPS 上安装了 Agate 之后,所需要的命令相当简单:
1 | agate --content /gemtext/文件目录 --hostname 域名.后缀 --lang zh |