Tag: IT

简繁字库

偶然发现，思源字体的繁体字库文件，无法显示一些简体字。而思源的简体文件，似乎可以显示全部的繁体字？于是把常用的字体文件拆开，看看分别都能涵盖多少简繁汉字。直接说结论：首先，在最常用的几个字体中，两两之间的差别，只是少许生僻字、异体字、以及历史遗留的制作中文编码时的重复或疏忽。具体差别的内容，放在文末了。所以，这里主要对比「思源简体」和「思源繁体」，就可以了。在思源字体 CJK 的说明文件里，写出了不同国家字体文件的字符数量，和需要支持的标准。可以看到，简中字体文件打包的字符，比繁中多了一万多个（这里的 Glyphs 不仅是中文，也包括西文、特殊符号、甚至一些 emoji）。简中字体需要支持的标准，主要是繁体字体需要支持的标准，主要包括从台湾的官网上，可以下载到目前最新的 CNS11643 – Unicode 之间的对应情况；大陆这边没有找到类似的官网资料，搜到的几个 GB18030 – Unicode 编码表，都是 PDF 格式（掀桌……）。但可以在 python 里把字符 encode，得到相应的编码，也可以变相确认，某个字符是否在某个编码里。实测结果，所有的 13053 个繁体 big5 汉字，也就是台湾最初规定的，最常用的繁体字，都包含在大陆的 GB18030 编码，也包含在思源简体的字体文件里。包含在思源繁体，而不在思源简体中的汉字，只有 1711 个（详见文末，——如果你觉得其中哪个字不够生僻，那么通常是历史遗留下来的编码重复、或者异体字。譬如，现在 Unicode 里，至少有 10 个各种形态的「龟」字了。相对的，包含在思源简体，而不在思源繁体中的汉字，有 11856 个之多。这其中，包括了非常多的常用简体字。以大陆最常用的 6763 个汉字（也就是 1980 年大陆发布的 GB2132 汉字编码集）为例。在这些汉字当中：具体字符清单见文末。可以看到，思源繁体字库中，不能显示的常用简体字，接近 30%，尤其是部首本身就有简繁体之分的，如：讠纟艹饣钅车马鱼鸟页……使用了这些简体字部首的字，有很大概率，在繁体字库里无法显示。当然，这样的差异，不一定代表着台湾那边的汉字编码工作不力、或者对简体字的傲慢。无论是 GB18030 还是 CNS11643，都早已有了更新更全面的版本，在 CNS11643…

2024-09-29
寻找适合的自建聊天工具

到现在为止，并没有找到最合适的解决方案（目前最靠谱的是 Nextcloud Talk 和 Voce Chat）。先把过程中考虑到的一些因素，记录下来，作为借鉴。我的目的，是如何更便捷地，和墙内小范围的朋友、家人，保持联系，在对话中不受信息审查。现有的聊天软件，能够不翻墙使用的，几乎没有了，即使有，也不是长久之计。所以最靠谱的方式，大概只有通过一台海外的 vps，自建服务，供小范围的人使用。如果传播范围不大，除非 gfw 变成白名单，否则应该都可以长期使用。下面是选择各种自建聊天工具时，会考虑到的因素。这些因素之间，有些是互相冲突的。对不同需求的人，在这些因素之间考虑的权重，也不一样。对于我上述的需求来说，首先，我希望这是一个可以挂机的聊天工具，可以在收到信息时，从手机接收到通知；而不仅仅是个网页聊天室，只能在专门打开网站时，才能聊天：要联系的人，并不擅长电脑技术和操作，因此这些人，可能并不属于同一个群体。所以，需要为不同的人群，架设不同的服务地址，互相分开。安全性方面：架设系统的便利程度：对聊天功能的需求： ……………还有什么要补充的吗？已经考察过的工具其实最理想的，应该是一个 php 的聊天室……能通过 chrome 在手机桌面接收消息通知就可以。轻量化、可以塞到任何目录下、没有中文我自己汉化也可以。但是，真的没找到靠谱的…………求推荐！！！ ps，如果联系人有一定电脑常识，也懂英文的话，用 mycryptochat 做临时沟通，蛮好用的。目前最合适的，是 Nextcloud Talk，用 docker + sqlite + nginx，是可以做到快速部署的；占用内存不到 300MB，勉强可以接受（所以开销更高的方案，基本不考虑了）；而 nextcloud 作为一个庞大的办公平台，其 web 界面对于非技术人士，未免有些眼花缭乱。 xmpp 和 matrix 服务器，可以做到开销更小，但也在 100MB 以上，还涉及独占端口的调整，部署起来繁琐很多。似乎也可以把跨实例通信的功能关掉，做成封闭社区，配置和开销会简单一些。但还没仔细研究。各种协同平台类，如 Mattermost、Rocket.Chat，系统开销过大，就算了。这两年有个国人开发的 VoceChat 工具，评价很不错。可以 docker + nginx 部署，内存…

2024-07-03
在外置硬盘上，加密安装 ubuntu

需求： ——这篇攻略和是否外置硬盘盒，没多大关系。普通内置硬盘也可以这样加密安装。最新的 Ubuntu 22.04 之后的版本，在安装界面里自带了 LVM 全盘加密安装的选项。但是并不能满足第 3 条需求。所以还需要一些复杂的手动操作。（UPDATE 2025：这篇攻略适用于 Ubuntu 22.04 LTS 的图形界面安装；但目前在 Ubuntu 24.04 LTS 上还没有测试通过，后者的安装程序有了很大改变，不能识别加密分区内部的逻辑分区。）安装过程尽量围绕 ubuntu 的图形安装界面，对新人友好。参考并验证了这篇教程。但原文连同 /boot 引导分区也一起加密了，于是在配置上略显繁琐。我觉得加密 /boot 并不是很有必要，做了一些改动。最终的硬盘分区结构为（以 512GB 硬盘为例）：操作步骤：下载 Ubuntu，制作 USB 安装盘（过程略）。——然后，强烈建议在整个安装过程之前，在电脑的 BIOS 里，把内置的其它硬盘暂时卸载（但很多 BIOS 并没有这个功能…）。安装程序配置 Grub 引导程序的过程，会干扰本机硬盘内原有的操作系统（尤其是本机也装了 Linux 的情况）。插上移动硬盘和 USB 启动盘。从 U 盘启动电脑，选择 Try Ubuntu。最新的 Ubuntu 22.04 安装程序里，已经内置了所需的 cryptsetup 和 cryptsetup-initramfs…

2024-02-13
Mastodon: 将媒体文件存放在本地（docker 版）

本攻略适用于—— 这个搭配虽然不多见，但其实用起来满爽的。很多人用的 s3 服务都是在薅羊毛，而 mastodon 那个变态的，把别人家的媒体文件缓存到自家的架构，流量的吞吐其实很大的（开了 relay 就更夸张），薅羊毛时很容易就超出了。反而是 vps 本身的流量上限很高。对于个人建站而言，媒体文件总量通常 <50GB，某些 vps 自带 200GB 硬盘，足够用了。缺点是，除了数据库定期备份外，也要考虑媒体文件的异地备份问题。但其实只需要备份存储本地附件的 media_attachments，而 cache 是不需要备份的，所以工作量也不大。两年前我把媒体文件转移到本地时，参照了 antisocial science 的设置。但因为我用 docker，官方默认的设置，docker 内外权限不一致，无法将媒体文件写到本地。于是匆匆又在本地建了个 minio s3 来中转……这样其实很浪费资源了，minio 的开销也不小。所以最近趁着搬家，又试了一下，终于把 docker + 本地存储跑通了。 1. 在 docker-compose.yml 里， web 和 sidekiq 容器中，已经预设了媒体文件的卷映射这个不用动。——也可以改成其它的路径，但要和后面的设置一致（本文用相同的颜色标明）。 2. 修改 .env.production PAPERCLIP_ROOT_URL 是服务器的所有媒体文件链接的子文件夹名称，形如：默认值是 /system；但是建议改成独特一些的名字，而且建议和 S3_BUCKET 一致。以后需要在本地存储和 s3 之间转换时，可以省一点心。（所以要独特一些，防止回头在 s3 上和别人撞名）…

2023-08-30
Fediverse: 是否要自建实例？

之前和人聊到，自建 fediverse 实例时，和在其它实例做注册用户相比，一些不同的体验。然后发现，谈到的许多东西，对于没有自建经历的网友，还是很新鲜的。所以索性在这里列出来，让大家了解一下。自建实例的优点 1. （可能）更好的稳定性是的，自建并不是「不稳定」的代名词；恰恰相反，如果技术能力达标，个人实例因为开销相对较少，稳定性反而比很多中小型实例要高。即使我完全有能力，担任几百名用户的实例管理员；和维护一个我自己用的实例相比，我也是对后者的稳定性更有信心的。而另一方面，现有实例的站长们，也未必都是很靠谱的。他们会因为各种技术、非技术、甚至搞笑的原因，导致站点无法访问。常见例子包括：目前 fediverse 更换一次账号，还是满麻烦的；也并没有旧帐号数据的导入功能。所以，如果想要让自己的账号，长久地存在下去，自建可能是更好的选择。以及，自建实例有更好的安全性。——像 fediverse 这类的程序，暴露出的系统漏洞，其中相当大一部分，都是通过「站内用户的恶意攻击」来触发的（譬如上传会包含代码的媒体文件）。如果这个站点只有你自己在使用，那么，这类漏洞，对你来说是无关紧要的。 2. 更好的隐私控制之前写过一篇《Fediverse 站长都能看到什么？》。普通用户的很多未公开信息，对于所在实例的站长，技术上都是可见的。如果你在这些隐私方面有所顾虑，或者打算把 fediverse 账号当成私密日记来用，那么，自己建站，信息被不相干的人看到的可能性，会更少一些。 3. 管理自己的全部数据现有的 fediverse 服务程序，为普通用户提供了数据导出功能，但导出的数据内容很有限。譬如 mastodon 导出的数据中，包括：但并不包括：其它程序的数据导出，也都大同小异（twitter 也差不多）；有的甚至会更少，譬如支持和 fedi 账号互 fo 的，图书管理程序 bookwyrm，用户能导出的，只能用惨烈来形容（只有书的链接；没有书的标题和简介！没有你的书评！）。如果你希望未来也能够看到这些自己交互过的信息，而不是随着网站的消失而听天由命，那么，可能一开始就选择自建比较好。另外，mastodon 的搜索功能，做的很差劲的（尤其是中文）。elastic search 的开销极其巨大，效果也不好。虽然我也很少用搜索功能，但一旦真的有什么信息，需要精确查找，直接在自己建的站里用 SQL 搜索数据库，要舒适很多。 4. 更少的站内约束很多 fediverse 实例，是有其内部的聊天「氛围」的。一些和氛围不合拍的发言，可能会遭到实例其它用户的抵制，甚至举报。很多时候，这样的分歧可能无关对错，但多少会对发言者产生困扰和拘束。又或者，站长决定，或者通过「民主表决」的方式，让全站屏蔽了某个实例，而你可能并不希望这样。如果是自建的话，做自己的站长，这样的约束可能会少一些。——虽然偶尔还是会看到一些来自外站的举报，但跨站举报本来就没有相应的处理和交互机制，无视就可以了。以及，我并不是指，自建站就可以肆无忌惮地发色情或者仇恨言论，那可能会让你的整个站点，被其它实例屏蔽的。 5. 使用自己的个性域名作为账号这样看起来比较酷。但也仅仅是比较酷而已。 6. 免翻墙随着 fediverse 逐渐进入某国审查机构的视野，那些几百甚至几十人的实例，未来被封杀的可能性也会急剧增加。相对来说，用个人域名在海外服务器搭建的，个人使用的实例，短期内被封的可能性，还不是很大。自建站的用户不必翻墙，就可以直接通过自己的实例，访问到其它被封实例的内容。——当然，翻墙属于必备技能，所以这也算不上是多大的优点。自建实例的缺点…

2023-07-07
Fediverse: 你的站长都能看到什么？

当你注册成为某个 fediverse 实例（mastodon pleroma misskey …）的用户时，你所在的实例，可能是几十万用户的大站，站长离你遥不可及；也可能是几十个甚至几个用户的小站，站长和你关系密切，每天一起聊天玩耍。但无论是哪种，你的站长，都能看到和你有关的哪些内容呢？我觉得这是你应该知道的。首先，所有人都能看到的：然后，是你能看到，其它用户看不到，而且你可能也不希望别人看到的。这些，你的站长都能看到：最后，是你作为普通用户也看不到，但你的站长能看到的：还有哪些？欢迎大家补充~ P.S.

2023-07-03
关于 RSS 订阅器，以及推荐自建 tt-rss

RSS 订阅器，大致上分三种：现有的网络服务，如当年的 Google Reader 单机版的订阅器自建网络服务从 Google Reader 停止服务，到现在快 10 年了。之后的所谓「老牌」订阅服务，如 feedly、inoreader，都限制了免费用户的订阅数量，不能超过 100 或 150 条。倒不是非要坚持用免费的，只是：首先，这些服务并没有如当年大家期望的，在用户与用户之间，发展出推荐阅读之类的社区功能；其次，如果有一天，它们也像 Google Reader 那样倒闭了，在这些订阅器里镜像的 blog 文章也全都消失，才是最大的损失。单机版的订阅软件有很多，一些邮件客户端甚至手机浏览器，也有这方面功能。所以问题还是抓取的文章能不能长久保存？哪怕重新装机，原来的文章也还在？有很多免安装的 RSS 订阅器，但其中大部分都是十几年前 blog 时代的作品，早已停止更新，对新的操作系统以及新的 rss atom 协议，支持都不好。Windows 下我在用 QuiteRSS，感觉不错。免安装，数据保存在 sqlite 文件里，似乎也有 Mac 版本。以及，这类本地订阅器，有没有可能，通过网盘同步数据，从而实现多台机器或手机同时使用？我还没有见过这方面靠谱的方案。自建 RSS 服务里，很多人推荐界面简洁的 Miniflux，我以前试过，感觉还行，但似乎有因为过于简化而不适的地方，忘了具体是什么了。/ 最终选择了 tt-rss （Tiny Tiny RSS），界面确实要比 Miniflux 臃肿一些，响应慢一些，但是它有一个非常亮眼的功能：你在 tt-rss 订阅器里，可以选择「发布」某些喜爱的文章，而这些发布出来的文章，是能够生成一个新的 RSS…

2022-05-15
关于 fediverse 的删除机制

在当前的很多 fediverse 服务（mastodon、pleroma…）里，当 A 站的用户 a 被另一个实例（譬如：B 站）的用户关注时，他所发的嘟文，会在 B 站的服务器上储存一个副本，B 站的用户，通过访问这个副本，来阅读这条嘟文。当原本的嘟文被删除时，A 站会通知 B 站，删除相应的副本。但这个时候，这条嘟文未必像人们期待的那样，从 fediverse 上彻底消失。假设存在如下情况： A 站的 a 用户 B 站的 b 用户，b 在关注 a C 站的 c 用户，c 在关注 b，但 C 站没有人关注 a a 发了一条公开嘟文，此时 b 可以看到这条嘟文，而 c 是看不到的。 b 转发了 a 的这条嘟文，此时 c 可以看到这条嘟文了。C 站的所有人，在查询 a 的时候，也都可以看到 a 的这条嘟文。如果这个时候，a 再把这条嘟文删除，那么…

2021-09-12
Mastodon 的「去中心化」所导致的……？

论文研究表明，在 Mastodon 的去中心化网络里，用户之间的关联状况，其实比 twitter 更加高度集中。——但这种现象可能仅仅是因为 Mastodon 的机制设计问题，而并不应该归咎于「去中心化」。

2021-02-23
个人 VPS 上的服务安装（未完稿）

这篇文章要讨论的是，如何在一台轻量级的 VPS 服务器上，基于自己的域名，同时安装如今各种流行，去中心化的网络服务：个人博客：Wordpress ActivityPub 社交网络：Pleroma 或 Mastodon Matrix 聊天服务器：Synapse 或 Dendrite 个人网盘和在线办公套件：Nextcloud 然而，原本我一直在用 Linode 每月 5 美元，1C1G（1个CPU，1G内存）的服务器，打算安装的服务，也是基于这个级别的配置。然而弄到一半，突然被乔乔推荐了 Contabo 每月 5 欧元（要一次缴一年，不然有额外费用），4C8G 的服务器。虽然实际速度和网速，并不比 Linode 或 Vultr 好多少，但 8G 内存，选择各种服务的余地可就大多了。所以我整理出来的 1C1G 方案，自己并没有在用……原因我后面会说。之前也犹豫，既然同样价钱都能 4C8G 了，那为啥还要写 1C1G 的方案？很快大家的配置也都会变高级了吧？但想想也未必，还是整理一下吧。这篇文章讨论如何在轻量级服务器里塞进各种服务。——前提是这台服务器，假定只会有你一个人在用，最多加上你的闺蜜和男朋友。我并不知道几十个用户的 Mastodon 会有怎样的开销，至少在 1C1G 上这样做非常不靠谱。我所面向的，只是两三个好友自用的私人 VPS 而已。这篇文章不是写给小白用户的。整个系统还是很复杂的。指望有一个教程，或者一个 docker-compose，能够让完全不懂 Linux 的用户，通过逐行复制命令，就能搞定所有的安装，目前还不现实。你至少要有在完全理解的基础上，用 LNMP 搭出 Wordpress 的能力。所以我也没必要把用过的每一条命令，都放在这篇文章里。——对于每一项服务，我会尽量给出相关靠谱攻略的链接，并且讨论一下里面的坑，和我个人所作的选择。所以，其实这篇文章本质上就一句话：是的，这些服务都可以装到一台机器上，不冲突。我弄过了，没问题，你们放心慢慢弄吧。安装环境：一台 1C1G（或更好的） VPS 服务器，一个你自己的域名。

2021-02-12
hello fediverse

当我说 mastodon 难部署的时候，并不是作为一个建站小白说的。用自己的域名和大约每月5刀的服务器，我可以很轻松地搭建一个 mastodon 实例，用 docker 部署则更简单。——如果我对这个服务器没其它需求的话。问题在于，对于大多数有建站情操和能力的人来说，建站优先级最高的未必是 mastodon，而是 wordpress 啊。把这两套系统同时塞进一个服务器，理论上是能做到的，但其麻烦程度让我实在没欲望去折腾。而为这两个系统买两个服务器，又总觉得很耻辱，和小白们每个服务交一份钱有啥区别…… 另一方面，尽管 mastodon 存在单用户模式，但真的建了实例只有自己一个人用的话，整套 mastodon 程序功能其实是很冗余的。所以对于个人用户而言，要做的可能并不是自建 mastodon 实例，而是寻找其它可以通过 ActivityPub 协议，和 Fediverse 用户进行沟通的程序。——目前似乎还没有太理想的。 write.as 正在做，我去试了试，用户可以在 Fediverse 上 follow @[email protected] ；wordpress 也有类似的插件（等我先给自己域名申请 SSL ……）。但似乎都只能让 Fediverse 用户「订阅」这个站点，而不能反向和他们回复沟通。所以还要继续关注 Fediverse 的新进展。据说 nextcloud 已经可以支持 ActivityPub 和 mastodon 沟通了。——网上的免费服务器没这个功能，需要自建 nextcloud 然后挂载相关服务，哪位愿意折腾试试靠谱不？但似乎 nextcloud 还不支持发布 blog？？（怒吼：为什么，明明这个更容易啊）。不然 nextcloud 就已经很一站化了。

2020-10-21
笔记软件 Joplin

用 Joplin 当作笔记软件很久了，个么正式安利一下。我用笔记软件基本是为了个人写作、记录想法、以及同步查看一些文本资料。对于富文本编辑、Web Clip、以及团队协作，完全没需求。最初用的是 Evernote，但自从印象笔记分裂那会儿，就基本放弃了。Onenote 这种连 Ctrl a 都不能用的笔记更是看了一眼就放弃。后来用了很长时间的 Simplenote，——这个确实不错，即使现在我也会向人推荐。只是如今对于把数据交给服务商而自己无法控制备份，越来越难以容忍，而且 Joplin 的一些特性确实感觉更舒服一些。 Joplin 的优点：不依赖于单一的服务器。笔记存储方式包括本机存储（不同步、或者手动用网盘同步），和多种网盘同步：Dropbox、Onedrive、Nextcloud、WebDAV（如墙内的坚果云）。而且同步时是从笔记软件直接访问网盘，不需要专门在电脑上安装网盘的客户端。各个平台的客户端种类完备：Win、Mac、Linux、Android、iphone…… 支持笔记文本加密，防止通过直接访问网盘或本地文件夹看到笔记内容。支持 markdown，软件界面还算友好，关键是可以调用其它外置编辑器来写作。也有 Web Clip 插件以及支持贴图，但我没用过这方面功能。支持多个笔记本，笔记本之间支持多层树结构。方便管理，支持 tag。开源。缺点：缺少一个单纯通过 web 浏览器访问笔记的方式。如果没有任何电脑或手机客户端的话，很难通过直接访问网盘，来查看笔记。网盘上的笔记文件通常是加密的，即使不加密，每条笔记的文件名也是编码过的，并不能直观地从文件夹里找到文件。我问过开发组，能不能改成用可识别文本，直观显示文件名，被回复无法做到；虽然我觉得技术上应该是可行的。因为这个缘故，我到现在还同时在用着 Simplenote，以便偶尔在公用电脑上处理一些笔记。 Update：经推友推荐，发现已经有人做了通过浏览器访问 Joplin 笔记的服务器程序，基于 Python 开发，也已经有 Docker 的部署版本。但对一般用户而言，自建这种 web 服务器的门槛还是太高了。

2020-09-15