
每个同学可能都遇到过以下疑惑:
- 学完 Rust 后,还做了些题,接下可以做些什么?
- 需要找一个依赖,但是去哪里找?哪些比较好用?哪些有坑?愁啊
- 要访问一个文件,哎,但记不住代码,要不百度或谷歌一下吧,最后发现结果往往不尽如人意
而 Rusty Book 就是帮助大家解决这些问题的。
在 Rust 元宇宙,夸奖别人的最高境界就是 rusty
: 今天你"锈"了吗? 你的 Rust 代码好锈啊!
而本书,就是精选了各种开源库和代码片段,帮助大家打造优"锈"的 Rust 项目。
以往的锈
以往,想要锈起来,你需要做到以下两步:
-
为项目挑选 Awesome 依赖库 但是目前已有的 awesome-rust项目有非常大的问题:里面鱼龙混杂,因为它的目的是列出所有项目,但对用户而言,更想看到的是可以在生产中使用的、稳定更新的优秀项目。
-
在 Cookbook 中查询实用的代码片段,直接复制到项目中 对于开发者而言,Cookbook 非常实用,几乎每一门编程语言都是如此。原因无他:聪明的开发者大部分时间不是在复制粘贴就是在复制粘贴的路上。而 CookBook 恰恰为各种实用场景提供了可供直接复制粘贴的代码,例如网络协议、数据库和文件操作、随机数生成、命令行解析等。
但目前的 Rust Cookbook 更新非常不活跃,里面缺少了大量实用库,还有一些过时的老库。
现在的锈
鉴于以上痛点,我们决定打造一本真正的锈书:一本足够"锈"但是又不会锈的书。
这本书其实就是 Awesome Rust + Rust Cookbook 的结合体,但是我们不是简单粗暴的对内容进行了合并,而是从深层次将两者进行了融合,希望大家能喜欢。
这本书的读者
本书适合所有程度的 Rust 开发者使用:
- 新手用来了解 Rust 的常用库和常用代码片段
- 老手在写代码时,可以直接用来复制粘贴,大幅提升工作效率
毕竟咱不是在面试造飞机,谁脑袋中能记住文件操作的各种细节,对不?
日常开发常用库
目录索引
- 多线程
- Web/HTTP, SQL客户端, NoSql客户端, 网络通信协议, 异步网络编程
- 服务发现, 消息队列, 搜索引擎
- 编解码, Email, 常用正则模版
- 日志监控, 代码Debug, 性能优化
Web/HTTP
-
HTTP客户端
- reqwest 一个简单又强大的HTTP客户端,
reqwest
是目前使用最多的HTTP库
- reqwest 一个简单又强大的HTTP客户端,
-
Web框架
- axum 基于Tokio和Hyper打造,模块化设计较好,目前口碑很好,值得使用Ergonomic and modular web framework built with Tokio, Tower, and Hyper
- Rocket 功能强大,API简单的Web框架,但是主要开发者目前因为个人原因无法进行后续开发,未来存在不确定性
- actix-web 性能极高的Web框架,就是团队内部有些问题,未来存在一定的不确定性
- 总体来说,上述三个web框架都有很深的用户基础,其实都可以选用,如果让我推荐,顺序如下:
axum
>Rocket
>actix-web
。 不过如果你不需要多么完善的web功能,只需要一个性能极高的http库,那么actix-web
是非常好的选择,它的性能非常非常非常高!
日志监控
- 日志
[crates.io] [github]
- tokio-rs/tracing 强大的日志框架,同时还支持OpenTelemetry格式,无缝打通未来的监控
- rust-lang/log 官方日志库,事实上的API标准, 但是三方库未必遵循
- estk/log4rs 模仿JAVA
logback
和log4j
实现的日志库, 可配置性较强 - 在其它文章中,也许会推荐slog,但是我们不推荐,一个是因为近半年未更新,一个是
slog
自己也推荐使用tracing
。
- 监控
- OpenTelemetry
OpenTelemetry
是现在非常火的可观测性解决方案,提供了协议、API、SDK等核心工具,用于收集监控数据,最后将这些metrics/logs/traces数据写入到prometheus
,jaeger
等监控平台中。最主要是,它后台很硬,后面有各大公司作为背书,未来非常看好! - vectordotdev/vector 一个性能很高的数据采集agent,采集本地的日志、监控等数据,发送到远程的kafka、jaeger等数据下沉端,它最大的优点就是能从多种数据源(包括Opentelemetry)收集数据,然后推送到多个数据处理或者存储等下沉端。
- OpenTelemetry
SQL客户端
-
性能对比
- metrics 该库对Rust现存的数据库连接服务进行性能测试,若大家有性能上的需求,值得一看
-
通用
- launchbadge/sqlx 异步实现、高性能、纯Rust代码的SQL库,支持
PostgreSQL
,MySQL
,SQLite
,和MSSQL
.
- launchbadge/sqlx 异步实现、高性能、纯Rust代码的SQL库,支持
-
ORM
- rbatis/rbatis 国内团队开发的ORM,异步、性能高、简单易上手
- diesel-rs/diesel 安全、扩展性强的Rust ORM库,支持
Mysql
、Postgre
、SqlLite
-
Mysql
- blackbeam/rust-mysql-simple 纯Rust实现的Mysql驱动,提供连接池
- blackbeam/mysql_async 基于Tokio实现的异步Mysql驱动
- 上面两个都是一个团队出品,前者文档更全、star更多,建议使用前者
-
Postgre
- sfackler/rust-postgres 纯Rust实现的Postgre客户端
-
Sqlite
NoSql客户端
-
Redis
- mitsuhiko/redis-rs 虽然最近更新不太活跃,但是它依然是最好的redis客户端,说实话,我期待更好的,可能这也是Rust生态的未来可期之处吧
-
Canssandra
- krojew/cdrs-tokio [cdrs-tokio] 生产可用的Cassandra客户端,异步、纯Rust实现,就是个人项目 + star较少,未来不确定会不会不维护
- scylla-rust-driver ScyllaDB提供的官方库,支持cql协议,由于背靠大山,未来非常可期
-
MongoDB
- mongodb/mongo-rust-driver 官方MongoDB客户端,闭着眼睛选就对了
分布式
服务发现
- luncj/etcd-rs 异步实现的Rust etcd客户端,优点是有一定的文档、作者较为活跃,意味着你提问题他可能会回答,不过,如果你不放心,还是考虑使用HTTP的方式访问ETCD
消息队列
- Kafka
- fede1024/rust-rdkafka Rust Kafka客户端,基于C版本的Kafka库[librdkafka]实现,文档较全、功能较为全面
- kafka-rust/kafka-rust 相比上一个库,它算是纯Rust实现,文档还行,支持Kafka0.8.2及以后的版本,但是对于部分0.9版本的特性还不支持。同时有一个问题:最初的作者不维护了,转给了现在的作者,但是感觉好像也不是很活跃
- Nats
- nats-io/nats.rs Nats官方提供的客户端
网络、通信协议
- Websocket
- snapview/tokio-tungstenite 更适合Web应用使用的生产级Websocket库,它是异步非阻塞的,基于基于下下面的
tungstenite-rs
库和tokio实现 - rust-websocket 老牌Websocket库,提供了客户端和服务器端实现,但是。。。很久没更新了
- snapview/tungstenite-rs 轻量级的Websocket流实现,该库更偏底层,例如,你可以用来构建其它网络库
- snapview/tokio-tungstenite 更适合Web应用使用的生产级Websocket库,它是异步非阻塞的,基于基于下下面的
- gRPC
- hyperium/tonic 纯Rust实现的gRPC客户端和服务器端,支持async/await异步调用,文档和示例较为清晰
- tikv/grpc-rs 国产开源之光Tidb团队出品的gRPC框架, 基于C的代码实现, 就是最近好像不是很活跃
- 其实这两个实现都很优秀,把
tonic
放在第一位,主要是因为它是纯Rust实现,同时社区也更为活跃,但是并不代表它比tikv
的更好! - tokio-rs/prost 纯Rust实现的Protocol Buffers类库,Prost 支持从 proto2 和 proto3 文件生成简单、实用的代码。
- QUIC
- cloudflare/quiche 大名鼎鼎
cloudflare
提供的QUIC实现,据说在公司内部重度使用,有了大规模生产级别的验证,非常值得信任,同时该库还实现了HTTP/3 - quinn-rs/quinn 提供异步API调用,纯Rust实现,同时提供了几个有用的网络库
- cloudflare/quiche 大名鼎鼎
- MQTT
- bytebeamio/rumqtt MQTT3.1.1/5协议库,同时实现了客户端与服务器端broker
- ntex-rs/ntex-mqtt 客户端与服务端框架,支持MQTT3.1.1与5协议
- eclipse/paho.mqtt.rust 老牌MQTT框架,对MQTT支持较全, 其它各语言的实现也有
异步网络编程
- tokio-rs/tokio 最火的异步网络库,除了复杂上手难度高一些外,没有其它大的问题。同时tokio团队提供了多个非常优秀的Rust库,整个生态欣欣向荣,用户认可度很高
- async-std 跟标准库API很像的异步网络库,相对简单易用,但是貌似开发有些停滞,还有就是功能上不够完善。但是对于普通用户来说,这个库非常值得一试,它在功能和简单易用上取得了很好的平衡
- actix 基于Actor模型的异步网络库,但这个库的开发貌似已经停滞,他们团队一直在专注于
actix-web
的开发 - mio 严格来说,MIO与之前三个不是同一个用途的,MIO = Meta IO,是一个底层IO库,往往用于构建其它网络库,当然如果你对应用网络性能有非常极限的要求, 可以考虑它,因为它的层次比较低,所带来的抽象负担小,所以性能损耗小
- 如果你要开发生产级别的项目,我推荐使用
tokio
,稳定可靠,功能丰富,控制粒度细;自己的学习项目或者没有那么严肃的开源项目,我推荐async-std
,简单好用,值得学习;当你确切知道需要Actor网络模型时,就用actix
搜索引擎
-
ElasticSearch客户端
- elastic/elasticsearch 官方es客户端,目前第三方的基本都处于停滞状态,所以不管好坏,用呗
-
Rust搜索引擎
- Tantivy Tantivy是Rust实现的本地搜索库,功能对标
lucene
,如果你不需要分布式,那么引入tantivy作为自己本地Rust服务的一个搜索,是相当不错的选择,该库作者一直很活跃,而且最近还创立了搜索引擎公司,感觉大有作为. 该库的优点在于纯Rust实现,性能高(lucene的2-3倍),资源占用低(对比java自然不是一个数量级),社区活跃。
- Tantivy Tantivy是Rust实现的本地搜索库,功能对标
-
Rust搜索平台
- quickwit 对标ElasticSearch,一个通用目的的分布式搜索平台,目前还在起步阶段(0.2版本),未来非常可期,目前还不建议使用
- MeiliSearch 虽然也是一个搜索平台,但是并不是通用目的的,
MeiliSearch
目标是为终端用户提供边输入边提示的即刻搜索功能,因此是一个轻量级搜索平台,不适用于数据量大时的搜索目的。总之,如果你需要在网页端或者APP为用户提供一个搜索条,然后支持输入容错、前缀搜索时,就可以使用它。
代码Debug
性能优化
- bheisler/criterion.rs 比官方提供的benchmark库更好,目前已经成为事实上标准的性能测试工具
- Bytehound Linux下的内存分析工具,可以用来分析:内存泄漏、内存分配、调用栈追踪,甚至它还有一个浏览器UI! 懂的人都懂,性能测试工具的UI服务是多么稀缺和珍贵!
- llogiq/flame 专为Rust打造的火焰图分析工具,可以告诉你程序在哪些代码上花费的时间过多,非常适合用于代码性能瓶颈的分析。与
perf
不同,flame
库允许你自己定义想要测试的代码片段,只需要在代码前后加上相应的指令即可,非常好用 - sharkdp/hyperfine 一个命令行benchmark工具,支持任意shell命令,支持缓存清除、预热、多次运行统计分析等,尽量保证结果的准确性
多线程
- 消息通道channel
- crossbeam-channel, 老牌强库,功能较全,性能较强,之前是独立的库,但是后面合并到了
crossbeam
主仓库中 - flume, 官方给出的性能数据要比crossbeam更好些,但是貌似最近没怎么更新
- crossbeam-channel, 老牌强库,功能较全,性能较强,之前是独立的库,但是后面合并到了
- 并发原语(锁)
- parking_lot, 社区较为活跃,star较多,更新较为活跃
- spin, 在多数场景中性能比
parking_lot
高一点,最近没怎么更新 - 如果不是追求特别极致的性能,建议选择前者
编解码
- Serde 一个超高性能的通用序列化/反序列化框架,可以跟多种协议的库联合使用,实现统一编解码格式
- CSV
- BurntSushi/rust-csv 高性能CSV读写库,支持Serde
- JSON
- serde-rs/json 快到上天的JSON库,也是Rust事实上的标准JSON库,你也可以使用它的大哥serde,一个更通用的序列化/反序列化库
- MsgPack
- 3Hren/msgpack-rust 纯Rust实现的MessagePack编解码协议
- ProtocolBuffers
- tokio-rs/prost tokio出品,基本都属精品,此库也不例外,简单易用,文档详细
- stepancheg/rust-protobuf 纯Rust实现
- TOML
- alexcrichton/toml-rs TOML编码/解码,可以配合
serde
使用
- alexcrichton/toml-rs TOML编码/解码,可以配合
- XML
- tafia/quick-xml 高性能XML库,可以配合
serde
使用,文档较为详细
- tafia/quick-xml 高性能XML库,可以配合
- YAML
- dtolnay/serde-yaml 使用
serde
编解码YAML
格式的数据
- dtolnay/serde-yaml 使用
UI 开发框架
- 跨平台
- DioxusLabs/Dioxus 跨平台 UI 开发框架,支持
WASM
、Desktop
、TUI
等应用开发,文档较为详细
- DioxusLabs/Dioxus 跨平台 UI 开发框架,支持
- lettre/lettre — Rust SMTP库
常用正则模版
明星项目
滚滚长江东逝水,浪花淘尽英雄,是非成败转头空 - 临江仙·滚滚长江东逝水
经过大浪淘沙留下来的才是真金白银,对于开源项目也是如此。对于明星项目,本文不仅仅以star
数的多少作为评判维度,还会结合项目规模、影响力、活跃度、社区活跃度等多个方面进行评定,希望大家能喜欢。
需要注意,本文列出的几乎都是平台级项目,因此并不是star多,就能名列其中,例如很多star
很多的工具、Rust库、书籍都没有列入,如果大家想要看更多的子类项目,请访问对应的文件进行查看。
deno
首先出场的自然是咖位最重的之一,可以说正是因为deno
和swc
的横空出世,才让一堆观望的大神对于Rust实现Javascript
基建有了更强的信心。
deno
是node
半逆转后的字序,从此可以看出deno
是Node.js
的替代,它的目标是为Typescript/Javascript
提供一个更现代化、更安全、更强大 的运行时,同时内置了很多强大的工具,可以用于打包、编译成可执行文件、文档、测试、lint等。
alacritty
alacritty是一个跨平台、基于OpenGL的终端,性能极高的同时还支持丰富的自定义和可扩展性,可以说是非常优秀的现代化终端。
目前已经是beta
阶段,可以作为日常工具来使用。

starship
starship是一个命令行提示,支持任何shell
,包括zsh
,简单易用、非常快且拥有极高的可配置性。

MeiliSearch
MeiliSearch是一个搜索平台,但是跟ElasticSearch
不同,MeiliSearch
并不是通用目的的,它的目标是为终端用户提供边输入边提示的即刻搜索功能,因此是一个轻量级搜索平台,不适用于数据量大时的搜索目的。
总之,如果你需要在网页端或者APP为用户提供一个搜索条,然后支持输入容错、前缀搜索时,就可以使用它。

swc 🌟19.5k
swc
是Typescript/Javascript
编译器,它可以用来编译、压缩和打包JS,同时支持使用插件进行扩展,例如做代码变换等。
swc
目前正在被一些知名项目所使用,包括Next.js
,Parcel
和Deno
,还有些著名的公司也在使用它,例如Vercel
、字节跳动、腾讯等。
它的性能非常非常高,官方号称,在单线程下比Babel
快20倍,在4核心下比Babel
快70倍!
几个使用案例:

tauri
tauri可以用来更小、更快、更安全的桌面应用,它想要替代的是electron.js
。
下面是援引自官网的性能对比图:


yew
yew
是一个正在活跃开发的Rust/Wasm
框架,用于构建Web
应用。

firecracker
firecracker
是一个安全、高性能的无服务计算虚拟机(FaaS),支持多租户、资源隔离等高级特性,由Amazon公司开发,为AWS部分云计算服务提供了强力有的支持。BTW,亚马逊Amazon公司对于Rust语言的喜爱是众所周知的,几乎已经成了Rust的形象大使之一了:)
nushell
nushell
是一个全新的shell
,使用Rust
实现。它的目标是创建一个现代化的shell
:虽然依然基于Unix
的哲学,但是更适合现在的时代。例如,你可以使用SQL
语法来选择你想要的内容!

tokio
tokio
的名声可以说是如雷贯耳,如果学过Rust但是没有听说过它,那我觉得可能要回炉重造下:)
tokio
是一个异步IO的运行时,提供了I/O
、网络、调度、定时器等等异步编程所必须的功能和工具,性能和功能都异常强大。
AppFlowy
AppFlowy是Notion
的开源实现,使用Rust
和Flutter
进行开发,用于用户文档和数据的管理,支持丰富的自定义特性。

Bevy
bevy是一个数据驱动的游戏引擎,支持2D和3D图形开发,优点是社区活跃、更新快、模块化设计优秀、性能高,缺点是还处于快速开发中,并不适合生产使用。
同时bevy
的文档齐全,官方示例很多,非常适合学习和使用。

actix-web
actix-web是全世界最快的web框架之一,甚至可以把之一去掉,因为排在它前面的看上去像是一个专为跑分而生的轻量级框架,而actix-web
可是功能相当多的!
下面给出actix
和Go语言Gin
框架的性能对比:

iced
iced
是一个跨平台GUI库,具有简单易用、模块化设计、响应式布局等优点。

cube.js
cube.js
是一个数据分析API平台,可以用于构建内部的BI或为现有的应用增加客户数据统计等功能,使用Rust
和Typescript
构建。

wasmer
wasmer是业界领先的WASM
运行时,支持WASI
和Emscripten
。
$ wasmer qjs.wasm
QuickJS - Type "\h" for help
qjs > const i = 1 + 2;
qjs > console.log("hello " + i);
hello 3
tikv
tikv
相信大家都已知道,tidb
的底层存储服务,国人之光项目,在数据之外,还做了大量的技术知识普及工作,值得敬佩!
tikv
是分布式KV
数据库,支持分布式事务。

ruffle
ruffle
是用Rust写的Flash Player
模拟器,同时支持桌面端和Web端,其中后者通过WASM提供支持。
rustdesk
rustdesk
是国内团队开发的一款远程桌面软件。

RustPython
[RustPython
]是使用Rust
实现的Python
解释器, 支持Python3
(CPython >= 3.9.0)。
大家可以通过官方提供的在线网址进行尝试。

vector
vector
是一个性能很高的数据采集agent,采集本地的日志、监控等数据,发送到远程的kafka、jaeger等数据下沉端,它最大的优点就是能从多种数据源(包括Opentelemetry)收集数据,然后推送到多个数据处理或者存储等下沉端。

mdbook
mdbbok
可以基于markdown
文件自动创建在线电子书,非常简单好用,目前的问题就是缺乏章节内部的目录跳转和中文搜索。

zola
zola
是一个静态网站生成器,类似hugo
。

gitui
gitui
是一个奇快无比的Git终端UI,无需浏览器即可使用。

solana
solana
是知名的区块链平台,快速、安全、去中心化,还自带应用市场。
ripgrep
ripgrep
是一个性能极高的现代化grep
实现,后者是Unix/Linux
下的内置文件搜索工具。该项目是Rust的明星项目,一个是因为性能极其的高,另一个就是源代码质量很高,值得学习, 同时Vscode
使用它作为内置的搜索引擎。
从功能来说,除了全面支持grep
的功能外,repgre
支持使用正则递归搜索指定的文件目录,默认使用.gitignore
对指定的文件进行忽略。

citybound
citybound
是一个多人在线模拟游戏,使用Rust + WASM + JS开发。

bottlerocket
bottlerocket
是一个基于Linux
的操作系统,它的目标是为容器提供宿主环境。
lemmy
lemmy
是一个reddit
克隆,可以通过连接聚合的方式来构建社区,支持桌面和移动端。

tantivy
tantivy
是Rust实现的本地搜索库,功能对标lucene
,如果你不需要分布式,那么引入tantivy作为自己本地Rust服务的一个搜索,是相当不错的选择,该库作者一直很活跃,而且最近还创立了搜索引擎公司,感觉大有作为. 该库的优点在于纯Rust实现,性能高(lucene的2-3倍),资源占用低(对比java自然不是一个数量级),社区活跃。
sled
sled
是本地嵌入式的数据库。
redox
Redox
是一个Unix
风格的微内核操作系统,使用Rust
实现。redox
的目标是安全、快速、免费、可用,它在内核设计上借鉴了很多优秀的内核,例如:SeL4
, MINIX
, Plan 9
和BSD
。
但redox
不仅仅是一个内核,它还是一个功能齐全的操作系统,提供了操作系统该有的功能,例如:内存分配器、文件系统、显示管理、核心工具等等。你可以大概认为它是一个GNU
或BSD
生态,但是是通过一门现代化、内存安全的语言实现的。
不过据我仔细观察,redox目前的开发进度不是很活跃,不知道发生了什么,未来若有新的发现会在这里进行更新 - Sunface


youki
youki
是一个容器运行时,实现了OCI
标准,性能非常好的同时具备非常高的安全性, 目前来说,它的性能跟crun
差不多,比runc
快50%以上。
slint
slint
是一个GUI工具集,原名sixtyfps, 同时适用于嵌入式系统、桌面系统、移动端、浏览器(WASM),支持使用多种语言进行开发,背后有商业公司的支持,未来前景看好。
slint已于2023年4月发布1.0版本,标志着结束开发模式并已准备好在生产环境中使用。

wasmtime
wasmtime是一个为WASM
设计的JIT
风格的独立运行时,支持WASI
。
fn main() {
println!("Hello, world!");
}
$ rustup target add wasm32-wasi
$ rustc hello.rs --target wasm32-wasi
$ wasmtime hello.wasm
Hello, w
polkadot
polkadot
是知名的区块链平台,它是从Substrate
抽离出来,后者是下一代区块链开发框架。
lapce
lapce
是一款性能极高、功能强大、基于wgpu
渲染的代码编辑器,基于Xi-Editor
开发,后者Xi-Editor
曾经也红极一时,可惜不再维护了,但是依然非常适合做一个编辑器内核。

rust-gpu
rust-gpu的目标是让Rust成为GPU编程的第一梯队语言,由大名鼎鼎的Embark
公司开发,后台较硬。
如果需要通用的GPU
编程,选它就对了。
使用Rust增强Javascript
Javascript
是目前全世界使用最广的语言(TIOBE排行榜比较迷,JS并没有排在第一位,我个人并不认同它的排名)。在过去这么多年中,围绕着Javascript
已经建立了庞大的基础设施生态:例如使用webpack
来将多个js
文件打包成一个;使用Babel
允许你用现代化的js
语法编写兼容旧浏览器的代码;使用Eslint
帮助开发找出代码中潜在的问题,类似cargo clippy
。
以上的种种都在帮助js
成为更好的语言和工具,它们是Web
应用程序得以顺利、高效的开发和运行的基石。这些工具往往使用Javascript
语言编写,一般来说,是没有问题的,但是在某些时候,可能会存在性能上的瓶颈或者安全隐患,因此阴差阳错、机缘巧合下,Rust
成为了一个搅局者。
Javascript基建库
deno
首先出场的自然是咖位最重的之一,可以说正是因为deno
和swc
的横空出世,才让一堆观望的大神对于Rust实现Javascript
基建有了更强的信心。
deno
是node
半逆转后的字序,从此可以看出deno
是Node.js
的替代,它的目标是为Typescript/Javascript
提供一个更现代化、更安全、更强大 的运行时,同时内置了很多强大的工具,可以用于打包、编译成可执行文件、文档、测试、lint等。
值得一提的是,deno
的不少工具都使用了swc
进行建造,包括代码审查、格式化、文档生成等。
通过包引入的方式来对比下deno
和node
,大家可以自己品味下。
// node
const koa = require("koa" );
const logger = require("@adesso/logger")
// deno
import { Application } from "https://deno.land/x/oak/mod.ts";
import { Logger } from "https://adesso.de/lib/logger.ts"
swc
swc
是Typescript/Javascript
编译器,它可以用来编译、压缩和打包JS,同时支持使用插件进行扩展,例如做代码变换等。
swc
目前正在被一些知名项目所使用,包括Next.js
,Parcel
和Deno
,还有些著名的公司也在使用它,例如Vercel
、字节跳动、腾讯等。
它的性能非常非常高,官方号称,在单线程下比Babel
快20倍,在4核心下比Babel
快70倍!
几个使用案例:

官方还提供了一个在线运行的demo,功能齐全,可以试试。

Rome
Rome
可以用来对JavaScript
、TypeScript
、HTML
、JSON
、Markdown
和 CSS
进行lint、编译、打包等功能,它的目标是替代Babel
、ESLint
、webpack
、Prettier
、Jest
等。
一开始Rome
是使用Typescript
开发,目前正在用Rust
进行重写。有趣的是: Rome
的作者也是Babel
的作者, 后者还是他在学习编译原理时做的。
fnm
fnm
是一个简单易用、高性能的Node
版本管理工具,还支持.nvmrc
文件(nvm
的node
版本描述文件)
boa
boa
是一个高性能的javascript
词法分析器,解析器和解释器,目前还是实验性质的。

napi
napi
可以用于构建基于Node API
的Nodejs
插件,目前由nextjs
主导开发。
volt
volt
是一个现代化的、高性能、安全可靠的Javascript
包管理工具。目前该库正处于活跃开发阶段,只供学习使用。

neon
neon
可以用于写安全、高性能的原生Nodejs
模块。
resvg-js
resvg-js是一个高性能svg
渲染库,使用Rust + Typescript实现。下面的图片通过svg
实现(羞~~~):
deno_lint
deno_lint, 由deno
团队出品的lint
工具,支持Javascript/Typescript
,支持Deno
也支持Node
。
优点之一就是极致的快:
[
{
"name": "deno_lint",
"totalMs": 105.3750100000002,
"runsCount": 5,
"measuredRunsAvgMs": 21.07500200000004,
"measuredRunsMs": [
24.79783199999997,
19.563640000000078,
20.759051999999883,
]
},
{
"name": "eslint",
"totalMs": 11845.073306000002,
"runsCount": 5,
"measuredRunsAvgMs": 2369.0146612000003,
"measuredRunsMs": [
2686.1039550000005,
2281.501061,
2298.6185210000003,
]
}
]
rslint
rslint是一个高性能、可定制性强、简单易用的Javascript/Typescript
lint分析工具。
$ echo "let a = foo.hasOwnProperty('bar');" > foo.js
$ rslint ./foo.js
error[no-prototype-builtins]: do not access the object property `hasOwnProperty` directly from `foo`
┌─ ./foo.js:1:9
│
1 │ let a = foo.hasOwnProperty('bar');
│ ^^^^^^^^^^^^^^^^^^^^^^^^^
│
help: get the function from the prototype of `Object` and call it
│
1 │ let a = Object.prototype.hasOwnProperty.call(foo, 'bar');
│ ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
│
╧ note: the method may be shadowed and cause random bugs and denial of service vulnerabilities
Outcome: 1 fail, 0 warn, 0 success
help: for more information about the errors try the explain command: `rslint explain <rules>`
rusty_v8
rusty_v8是v8
的Rust语言绑定,底层封装了c++ API
。
用WASM增强JS
wasm
wasm(web assembly)是一种低级语言,它运行在浏览器中,可以和javascript
相互调用,几乎所有浏览器都支持, 而且目前有多种高级语言都可以直接编译成wasm
,更是大大增强了它的地位。
目前来说Rust可以编译成wasm
,虽然还不够完美,但是它正在以肉眼可见的速度快速发展中。因此同时使用Rust
和Javascript
成为了一种可能:将Rust
编译成wasm
,再跟js
进行交互,两者共生共存,各自解决擅长的场景(wasm
性能高,js
开发速度快)。
yew
yew
是一个正在活跃开发的Rust/Wasm
框架,用于构建Web
客户端应用。

gloo
[gloo]是一个模块化的工具,使用Rust/WASM
构建快速、可靠的Web
应用。
wasm-bindgen
wasm-bindgen可以让WASM
模块和Javascript
模块进行更好的交互。
wasm-pack
wasm-pack是一站式的解决方案,用于构建和使用Rust生成的WASM,支持在浏览器中或后台的Node.js
中与Javascript
进行交互。

wasmer
wasmer是业界领先的WASM
运行时,支持WASI
和Emscripten
。
$ wasmer qjs.wasm
QuickJS - Type "\h" for help
qjs > const i = 1 + 2;
qjs > console.log("hello " + i);
hello 3
wasmtime
wasmtime是一个为WASM
设计的JIT
风格的独立运行时。
fn main() {
println!("Hello, world!");
}
$ rustup target add wasm32-wasi
$ rustc hello.rs --target wasm32-wasi
$ wasmtime hello.wasm
Hello, world!
trunk
trunk是一个WASM
构建、打包、Web发布工具。
photon
photon是高性能的、跨平台的图片处理库,使用Rust
开发,编译成WASM
运行,为你的Web应用和Node.js
应用提供无与伦比的图片处理速度,当然,它既然使用Rust
开发,也可以作为一个库被你的后台程序所使用。

tinysearch
tinysearch是一个搜索工具,用于静态网站中的内容搜索,使用Rust
和WASM
构建。优点是体积小(适用于浏览器)、性能高、全文索引。

wasm-pdf
wasm-pdf通过Javascript
和WASM
来生成PDF
,可以直接在浏览器中使用。
makepad
makepad是一个充满创意的Rust开发平台,支持编译成wasm
,并使用webGL
进行渲染。

Rust + Javascript学习教程
wasm-book
wasm-book是一本讲述Rust
和wasm
的书,篇幅不算长,但是值得学习,还包含了几个很酷的例子。
wasm-learning
wasm-learning
是一个英文教程,用于学习Rust
, wasm
和Node.js
,你可以学会如何使用Rust
来为Nodejs
构建函数,可以同时利用Rust
的性能、wasm
的安全性和可移植性、js
的易用性。
rust-js-snake-game
rust-js-snake-game
是一个用rust + js + wasm
构建的贪食蛇游戏。
游戏
我们精心挑选了一些用Rust写得优秀游戏,希望大家喜欢:)
目录索引
游戏名 | 描述 |
---|---|
veloren | 多人在线3D PRG游戏 |
citybound | 多人在线城市模拟游戏 |
sandspiel | 创意游戏-落沙世界 |
fish fight | 多人2D射击策略游戏 |
doukutsu | Cave Story 重制版 |
rusted ruins | 开发世界、像素游戏 |
sulis | 回合制策略游戏 |
zemeroth | 2D棋盘策略游戏 |
mk48 | 2D多人在线海战游戏 |
theta wave | 2D太空射击游戏 |
rust doom | 模仿Doom 的射击游戏 |
veloren
Veloren是一款多人在线3D RPG游戏,该游戏借鉴了Cube World
、Minecraft(我的世界)
和Dwarf fortress
。
目前游戏开发非常活跃,也是Rust目前游戏中最有前景的之一,值得看好,当前已经可以玩,你可以通过官方地址在线试玩。

citybound
citybound是一个多人在线模拟游戏,使用Rust + WASM + JS开发。

sandspiel
sandspiel是一款很有创意、很艺术的游戏,通过天上落下的沙子来构建美丽的沙世界。该游戏使用Rust + wasm + webgl + js(胶水,用来粘合前几个)构建。
你可以在线试玩,尝试构建自己的沙世界。

fish-fight
Fish Fight是一款2D射击策略游戏,支持最多4人一起玩,可以通过在线的方式或共享屏幕的方式玩,总之这是一款相当不错的游戏,官网做得也很酷。

doukutsu
doukutsu是2004年发行的视频游戏Cave Story
的重制版,使用Rust开发。
rusted-ruins
rusted-ruins是一个开放世界2D像素游戏,用户可以在里面探索各种野外和废墟。
目前游戏还处于较为早期阶段,但是开发活跃。
sulis
sulis是一款回合制策略游戏,包含了一个从零开发的引擎,目前游戏已经具备相当高的可玩性,你还可以选择不同的势力,感兴趣的同学可以一试。

zemeroth
zemeroth是一个2D棋盘策略游戏,通过Rust + WASM实现。
你可以通过在线网址,使用WASM来体验这个游戏。
mk48
mk48是一个2D海战游戏,支持多人在线和和多语言(包括中文),你可以通过官方网址在线试玩: https://mk48.io。
theta wave
Theta Wave是一款2D太空射击游戏,基于Amethyst
引擎开发。
在游戏中,你扮演的是保卫目标的飞船,游戏的目标是通过摧毁敌人来存活,还可以收集货币用于购买对你的生存有帮助的物品,并击败最终BOSS取得胜利。
rust doom
Rust doom是一款模仿Doom 1&2
的简单射击游戏,需要注意,它并不是一个Doom
移植版。
游戏开发
我在这里大胆预言:Rust未来会成为和C++
同级别的游戏开发语言,特别是在游戏引擎方面,会大放异彩。
目录索引
- 游戏引擎: bevy, fyrox, ggez, oxygengine, macroquad, godot-rust, piston, amethyst
- GPU和图形渲染: wgpu, rust-gpu,kajiya, lyon, ash, vulkano, rend3, rafx, gfx, luminance, miniquad, glow
- 学习资料和新闻
游戏引擎
Bevy
bevy是一个数据驱动的游戏引擎,支持2D和3D图形开发,优点是社区活跃、更新快、模块化设计优秀、性能高,缺点是还处于快速开发中,并不适合生产使用。
同时bevy
的文档齐全,官方示例很多,非常适合学习和使用。

Fyrox(前rg3d)
fyrox是一个2D
和3D
游戏图形化引擎,功能丰富,生产可用(官方宣称)。
该项目前身是rg3d
,但是被收购后,更名为fyrox
,潜力应该是相当好的,下面截图来源于基于该引擎开发的游戏StationIapetus
。

ggez
ggez是一个轻量级的2D
游戏图形引擎,它的目标是让游戏开发尽量的简单,因此它的功能并不是很强大,例如如果你想要强大且真实的物理引擎,它可能无能为力,但你可以选择在它的基础上构建自己的更高级的引擎。

oxygengine
oxygengine是一个2D
HTML5游戏引擎,支持编译成WASM在浏览器中运行。

macroquad
macroquad是一个2D
游戏引擎,特点是简单易用,例如它试图让使用者不会遇到Rust生命周期的难题。
godot-rust
godot-rust是大名鼎鼎的godot
引擎的Rust
绑定,godot
是c++
开发的游戏2D/3D
引擎,但是对Rust语言提供了很好的支持。

piston
piston是前两年较火的模块化的游戏引擎,但是最近半年开发速度缓慢,我调查了一番,但不清楚发生了什么。
Amethyst
Amethyst, 前几年较火的Rust游戏引擎,但是最近开发已经停滞,经过我调查,是因为作者团队转型Rust游戏开发知识分享,因此项目被放弃。
GPU和图形渲染
wgpu
wgpu是一个纯Rust实现的图形化API库,具有安全、可移植等优点,如果你使用基于wgpu
构建的库,那该库可以很多平台上运行:Linux, windows, MacOS, Android和IOS。
它可以原生的运行在Vulkan
, Metal
等主流平台上,且可以使用wasm
的方式运行在WebGPU
上,同时API兼容WebGPU
标准。
总之,如果你要使用WebGPU
, 选它就对了。
rust-gpu
rust-gpu的目标是让Rust成为GPU编程的第一梯队语言,由大名鼎鼎的Embark
公司开发,后台较硬。
如果需要通用的GPU
编程,选它就对了。
kajiya
kajiya是一个实时的、全局光照渲染系统,由Embark
公司开发,该公司在秘密研究基于Rust的游戏引擎,据说准备应用在新游戏上,有朝一日它可能会是推动Rust游戏引擎爆发式发展的功臣。
kajiya
应用了非常先进的论文和设计理念,因此非常值得有志于游戏引擎开发的同学学习。但目前还不适用于生产级使用,具体见这里。

lyon
lyon可以使用GPU进行向量路径渲染,例如高效渲染复杂的svg
等。
ash
ash是一个轻量级的Vulkan
绑定。

vulkano
vulkano是一个安全、特性丰富的Vulkan
绑定。
rend3
rend3是一个简单易用、可定制性强、高效的3D渲染库,基于wgpu
开发。

rafx
rafx是一个多后端渲染器,目标是性能、扩展性和生产力。

gfx
gfx是一个底层的图形库,目前已经不怎么活跃,主要原因是:它的核心组件gfx-hal
最开始的目标是为wgpu
提供功能,但是后面wgpu
实现了自己的wgpu-hal
,因此gfx-hal
目前仅处于维护状态。
luminance
luminance是一个类型安全、无状态的图形框架,目标是让图形渲染变得简单和优雅,最开始是通过Haskell
语言实现,然后在2016
年移植到Rust
上。
它很简单,功能也不够强大,如果你没有OpenGL
、Vulkan
的经验,可以使用它做一些简单的图形渲染项目试试。
miniquad
miniquad是一个安全和跨平台的图形渲染库,它提供了较为底层的API,如果需要抽象层次更高的API,可以使用之前提到的macroquad,后者是基于miniquad
封装实现。

glow
glow提供了各种GL
绑定(OpenGL, WebGL), 提供了一定的抽象,避免你写平台相关的特定代码实现。
学习资料
游戏开发最新新闻
一些学习资料(英文)
- Hands-on Rust
- 使用bracket-lib和其配套书籍进行学习
- 想要没有困难的开发一个跨平台的2D游戏?使用
macroquad
,并且可以参考用它开发的两个游戏: fish fight和zemeroth - 想要开发一个简单的3D游戏并且需要一个编辑器?可以试试
fyrox(rg3d)
- 想要开发一个复杂的游戏或者想要做一个demo,未来可以基于该demo继续开发,最终完成一个复杂游戏?可以试试
godot
引擎提供的Rust
绑定:godot-rust - 喜欢钻研前沿技术?试试
bevy
,它拥有最好的ECS
实现和最先进的设计理念(可能)
ECS(Entity Component System)和DOD(面向数据设计)资料
我们在上面提到的很多系统都使用了ECS
和DOD
,因此这两者对于游戏开发是极其重要的,下面是一些相关的英文资料(部分需要翻墙),可以帮助大家理解相关概念。
- hecs, 一个用Rust实现的ECS世界
- Understanding data-oriented design for entity component systems - Unity at GDC 2019
- CppCon 2018: Stoyan Nikolov “OOP Is Dead, Long Live Data-oriented Design”
- RustConf 2018 - Closing Keynote - Using Rust For Game Development by Catherine West
- "Data-Oriented Design" web book by Richard Fabian
一些游戏开发的生产力工具
Awesome 算法
通用算法
rust-algorithms
rust-algorithms收集了一些经典的算法和数据结构,更强调算法实现的美观性,因此该库更适用于教学目的,请不要把它当成一个实用算法库在生产环境使用。
TheAlgorithms/Rust
TheAlgorithms/Rust项目所属的组织使用各种语言实现了多种算法,但是仅适用于演示的目的。
Leetcode
rustgym
rustgym 实现了相当多的 leetcode 和 Avent of Code 题解。
分布式算法
raft-rs
raft-rs 是由 Tikv 提供的 Raft 分布式算法实现。Raft是一个强一致性的分布式算法,比 Paxos 协议更简单、更好理解
密码学
Rust Crypto
Rust Crypto提供了一些常用的密码学算法实现,更新较为活跃。
专用算法
rust-bio
rust-bio 有常用的生物信息学所需的算法和数据结构。
位字段
定义和操作位字段
使用 bitflags!
宏可以帮助我们创建安全的位字段类型 MyFlags
,然后为其实现基本的 clear
操作。以下代码展示了基本的位操作和格式化:
生成随机值
生成随机数
使用 rand::thread_rng 可以获取一个随机数生成器 rand::Rng ,该生成器需要在每个线程都初始化一个。
整数的随机分布范围等于类型的取值范围,但是浮点数只分布在 [0, 1)
区间内。
指定范围生成随机数
使用 Rng::gen_range 生成 [0, 10) 区间内的随机数( 右开区间,不包括 10
)。
Uniform 可以用于生成均匀分布的随机数。当需要在同一个范围内重复生成随机数时,该方法虽然和之前的方法效果一样,但会更快一些。
使用指定分布来生成随机数
默认情况下,rand
包使用均匀分布来生成随机数,而 rand_distr 包提供了其它类型的分布方式。
首先,你需要获取想要使用的分布的实例,然后在 rand::Rng 的帮助下使用 Distribution::sample 对该实例进行取样。
如果想要查询可用的分布列表,可以访问这里,下面的示例中我们将使用 Normal 分布:
在自定义类型中生成随机值
使用 Distribution 特征包裹我们的自定义类型,并为 Standard 实现该特征,可以为自定义类型的指定字段生成随机数。
生成随机的字符串(A-Z, a-z, 0-9)
通过 Alphanumeric 采样来生成随机的 ASCII 字符串,包含从 A-Z, a-z, 0-9
的字符。
use rand::{thread_rng, Rng};
use rand::distributions::Alphanumeric;
fn main() {
let rand_string: String = thread_rng()
.sample_iter(&Alphanumeric)
.take(30)
.map(char::from)
.collect();
println!("{}", rand_string);
}
生成随机的字符串( 用户指定 ASCII 字符 )
通过 gen_string 生成随机的 ASCII 字符串,包含用户指定的字符。
Vector 排序
对整数 Vector 排序
以下示例使用 Vec::sort 来排序,如果大家希望获得更高的性能,可以使用 Vec::sort_unstable,但是该方法无法保留相等元素的顺序。
对浮点数 Vector 排序
浮点数数组可以使用 Vec::sort_by 和 PartialOrd::partial_cmp 进行排序。
对结构体 Vector 排序
以下示例中的结构体 Person
将实现基于字段 name
和 age
的自然排序。为了让 Person
变为可排序的,我们需要为其派生 Eq、PartialEq、Ord、PartialOrd
特征,关于这几个特征的详情,请见这里。
当然,还可以使用 vec:sort_by 方法配合一个自定义比较函数,只按照 age
的维度对 Person
数组排序。
使用tar包
解压 tar 包
以下代码将解压缩( GzDecoder )当前目录中的 archive.tar.gz
,并将所有文件抽取出( Archive::unpack )来后当入到当前目录中。
将目录压缩成 tar 包
以下代码将 /var/log
目录压缩成 archive.tar.gz
:
- 创建一个 File 文件,并使用 GzEncoder 和 tar::Builder 对其进行包裹
- 通过 Builder::append_dir_all 将
/var/log
目录下的所有内容添加到压缩文件中,该文件在backup/logs
目录下。 - GzEncoder 负责在写入压缩文件
archive.tar.gz
之前对数据进行压缩。
解压的同时删除指定的文件前缀
遍历目录中的文件 Archive::entries,若解压前的文件名包含 bundle/logs
前缀,需要将前缀从文件名移除( Path::strip_prefix )后,再解压。
哈希
计算文件的 SHA-256 摘要
写入一些数据到文件中,然后使用 digest::Context 来计算文件内容的 SHA-256 摘要 digest::Digest。
使用 HMAC 摘要来签名和验证消息
使用 ring::hmac 创建一个字符串签名并检查该签名的正确性。
加密
使用 PBKDF2 对密码进行哈希和加盐( salt )
ring::pbkdf2 可以对一个加盐密码进行哈希。
线性代数
矩阵相加
使用 ndarray::arr2 可以创建二阶矩阵,并计算它们的和。
矩阵相乘
ndarray::ArrayBase::dot 可以用于计算矩阵乘法。
标量、向量、矩阵相乘
在 ndarry
中,1 阶数组根据上下文既可以作为行向量也可以作为列向量。如果对你来说,这个行或列的方向很重要,可以考虑使用一行或一列的 2 阶数组来表示。
在下面例子中,由于 1 阶数组处于乘号的右边位置,因此 dot
会把它当成列向量来处理。
向量比较
浮点数通常是不精确的,因此比较浮点数不是一件简单的事。approx 提供的 assert_abs_diff_eq! 宏提供了方便的按元素比较的方式。为了使用 approx
,你需要在 ndarray
的依赖中开启相应的 feature:例如,在 Cargo.toml
中修改 ndarray
的依赖引入为 ndarray = { version = "0.13", features = ["approx"] }
。
向量范数( norm )
需要注意的是 Array
和 ArrayView
都是 ArrayBase
的别名。因此一个更通用的参数应该是 &ArrayBase<S, Ix1> where S: Data
,特别是在你提供一个公共 API 给其它用户时,但由于咱们是内部使用,因此更精准的 ArrayView1<f64>
会更适合。
矩阵的逆变换
例子中使用 nalgebra::Matrix3 创建一个 3x3 的矩阵,然后尝试对其进行逆变换,获取一个逆矩阵。
序列/反序列化一个矩阵
下面将展示如何将矩阵序列化为 JSON ,然后再反序列化为原矩阵。
三角函数
三角形边长计算
计算角为 2 弧度、对边长度为 80 的直角三角形的斜边长度。
验证 tan = sin / cos
地球上两点间的距离
下面的代码使用 Haversine 公式 计算地球上两点之间的公里数。
复数
创建复数
num::complex::Complex 可以帮助我们创建复数,其中实部和虚部必须是一样的类型。
复数相加
复数计算和 Rust 基本类型的计算并无区别。
数学函数
在 num::complex::Complex 中定义了一些内置的数学函数,可用于对复数进行数学运算。
统计
测量中心趋势
下面的一些例子为 Rust 数组中的数据计算它们的中心趋势。
平均值
首先计算的是平均值。
中位数
下面使用快速选择算法来计算中位数。该算法只会对可能包含中位数的数据分区进行排序,从而避免了对所有数据进行全排序。
众数( mode )
下面使用了 HashMap
对不同数字出现的次数进行了分别统计。
标准偏差
下面一起来看看该如何计算一组测量值的标准偏差和 z-score。
杂项
大整数 Big int
使用 BitInt 可以对超过 128bit 的整数进行计算。
命令行工具
对于每一个程序员而言,命令行工具都非常关键。你对他越熟悉,在使用计算机、处理工作流程等越是高效。
下面我们收集了一些优秀的Rust所写的命令行工具,它们相比目前已有的其它语言的实现,可以提供更加现代化的代码实现、更加高效的性能以及更好的可用性。
索引目录
新工具 | 替代的目标或功能描述 |
---|---|
bat | cat |
exa | ls |
lsd | ls |
fd | find |
procs | ps |
sd | sed |
dust | du |
starship | 现代化的命令行提示 |
ripgrep | grep |
tokei | 代码统计工具 |
hyperfine | 命令行benchmark工具 |
bottom | top |
teeldear | tldr |
grex | 根据文本示例生成正则 |
bandwitch | 显示进程、连接网络使用情况 |
zoxide | cd |
delta | git可视化 |
nushell | 全新的现代化shell |
mcfly | 替代ctrl + R 命令搜索 |
fselect | 使用SQL语法查找文件 |
pueue | 命令行任务管理工具 |
watchexec | 监视目录文件变动并执行命令 |
dura | 更加安全的使用git |
alacritty | 强大的基于OpenGL的终端 |
broot | 可视化访问目录树 |
bat
bat克隆了**cat**的功能并提供了语法高亮和Git集成,它支持
Windows,
MacOS和
Linux`。同时,它默认提供了多种文件后缀的语法高亮。

exa
exa是ls
命令的现代化实现,后者是目前Unix/Linux
系统的默认命令,用于列出当前目录中的内容。

lsd
lsd 也是 ls
的新实现,同时增加了很多特性,例如:颜色标注、icons、树形查看、更多的格式化选项等。

fd
fd 是一个更快、对用户更友好的find实现,后者是 Unix/Linux
内置的文件目录搜索工具。之所以说它用户友好,一方面是 API
非常清晰明了,其次是它对最常用的场景提供了有意义的默认值:例如,想要通过名称搜索文件:
fd
:fd PATTERN
find
:find -iname 'PATTERN'
同时 fd
性能非常非常高,还提供了非常多的搜索选项,例如允许用户通过 .gitignore
文件忽略隐藏的目录、文件等。
procs
procs 是 ps 的默认实现,后者是 Unix/Linux
的内置命令,用于获取进程( process
)的信息。proc
提供了更便利、可读性更好的格式化输出。

sd
sd 是 sed 命令的现代化实现,后者是 Unix/Linux
中内置的工具,用于分析和转换文本。
sd
拥有更简单的使用方式,而且支持方便的正则表达式语法,sd
拥有闪电般的性能,比 sed
快 2x-11x 倍。
以下是其中一个性能测试结果:
对1.5G大小的 JSON 文本进行简单替换
hyperfine -w 3 'sed -E "s/\"/\'/g" *.json >/dev/null' 'sd "\"" "\'" *.json >/dev/null' --export-markdown out.md
Command | Mean [s] | Min…Max [s] |
---|---|---|
sed -E "s/\"/'/g" *.json >/dev/null | 2.338 ± 0.008 | 2.332…2.358 |
sed "s/\"/'/g" *.json >/dev/null | 2.365 ± 0.009 | 2.351…2.378 |
sd "\"" "'" *.json >/dev/null | 0.997 ± 0.006 | 0.987…1.007 |
结果: ~2.35 times faster
dust
dust 是一个更符合使用习惯的du,后者是 Unix/Linux
内置的命令行工具,用于显示硬盘使用情况的统计。

starship
starship 是一个命令行提示,支持任何 shell
,包括 zsh
,简单易用、非常快且拥有极高的可配置性, 同时支持智能提示。

ripgrep
ripgrep 是一个性能极高的现代化 grep
实现,后者是 Unix/Linux
下的内置文件搜索工具。该项目是 Rust 的明星项目,一个是因为性能极其的高,另一个就是源代码质量很高,值得学习, 同时 Vscode
使用它作为内置的搜索引擎。
从功能来说,除了全面支持 grep
的功能外,repgre
支持使用正则递归搜索指定的文件目录,默认使用 .gitignore
对指定的文件进行忽略。

tokei
tokei 可以分门别类的统计目录内的代码行数,速度非常快!

hyperfine
hyperfine 是命令行benchmark工具,它支持在多次运行中提供静态的分析,同时支持任何的 shell
命令,准确的 benchmark
进度和当前预估等等高级特性。

bottom
bottom 是一个现代化实现的 top
,可以跨平台、图形化的显示进程/系统的当前信息。

tealdear
tealdear 是一个更快实现的tldr, 一个用于显示 man pages
的命令行程序,简单易用、基于例子和社区驱动是主要特性。

bandwhich
bandwhich 是一个客户端实用工具,用于显示当前进程、连接、远程 IP( hostname ) 的网络信息。

grex
grex 既是一个命令行工具又是一个库,可以根据用户提供的文本示例生成对应的正则表达式,非常强大。

zoxide
zoxide 是一个智能化的 cd
命令,它甚至会记忆你常用的目录。

delta
delta 是一个 git
分页展示工具,支持语法高亮、代码比对、输出 grep
等。

nushell
nushell 是一个全新的 shell
,使用 Rust
实现。它的目标是创建一个现代化的 shell
:虽然依然基于 Unix
的哲学,但是更适合现在的时代。例如,你可以使用 SQL
语法来选择你想要的内容!

mcfly
mcfly 会替换默认的 ctrl-R
,用于在终端中搜索历史命令, 它提供了智能提示功能,并且会根据当前目录中最近执行过的上下文命令进行提示。mcfly
甚至使用了一个小型的神经网络用于智能提示!

fselect
fselect 允许使用 SQL 语法来查找系统中的文件。它支持复杂查询、聚合查询、.gitignore 忽略文件、通过宽度高度搜索图片、通过 hash 搜索文件、文件属性查询等等,相当强大!
# 复杂查询
fselect "name from /tmp where (name = *.tmp and size = 0) or (name = *.cfg and size > 1000000)"
# 聚合函数
fselect "MIN(size), MAX(size), AVG(size), SUM(size), COUNT(*) from /home/user/Downloads"
# 格式化函数
fselect "LOWER(name), UPPER(name), LENGTH(name), YEAR(modified) from /home/user/Downloads"
pueue
pueue 是一个命令行任务管理工具,它可以管理你的长时间运行的命令,支持顺序或并行执行。简单来说,它可以管理一个命令队列。

watchexec
watchexec 可以监视指定的目录、文件的改动,并执行你预设的命令,支持多种配置项和操作系统。
# 监视当前目录/子目录中的所有js、css、html文件,一旦发生改变,运行`npm run build`命令
$ watchexec -e js,css,html npm run build
# 当前目录/子目录下任何python文件发生改变时,重启`python server.py`
$ watchexec -r -e py -- python server.py
dura
dura 运行在后台,监视你的 git
目录,提交你未提交的更改但是并不会影响 HEAD
、当前的分支和 git
索引(staged文件)。
如果你曾经遇到过**"完蛋, 我这几天的工作内容丢了"**的情况,那么就可以尝试下 dura
,checkout dura brach
,然后代码就可以顺利恢复了:)
恢复代码
- 你可以使用
dura
分支来恢复
$ echo "dura/$(git rev-parse HEAD)"
- 也可以手动恢复
# Or, if you don't trust dura yet, `git stash`
$ git reset HEAD --hard
# get the changes into your working directory
$ git checkout $THE_HASH
# last few commands reset HEAD back to master but with changes uncommitted
$ git checkout -b temp-branch
$ git reset master
$ git checkout master
$ git branch -D temp-branch
alacritty
alacritty 是一个跨平台、基于OpenGL的终端,性能极高的同时还支持丰富的自定义和可扩展性,可以说是非常优秀的现代化终端。
目前已经是 beta
阶段,可以作为日常工具来使用。

broot
broot
允许你可视化的去访问一个目录结构。

参数解析
Clap
下面的程序给出了使用 clap
来解析命令行参数的样式结构,如果大家想了解更多,在 clap
文档中还给出了另外两种初始化一个应用的方式。
在下面的构建中,value_of
将获取通过 with_name
解析出的值。short
和 long
用于设置用户输入的长短命令格式,例如短命令 -f
和长命令 --file
。
clap
针对上面提供的构建样式,会自动帮我们生成相应的使用方式说明。例如,上面代码生成的使用说明如下:
My Test Program 0.1.0
Hackerman Jones <hckrmnjones@hack.gov>
Teaches argument parsing
USAGE:
testing [OPTIONS]
FLAGS:
-h, --help Prints help information
-V, --version Prints version information
OPTIONS:
-f, --file <file> A cool file
-n, --number <num> Five less than your favorite number
最后,再使用一些参数来运行下我们的代码:
$ cargo run -- -f myfile.txt -n 251
The file passed is: myfile.txt
Your favorite number must be 256.
Structopt
@todo
ANSI 终端
ansi_term 包可以帮我们控制终端上的输出样式,例如使用颜色文字、控制输出格式等,当然,前提是在 ANSI 终端上。
ansi_term
中有两个主要数据结构:ANSIString 和 Style。
Style
用于控制样式:颜色、加粗、闪烁等,而前者是一个带有样式的字符串。
颜色字体
加粗字体
比颜色复杂的样式构建需要使用 Style
结构体:
加粗和颜色
Colour
实现了很多跟 Style
类似的函数,因此可以实现链式调用。
操作系统
操作系统范畴很大,本章节中精选的内容聚焦在用Rust实现的操作系统以及用Rust写操作系统的教程。
目录
系统 | 描述 |
---|---|
redox | Unix 风格的微内核OS |
tock | 嵌入式操作系统 |
theseus | 独特设计的OS |
writing os in rust | 使用Rust开发简单的操作系统 |
rust-raspberrypi-OS-tutorials | Rust嵌入式系统开发教程 |
rcore-os | 清华大学提供的rcore 操作系统教程 |
edu-os | 亚琛工业大学操作系统课程的配套项目 |
redox
redox 是一个 Unix
风格的微内核操作系统,使用 Rust
实现。redox
的目标是安全、快速、免费、可用,它在内核设计上借鉴了很多优秀的内核,例如:SeL4
, MINIX
, Plan 9
和BSD
。
但 redox
不仅仅是一个内核,它还是一个功能齐全的操作系统,提供了操作系统该有的功能,例如:内存分配器、文件系统、显示管理、核心工具等等。你可以大概认为它是一个 GNU
或 BSD
生态,但是是通过一门现代化、内存安全的语言实现的。
不过据我仔细观察,redox目前的开发进度不是很活跃,不知道发生了什么,未来若有新的发现会在这里进行更新 - Sunface


tock
tock 是一个嵌入式操作系统,设计用于在低内存和低功耗的微控制器上运行多个并发的、相互不信任的应用程序,例如它可在 Cortex-M
和 RISC-V
平台上运行。
Tock
使用两个核心机制保护操作系统中不同组件的安全运行:
- 内核和设备驱动全部使用Rust编写,提供了很好安全性的同时,还将内核和设备进行了隔离
- 使用了内存保护单元技术,让应用之间、应用和内核之间实现了安全隔离
具体可通过这本书了解: The Tock Book.
Theseus
Theseus 是从零开始构建的操作系统,完全使用Rust进行开发。它使用了新的操作系统结构、更好的状态管理,以及利用语言内设计原则将操作系统的职责(如资源管理)转移到编译器中。
该OS目前尚处于早期阶段,但是看上去作者很有信心未来可以落地,如果想要了解,可以通过官方提供的在线书籍进行学习。
Writing an OS in Rust
Writing an OS in Rust 是非常有名的博客系列,专门讲解如何使用Rust来写一个简单的操作系统,配套源码在这里,目前已经发布了第二版。
以下是async/await
的目录截图:
rust-raspberrypi-OS-tutorials
rust-raspberrypi-OS-tutorials 教大家如何用Rust开发一个嵌入式操作系统,可以运行在树莓派上。这个教程讲得很细,号称手把手教学,而且是从零实现,因此很值得学习。


rcore-os
rcore-os 是由清华大学开发的操作系统,用 Rus t实现, 与 linux
相兼容,主要目的目前还是用于教学,因为还有相关的配套教程,非常值得学习。目前支持的功能不完全列表如下:linux
兼容的 syscall
接口、网络协议栈、简单的文件系统、信号系统、异步IO、内核模块化。
以下是在树莓派上运行的图:
edu-os
edu-os 是 Unix
风格的操作系统,用于教学目的,它是亚琛工业大学(RWTH Aachen University)操作系统课程的配套大项目,但是我并没有找到对应的课程资料,根据作者的描述,上面部分的Writing an OS in Rust对他有很大的启发。

处理器
获取逻辑CPU的核心数
num_cpus 可以用于获取逻辑和物理的 CPU 核心数,下面的例子是获取逻辑核心数。
调用系统命令
调用一个外部命令并处理输出内容
下面的代码将调用操作系统中的 git log --oneline
命令,然后使用 regex 对它输出到 stdout
上的调用结果进行解析,以获取哈希值和最后 5 条提交信息( commit )。
调用 python 解释器运行代码并检查返回的错误码
通过管道来运行外部命令
下面的例子将显示当前目录中大小排名前十的文件和子目录,效果等效于命令 du -ah . | sort -hr | head -n 10
。
Command
命令代表一个进程,其中父进程通过 Stdio::piped 来捕获子进程的输出。
将子进程的 stdout 和 stderr 重定向到同一个文件
下面的例子将生成一个子进程,然后将它的标准输出和标准错误输出都输出到同一个文件中。最终的效果跟 Unix 命令 ls . oops >out.txt 2>&1
相同。
File::try_clone 会克隆一份文件句柄的引用,然后保证这两个句柄在写的时候会使用相同的游标位置。
持续处理子进程的输出
下面的代码会创建一个管道,然后当 BufReader
更新时,就持续从 stdout
中读取数据。最终效果等同于 Unix 命令 journalctl | grep usb
。
读取环境变量
使用 std::env::var 可以读取系统中的环境变量。
线程
生成一个临时性的线程
下面例子用到了 crossbeam 包,它提供了非常实用的、用于并发和并行编程的数据结构和函数。
Scope::spawn 会生成一个被限定了作用域的线程,该线程最大的特点就是:它会在传给 crossbeam::scope 的闭包函数返回前先行结束。得益于这个特点,子线程的创建使用就像是本地闭包函数调用,因此生成的线程内部可以使用外部环境中的变量!
创建并行流水线
下面我们使用 crossbeam 和 crossbeam-channel 来创建一个并行流水线:流水线的两端分别是数据源和数据下沉( sink ),在流水线中间,有两个工作线程会从源头接收数据,对数据进行并行处理,最后将数据下沉。
- 消息通道( channel )是 crossbeam_channel::bounded,它只能缓存一条消息。当缓存满后,发送者继续调用 [crossbeam_channel::Sender::send] 发送消息时会阻塞,直到一个工作线程( 消费者 ) 拿走这条消息
- 消费者获取消息时先到先得的策略,因此两个工作线程只有一个能取到消息,保证消息不会被重复消费、处理
- 通过迭代器 crossbeam_channel::Receiver::iter 读取消息会阻塞当前线程,直到新消息的到来或 channel 关闭
- channel 只有在所有的发送者或消费者关闭后,才能被关闭。而其中一个消费者
rcv2
处于阻塞读取状态,无比被关闭,因此我们必须要关闭所有发送者:drop(snd1);
drop(snd2)
,这样 channel 关闭后,主线程的rcv2
才能从阻塞状态退出,最后整个程序结束。大家还是迷惑的话,可以看看这篇文章。
线程间传递数据
下面我们来看看 crossbeam-channel 的单生产者单消费者( SPSC ) 使用场景。
维护全局可变的状态
lazy_static 会创建一个全局的静态引用( static ref ),该引用使用了 Mutex
以支持可变性,因此我们可以在代码中对其进行修改。Mutex
能保证该全局状态同时只能被一个线程所访问。
并行计算 iso 文件的 SHA256
下面的示例将为当前目录中的每一个 .iso 文件都计算一个 SHA256 sum。其中线程池中会初始化和 CPU 核心数一致的线程数,其中核心数是通过 num_cpus::get 函数获取。
Walkdir::new
可以遍历当前的目录,然后调用 execute
来执行读操作和 SHA256 哈希计算。
使用线程池来绘制分形
下面例子中将基于 Julia Set 来绘制一个分形图片,其中使用到了线程池来做分布式计算。

任务并行处理
并行修改数组中的元素
rayon 提供了一个 par_iter_mut 方法用于并行化迭代一个数据集合。
并行测试集合中的元素是否满足给定的条件
rayon::any 和 rayon::all 类似于 std::any / std::all ,但是是并行版本的。
rayon::any
并行检查迭代器中是否有任何元素满足给定的条件,一旦发现符合条件的元素,就立即返回rayon::all
并行检查迭代器中的所有元素是否满足给定的条件,一旦发现不满足条件的元素,就立即返回
使用给定条件并行搜索
下面例子使用 par_iter 和 rayon::find_any 来并行搜索一个数组,直到找到任意一个满足条件的元素。
如果有多个元素满足条件,rayon
会返回第一个找到的元素,注意:第一个找到的元素未必是数组中的顺序最靠前的那个。
对数组进行并行排序
下面的例子将对字符串数组进行并行排序。
par_sort_unstable 方法的排序性能往往要比稳定的排序算法更高。
并行化 Map-Reuduce
下面例子使用 rayon::filter, rayon::map, 和 rayon::reduce 来超过 30 岁的 Person
的平均年龄。
rayon::filter
返回集合中所有满足给定条件的元素rayon::map
对集合中的每一个元素执行一个操作,创建并返回新的迭代器,类似于迭代器适配器rayon::reduce
则迭代器的元素进行不停的聚合运算,直到获取一个最终结果,这个结果跟例子中rayon::sum
获取的结果是相同的
并行生成缩略图
下面例子将为目录中的所有图片并行生成缩略图,然后将结果存到新的目录 thumbnails
中。
glob::glob_with 可以找出当前目录下的所有 .jpg
文件,rayon
通过 DynamicImage::resize 来并行调整图片的大小。
SQLite
创建 SQLite 数据库
使用 rusqlite
可以创建 SQLite 数据库,Connection::open 会尝试打开一个数据库,若不存在,则创建新的数据库。
这里创建的
cats.db
数据库将被后面的例子所使用
插入和查询
使用事务
使用 Connection::transaction 可以开始新的事务,若没有对事务进行显式地提交 Transaction::commit,则会进行回滚。
下面的例子中,rolled_back_tx
插入了重复的颜色名称,会发生回滚。
Postgres
在数据库中创建表格
我们通过 postgres 来操作数据库。下面的例子有一个前提:数据库 library
已经存在,其中用户名和密码都是 postgres
。
插入和查询
聚合数据
下面代码将使用降序的方式列出 Museum of Modern Art 数据库中的前 7999 名艺术家的国籍分布.
时间计算和转换
测量某段代码的耗时
测量从 time::Instant::now 开始所经过的时间 time::Instant::elapsed.
对日期和时间进行计算
使用 DateTime::checked_add_signed 计算和显示从现在开始两周后的日期和时间,然后再计算一天前的日期 DateTime::checked_sub_signed。
DateTime::format 所支持的转义序列可以在 chrono::format::strftime 找到.
将本地时间转换成其它时区
使用 offset::Local::now 获取本地时间并进行显示,接着,使用 DateTime::from_utc 将它转换成 UTC 标准时间。最后,再使用 offset::FixedOffset 将 UTC 时间转换成 UTC+8 和 UTC-2 的时间。
解析和显示
检查日期和时间
通过 DateTime 获取当前的 UTC 时间:
日期和时间戳的相互转换
显示格式化的日期和时间
通过 Utc::now 可以获取当前的 UTC 时间。
将字符串解析为 DateTime 结构体
我们可以将多种格式的日期时间字符串转换成 DateTime 结构体。DateTime::parse_from_str 使用的转义序列可以在 chrono::format::strftime 找到.
只有当能唯一的标识出日期和时间时,才能创建 DateTime
。如果要在没有时区的情况下解析日期或时间,你需要使用 NativeDate
等函数。
日志
log 包
log 提供了日志相关的实用工具。
在控制台打印 debug 信息
env_logger
通过环境变量来配置日志。log::debug! 使用起来跟 std::fmt 中的格式化字符串很像。
fn execute_query(query: &str) {
log::debug!("Executing query: {}", query);
}
fn main() {
env_logger::init();
execute_query("DROP TABLE students");
}
如果大家运行代码,会发现没有任何日志输出,原因是默认的日志级别是 error
,因此我们需要通过 RUST_LOG
环境变量来设置下新的日志级别:
$ RUST_LOG=debug cargo run
然后你将成功看到以下输出:
DEBUG:main: Executing query: DROP TABLE students
将错误日志输出到控制台
下面我们通过 log::error! 将错误日志输出到标准错误 stderr
。
fn execute_query(_query: &str) -> Result<(), &'static str> {
Err("I'm afraid I can't do that")
}
fn main() {
env_logger::init();
let response = execute_query("DROP TABLE students");
if let Err(err) = response {
log::error!("Failed to execute query: {}", err);
}
}
将错误输出到标准输出 stdout
默认的错误会输出到标准错误输出 stderr
,下面我们通过自定的配置来让错误输出到标准输出 stdout
。
使用自定义 logger
下面的代码将实现一个自定义 logger ConsoleLogger
,输出到标准输出 stdout
。为了使用日志宏,ConsoleLogger
需要实现 log::Log 特征,然后使用 log::set_logger 来安装使用。
输出到 Unix syslog
下面的代码将使用 syslog 包将日志输出到 Unix Syslog.
tracing
@todo
配置日志
为每个模块开启独立的日志级别
下面代码创建了模块 foo
和嵌套模块 foo::bar
,并通过 RUST_LOG 环境变量对各自的日志级别进行了控制。
要让环境变量生效,首先需要通过 env_logger::init()
开启相关的支持。然后通过以下命令来运行程序:
RUST_LOG="warn,test::foo=info,test::foo::bar=debug" ./test
此时的默认日志级别被设置为 warn
,但我们还将 foo
模块级别设置为 info
, foo::bar
模块日志级别设置为 debug
。
WARN:test: [root] warn
WARN:test::foo: [foo] warn
INFO:test::foo: [foo] info
WARN:test::foo::bar: [bar] warn
INFO:test::foo::bar: [bar] info
DEBUG:test::foo::bar: [bar] debug
使用自定义环境变量来设置日志
Builder 将对日志进行配置,以下代码使用 MY_APP_LOG
来替代 RUST_LOG
环境变量:
在日志中包含时间戳
以下是 stderr
的输出:
2022-03-22T21:57:06 [WARN] - warn
2022-03-22T21:57:06 [INFO] - info
将日志输出到指定文件
log4rs 可以帮我们将日志输出指定的位置,它可以使用外部 YAML 文件或 builder
的方式进行配置。
版本号
解析并增加版本号
下面例子使用 Version::parse 将一个字符串转换成 semver::Version 版本号,然后将它的 patch, minor, major 版本号都增加 1。
注意,为了符合语义化版本的说明,增加 minor
版本时,patch
版本会被重设为 0
,当增加 major
版本时,minor
和 patch
都将被重设为 0
。
解析一个复杂的版本号字符串
这里的版本号字符串还将包含 SemVer
中定义的预发布和构建元信息。
值得注意的是,为了符合 SemVer
的规则,构建元信息虽然会被解析,但是在做版本号比较时,该信息会被忽略。换而言之,即使两个版本号的构建字符串不同,它们的版本号依然可能相同。
检查给定的版本号是否是预发布
下面例子给出两个版本号,然后通过 is_prerelease 判断哪个是预发布的版本号。
找出给定范围内的最新版本
下面例子给出了一个版本号列表,我们需要找到其中最新的版本。
检查外部命令的版本号兼容性
下面将通过 Command 来执行系统命令 git --version
,并对该系统命令返回的 git
版本号进行解析。
构建时工具
本章节的内容是关于构建工具的,如果大家没有听说过 build.rs
文件,强烈建议先看看这里了解下何为构建工具。
编译并静态链接一个 C 库
cc 包能帮助我们更好地跟 C/C++/汇编进行交互:它提供了简单的 API 可以将外部的库编译成静态库( .a ),然后通过 rustc
进行静态链接。
下面的例子中,我们将在 Rust 代码中使用 C 的代码: src/hello.c。在开始编译 Rust 的项目代码前,build.rs
构建脚本将先被执行。通过 cc 包,一个静态的库可以被生成( libhello.a ),然后该库将被 Rust的代码所使用:通过 extern
声明外部函数签名的方式来使用。
由于例子中的 C 代码很简单,因此只需要将一个文件传递给 cc::Build。如果大家需要更复杂的构建,cc::Build
还提供了通过 include 来包含路径的方式,以及额外的编译标志( flags )。
Cargo.toml
[package]
...
build = "build.rs"
[build-dependencies]
cc = "1"
[dependencies]
error-chain = "0.11"
build.rs
fn main() {
cc::Build::new()
.file("src/hello.c")
.compile("hello"); // outputs `libhello.a`
}
src/hello.c
#include <stdio.h>
void hello() {
printf("Hello from C!\n");
}
void greet(const char* name) {
printf("Hello, %s!\n", name);
}
src/main.rs
use error_chain::error_chain;
use std::ffi::CString;
use std::os::raw::c_char;
error_chain! {
foreign_links {
NulError(::std::ffi::NulError);
Io(::std::io::Error);
}
}
fn prompt(s: &str) -> Result<String> {
use std::io::Write;
print!("{}", s);
std::io::stdout().flush()?;
let mut input = String::new();
std::io::stdin().read_line(&mut input)?;
Ok(input.trim().to_string())
}
extern {
fn hello();
fn greet(name: *const c_char);
}
fn main() -> Result<()> {
unsafe { hello() }
let name = prompt("What's your name? ")?;
let c_name = CString::new(name)?;
unsafe { greet(c_name.as_ptr()) }
Ok(())
}
编译并静态链接一个 C++ 库
链接到 C++ 库跟之前的方式非常相似。主要的区别在于链接到 C++ 库时,你需要通过构建方法 cpp(true) 来指定一个 C++ 编译器,然后在 C++ 的代码顶部添加 extern "C"
来阻止 C++ 编译器对库名进行名称重整( name mangling )。
Cargo.toml
[package]
...
build = "build.rs"
[build-dependencies]
cc = "1"
build.rs
fn main() {
cc::Build::new()
.cpp(true)
.file("src/foo.cpp")
.compile("foo");
}
src/foo.cpp
extern "C" {
int multiply(int x, int y);
}
int multiply(int x, int y) {
return x*y;
}
src/main.rs
extern {
fn multiply(x : i32, y : i32) -> i32;
}
fn main(){
unsafe {
println!("{}", multiply(5,7));
}
}
为 C 库创建自定义的 define
cc::Build::define 可以让我们使用自定义的 define 来构建 C 库。
以下示例在构建脚本 build.rs
中动态定义了一个 define,然后在运行时打印出 Welcome to foo - version 1.0.2。Cargo 会设置一些环境变量,它们对于自定义的 define 会有所帮助。
Cargo.toml
[package]
...
version = "1.0.2"
build = "build.rs"
[build-dependencies]
cc = "1"
build.rs
fn main() {
cc::Build::new()
.define("APP_NAME", "\"foo\"")
.define("VERSION", format!("\"{}\"", env!("CARGO_PKG_VERSION")).as_str())
.define("WELCOME", None)
.file("src/foo.c")
.compile("foo");
}
src/foo.c
#include <stdio.h>
void print_app_info() {
#ifdef WELCOME
printf("Welcome to ");
#endif
printf("%s - version %s\n", APP_NAME, VERSION);
}
src/main.rs
extern {
fn print_app_info();
}
fn main(){
unsafe {
print_app_info();
}
}
字符编码
百分号编码( Percent encoding )
百分号编码又称 URL 编码。
percent-encoding 包提供了两个函数:utf8_percent_encode
函数用于编码、percent_decode
用于解码。
该编码集定义了哪些字符( 特别是非 ASCII 和控制字符 )需要被百分比编码。具体的选择取决于上下文,例如 url
会对 URL 路径中的 ?
进行编码,但是在路径后的查询字符串中,并不会进行编码。
将字符串编码为 application/x-www-form-urlencoded
使用 form_urlencoded::byte_serialize 函数将一个字符串编码成 application/x-www-form-urlencoded 格式,然后再使用 form_urlencoded::parse 对其进行解码。
十六进制编解码
data_encoding 可以将一个字符串编码成十六进制字符串,反之亦然。
下面的例子将 &[u8]
转换成十六进制等效形式,然后与期待的值进行比较。
Base64 编解码
base64 可以把一个字节切片编码成 base64
String。
CSV
读取 CSV 记录
我们可以将标准的 CSV 记录值读取到 csv::StringRecord 中,但是该数据结构期待合法的 UTF8 数据行,你还可以使用 csv::ByteRecord 来读取非 UTF8 数据。
还可以使用 serde
将数据反序列化成一个强类型的结构体。
读取使用了不同分隔符的 CSV 记录
下面的例子将读取使用了 tab
作为分隔符的 CSV 记录。
基于给定条件来过滤 CSV 记录
序列化为 CSV
下面例子展示了如何将 Rust 类型序列化为 CSV。
使用 serde 序列化为 CSV
下面例子将自定义数据结构通过 serde
序列化 CSV。
CSV 列转换
下面代码将包含有颜色名和十六进制颜色的 CSV 文件转换为包含颜色名和 rgb 颜色。这里使用 csv
包对 CSV 文件进行读写,然后用 serde
进行序列化和反序列化。
结构化数据
序列和反序列非结构化的JSON
serde_json 是一个高性能的 JSON 包,它支持我们在不声明结构体的情况下,去解析 JSON。
解析 TOML 文件
toml 包可以将 TOML 文件的内容解析为一个 toml::Value
值,该值能代表任何合法的 TOML 数据。
还可以配合 serde 将 TOML 解析到我们自定义的结构体中:
使用小端字节序来读写整数
byteorder 在自行接收或发送网络字节流时会非常有用( 除非性能要求高,否则还是建议使用 JSON 等数据协议,不要自己做字节流解析 )。
文件读写
迭代文件中的内容行
避免对同一个文件进行读写
same_file 可以帮我们识别两个文件是否是相同的。
以下代码会报错,因为待写入的文件名也是 new.txt,跟待读取的文件名相同
cargo run >> ./new.txt
使用内存映射访问文件
memmap 能创建一个文件的内存映射( memory map ),然后模拟一些非顺序读。
使用内存映射,意味着你将相关的索引加载到内存中,而不是通过 seek 的方式去访问文件。
Mmap::map 函数会假定待映射的文件不会同时被其它进程修改。
目录访问
获取24小时内被修改过的文件
通过遍历读取目录中文件的 Metadata::modified 属性,来获取目标文件名列表。
获取给定路径的 loops
使用 same_file::is_same_file 可以检查给定路径的 loops,loop 可以通过以下方式创建:
mkdir -p /tmp/foo/bar/baz
ln -s /tmp/foo/ /tmp/foo/bar/baz/qux
递归查找重复的文件名
walkdir 可以帮助我们遍历指定的目录。
递归查找满足条件的所有文件
下面的代码通过 walkdir 来查找当前目录中最近一天内发生过修改的所有文件。
follow_links 为 true
时,那软链接会被当成正常的文件或目录一样对待,也就是说软链接指向的文件或目录也会被访问和检查。若软链接指向的目标不存在或它是一个 loops,就会导致错误的发生。
遍历目录跳过隐藏文件
下面例子使用 walkdir 来遍历一个目录,同时跳过隐藏文件 is_not_hidden
。
递归计算给定深度的文件大小
递归访问的深度可以使用 WalkDir::min_depth 和 WalkDir::max_depth 来控制。
递归查找所有 png 文件
例子中使用了 glob 包,其中的 **
代表当前目录及其所有子目录,例如,/media/**/*.png
代表在 media
和它的所有子目录下查找 png 文件.
查找满足给定正则的所有文件且忽略文件名大小写
glob_with 函数可以按照给定的正则表达式进行查找,同时还能使用选项来控制一些匹配设置。
全局变量
使用 lazy_static 在运行期初始化全局变量
下面的例子,我们将使用 lazy_static 声明一个在运行期初始化( 懒求值 )的 Hashmap
,它会被求值一次,然后保存在一个全局的 static
引用之后。
TCP/IP
监听 TCP 端口
以下代码会监听指定的 TCP 端口,并接收一条外部进入的 TCP 连接,然后将读取到的一条信息输出到标准输出( println!
)。
循环接收进入的 TCP 连接
@todo
正则表达式
验证邮件格式并取出 @ 前的信息
下面代码使用 regex 包来验证邮件格式的正确性,然后提取出 @
符号前的所有内容。
从文本中提出 # 开头的标签
例子对标签进行提取、排序和去重。需要注意,下面的标签仅仅是拉丁字母的,如果你要支持更多的字母,可以参考下 Twitter 的正则语法,友情提示,复杂的多!
从文本中提取出所有手机号
[Regex::captures_iter] 可以对字符串型文本进行处理,以获取文本中的多个手机号。下面的例子适用于美国的号码。
通过多个正则来过滤日志文件
例子的目标是过滤出包含 "version X.X.X"、以 443 结尾的 IP 地址和特别的警告的日志行。
值得注意的是,由于在正则中反斜杠非常常见,因此使用 r#""
形式的原生字符串对于开发者和使用者都更加友好。
将文本中所有的指定模式替换成另外一种模式
下面代码将标准的 ISO 8601 YYYY-MM-DD 日期模式替换成带有斜杠的美式英语日期。例如 2013-01-15
-> 01/15/2013
。
字符串解析
访问 Unicode 字符
unicode-segmentation 包的 UnicodeSegmentation::graphemes 函数可以将 UTF-8 字符串收集成一个 Unicode 字符组成的数组。这样我们就可以通过索引的方式来访问对应的字符了。
为自定义结构体实现 FromStr 特征
为我们的 RGB 结构体实现 FromStr
特征后,就可以将一个十六进制的颜色表示字符串转换成 RGB 结构体。
实现 Display 特征
@todo
提取网络链接( 爬虫 )
从目标网页 HTML 中提取出所有链接
下面代码使用 reqwest::get 发起一次 http 请求,然后通过 select
包的 Document::from_read 将请求的结果解析为 HTML 文档。