Ruby 3.3.0-preview3 发布

我们很高兴地宣布 Ruby 3.3.0-preview3 的发布。Ruby 3.3 添加了一个名为 Prism 的新解析器,使用 Lrama 作为解析器生成器,添加了一个名为 RJIT 的新的纯 Ruby JIT 编译器,以及许多性能改进,特别是 YJIT。

Prism

  • 引入 Prism 解析器 作为默认 gem
    • Prism 是一个可移植、容错且可维护的 Ruby 语言递归下降解析器
  • Prism 已经可以用于生产环境并且正在积极维护,您可以将其用于替代 Ripper
    • 这里有关于如何使用 Prism 的 详细文档
    • Prism 既是一个 C 库,将被 CRuby 内部使用,也是一个 Ruby gem,可以被任何需要解析 Ruby 代码的工具使用
    • Prism API 中值得注意的方法有
      • Prism.parse(source),它将 AST 作为 ParseResult 的一部分返回
      • Prism.dump(source),它将序列化的 AST 作为字符串返回
      • Prism.parse_comments(source),它返回注释
  • 如果您有兴趣贡献,可以直接在 Prism 仓库 上提交拉取请求或问题

使用 Lrama 代替 Bison

RJIT

  • 引入了纯 Ruby JIT 编译器 RJIT,并取代了 MJIT。
    • RJIT 仅在 Unix 平台上支持 x86-64 架构。
    • 与 MJIT 不同,它在运行时不需要 C 编译器。
  • RJIT 仅用于实验目的。
    • 您应该在生产环境中使用 YJIT。
  • 如果您对开发 Ruby 的 JIT 感兴趣,请查看 k0kubun 在 RubyKaigi 第三天的演讲

YJIT

  • 与 3.2 相比,性能有重大提升
    • 对 splat 和 rest 参数的支持得到了改进。
    • 寄存器被分配给虚拟机的堆栈操作。
    • 编译了更多带有可选参数的调用。
    • 异常处理程序也被编译。
    • 实例变量不再因巨型对象形状而退出到解释器。
    • 不支持的调用类型不再退出到解释器。
    • Integer#!=String#!=Kernel#block_given?Kernel#is_a?Kernel#instance_of?Module#=== 进行了专门的优化。
    • 现在在 optcarrot 上比解释器快 3 倍以上!
  • 与 3.2 相比,内存使用率显著提高
    • 编译代码的元数据使用的内存更少。
    • 在 ARM64 上生成更紧凑的代码
  • 编译速度现在比 3.2 略快。
  • 添加 RubyVM::YJIT.enable,可以在运行时启用 YJIT
    • 您可以在不修改命令行参数或环境变量的情况下启动 YJIT。
    • 这也可以用于在应用程序完成启动后才启用 YJIT。如果您想在禁用启动时的 YJIT 的同时使用其他 YJIT 选项,可以使用 --yjit-disable
  • 选项禁用代码 GC 并将 --yjit-exec-mem-size 视为硬性限制
    • 可以在使用 unicorn 和 fork 的服务器上产生更好的写时复制行为
  • --yjit-stats 生成的 ratio_in_yjit 统计信息现在可以在发布版本中使用,不再需要特殊的统计信息或开发版本来访问大多数统计信息。
  • 退出跟踪选项现在支持采样
    • --trace-exits-sample-rate=N
  • 添加了 --yjit-perf,以方便使用 Linux perf 进行性能分析。
  • 更全面的测试和多个错误修复

M:N 线程调度器

  • 引入了 M:N 线程调度器。 [Feature #19842]
    • M 个 Ruby 线程由 N 个原生线程(操作系统线程)管理,因此减少了线程创建和管理成本。
    • 它可能会破坏 C 扩展兼容性,因此默认情况下在主 Ractor 上禁用 M:N 线程调度器。
      • RUBY_MN_THREADS=1 环境变量可以在主 Ractor 上启用 M:N 线程。
      • M:N 线程在非主 Ractor 上启用。
    • RUBY_MAX_CPU=n 环境变量设置 N 的最大数量(原生线程的最大数量)。默认值为 8。
      • 由于每个 Ractor 一次只能运行一个 Ruby 线程,因此将使用原生线程的数量,该数量是 RUBY_MAX_CPU 中指定的数量和正在运行的 Ractor 数量中较小的一个。因此,单 Ractor 应用程序(大多数应用程序)将使用 1 个原生线程。
      • 为了支持阻塞操作,可以使用超过 N 个原生线程。

其他值得注意的新功能

语言

性能改进

  • defined?(@ivar) 使用对象形状进行了优化。
  • 诸如 Socket.getaddrinfo 之类的名称解析现在可以被中断(在 pthreads 可用的环境中)。 Feature #19965
    • 为此,现在每次调用 getaddrinfo 或 getnameinfo 时都会创建一个 pthread。这会在名称解析中产生一些开销(在我们的实验中大约是 2.5 倍)。我们预计名称解析开销对于大多数应用程序来说不是问题,但是如果您观察到这种情况,或者如果您看到您认为是由于此更改造成的意外影响,请报告它们。
  • 添加了环境变量 RUBY_GC_HEAP_REMEMBERED_WB_UNPROTECTED_OBJECTS_LIMIT_RATIOFeature #19571
  • 旧对象的子对象不再在垃圾收集器中立即提升到旧一代。 Feature #19678
  • 垃圾收集器中添加了对弱引用的支持。 Feature #19783

自 3.2 以来的其他值得注意的更改

IRB

IRB 收到了一些增强功能,包括但不限于

  • 高级 irb:rdbg 集成,提供与 pry-byebug 等效的调试体验(文档)。
  • lsshow_sourceshow_cmds 命令的分页支持。
  • lsshow_source 命令提供的更准确和有用的信息。
  • 使用类型分析的实验性自动完成(文档)。
  • 现在可以使用新引入的类 Reline::Face 更改完成对话框中的字体颜色和字体样式(文档

此外,IRB 还进行了广泛的重构并收到了数十个错误修复,以方便未来的增强功能。

兼容性问题

注意:不包括功能错误修复。

已删除的常量

以下已弃用的常量已删除。

已删除的方法

以下已弃用的方法已删除。

已删除的环境变量

以下已弃用的环境变量已删除。

  • 环境变量 RUBY_GC_HEAP_INIT_SLOTS 已被弃用,并且是一个空操作。请改用环境变量 RUBY_GC_HEAP_{0,1,2,3,4}_INIT_SLOTSFeature #19785

Stdlib 兼容性问题

ext/readline 已停用

  • 我们有与 ext/readline API 兼容的纯 Ruby 实现 reline。我们将来将依赖 reline。如果您需要使用 ext/readline,您可以通过 rubygems.org 安装 ext/readline,使用 gem install readline-ext
  • 我们不再需要安装诸如 libreadlinelibedit 之类的库。

C API 更新

更新的 C API

以下 API 已更新。

已删除的 C API

以下已弃用的 API 已删除。

标准库更新

如果用户需要计划在未来版本的 Ruby 中成为捆绑 gem 的 gem,RubyGems 和 Bundler 会发出警告。

目标库是

  • abbrev
  • base64
  • bigdecimal
  • csv
  • drb
  • getoptlong
  • mutex_m
  • nkf
  • observer
  • racc
  • resolv-replace
  • rinda
  • syslog

添加了以下默认 gem。

  • prism 0.15.1

更新了以下默认 gem。

  • RubyGems 3.5.0.dev
  • base64 0.2.0
  • benchmark 0.3.0
  • bigdecimal 3.1.5
  • bundler 2.5.0.dev
  • cgi 0.4.0
  • csv 3.2.8
  • date 3.3.4
  • delegate 0.3.1
  • drb 2.2.0
  • english 0.8.0
  • erb 4.0.3
  • etc 1.4.3.dev.1
  • fcntl 1.1.0
  • fiddle 1.1.2
  • fileutils 1.7.2
  • find 0.2.0
  • getoptlong 0.2.1
  • io-console 0.6.1.dev
  • irb 1.8.3
  • logger 1.6.0
  • mutex_m 0.2.0
  • net-http 0.4.0
  • net-protocol 0.2.2
  • nkf 0.1.3
  • observer 0.1.2
  • open-uri 0.4.0
  • open3 0.2.0
  • openssl 3.2.0
  • optparse 0.4.0
  • ostruct 0.6.0
  • pathname 0.3.0
  • pp 0.5.0
  • prettyprint 0.2.0
  • pstore 0.1.3
  • psych 5.1.1.1
  • rdoc 6.6.0
  • reline 0.3.9
  • rinda 0.2.0
  • securerandom 0.3.0
  • shellwords 0.2.0
  • singleton 0.2.0
  • stringio 3.0.9
  • strscan 3.0.7
  • syntax_suggest 1.1.0
  • tempfile 0.2.0
  • time 0.3.0
  • timeout 0.4.1
  • tmpdir 0.2.0
  • tsort 0.2.0
  • un 0.3.0
  • uri 0.13.0
  • weakref 0.1.3
  • win32ole 1.8.10
  • yaml 0.3.0
  • zlib 3.1.0

以下捆绑的 gem 从默认 gem 提升。

  • racc 1.7.3

以下捆绑的 gem 已更新。

  • minitest 5.20.0
  • rake 13.1.0
  • test-unit 3.6.1
  • rexml 3.2.6
  • rss 0.3.0
  • net-imap 0.4.4
  • net-smtp 0.4.0
  • rbs 3.2.2
  • typeprof 0.21.8
  • debug 1.8.0

有关默认 gem 或捆绑 gem 的详细信息,请参阅 GitHub 版本(例如 Logger)或变更日志。

更多详细信息,请参阅 NEWS提交日志

自 Ruby 3.2.0 以来,这些更改导致 5207 个文件发生更改,新增 284820 行代码 (+),删除 174773 行代码 (-)

下载

  • https://cache.ruby-lang.org/pub/ruby/3.3/ruby-3.3.0-preview3.tar.gz

    SIZE: 21550473
    SHA1: 2811f191d66dffee0206771873bd990857ae4ed6
    SHA256: 0969141be92e67e0edb84a8fb354acc98f01bd78e602a23a0f136045c82f4809
    SHA512: 94db07a6958c09809b2e5b597fa55a121074e8bacb3bf588c83cf0d35b07a8b070172035a49d1abf0d8ee364a9ace824f34e677f7327ffe1acdbab0938ac49c4
    
  • https://cache.ruby-lang.org/pub/ruby/3.3/ruby-3.3.0-preview3.tar.xz

    SIZE: 15970144
    SHA1: 496600612605f8ebeb955255e98bac73a4cbc045
    SHA256: f79afcf122dc7d04fe26cfa4436b9c488b21766fc54b0d2dfb2ba41cd0cdd355
    SHA512: d7ab0d703e7884efd31045933409cd68fac1d9941963537ccc8e309ca7c8bee8500a68182135acba22cbdbf4a8ae99f39bf7f0925273eb4fbc3728c0c1ba0c19
    
  • https://cache.ruby-lang.org/pub/ruby/3.3/ruby-3.3.0-preview3.zip

    SIZE: 26618303
    SHA1: 6a13e08c7e484d42037c1e2c87c5d0e220f893a0
    SHA256: c35bf637a647c2f60148368ffb374db5c258570911794f46b6dfdb98ebfe95d9
    SHA512: c4ef2cdcdadeb85ad1d42aedc97f9f3d609b3b01eea2319451cf92c81bd31ae8129b7c91fc68571469dd888c01ea0f48f73234b965db17f6a87404ca382f7794
    

什么是 Ruby

Ruby 最初由 Matz(松本行弘)于 1993 年开发,现在作为开源项目进行开发。它可在多个平台上运行,并在世界各地广泛使用,特别是在 Web 开发领域。