[ruby-dev:52133] [Ruby master Feature#11177] DATAでEOF文字以降が読めない

22 Nov
2024
22 Nov
'24
2:15 p.m.
less -F data.rb #!ruby DATA.pos # posなしだと [] しか得られない
Issue #11177 has been updated by YO4 (Yoshinao Muramatsu). rubyの-xオプション付与でソースファイルをバイナリオープンさせることでも```\x1A```以降の読み込みが可能でした。 こちらは ruby 3.3またはそれ以前でも可能のようです。 ``` p IO.open(DATA.fileno, "rt") {|f| f.readlines } __END__ textpart1 textpart1^Z binpart1 binpart2
ruby -x data.rb ["textpart1\n", "textpart1\u001A\n", "binpart1\n", "binpart2\n"]
同様の動作を仕込むことで EOF以降も DATAでアクセス可能にできそうですが、DATA.class が Fileでなく IOになっちゃいますね…
----------------------------------------
Feature #11177: DATAでEOF文字以降が読めない
https://bugs.ruby-lang.org/issues/11177#change-110732
* Author: mame (Yusuke Endoh)
* Status: Open
----------------------------------------
遠藤です。
Windows で `__END__` 以降に EOF 文字 (`\x1A`) があったとき、それより先が読めないのは仕様でしょうか。
gen.rb:
puts "p DATA.read"
puts "__END__"
puts "foo\x1Abar"
以下のように実行すると再現します。
> ruby gen.rb > t.rb
> ruby t.rb
"foo"
`DATA.binmode.read` などとしてみても同じです。
もちろん、Linux では先まで読めます。Windows でも、ソースコードをパイプで流し込んだ場合はなぜか読めます。
> ruby < t.rb
"foo\x1Abar\n"
さらに、EOF 以降に文字がいっぱいあった場合、EOF 以降の一部の文字が抜け落ちるような挙動になるようです。
gen2.rb:
puts "p DATA.read"
puts "__END__"
puts "foo\x1A" + "X" * 8192 + "Z"
> ruby gen2.rb > t.rb
> ruby t.rb
"fooXXXXXXXXXXXXXXXXXXXXXXXXXXXZ\r\n"
バッファリングのバグっぽい挙動ですが、バグでしょうか。
--
Yusuke Endoh <mame@ruby-lang.org>
--
https://bugs.ruby-lang.org/
251
Age (days ago)
251
Last active (days ago)
0 comments
1 participants
participants (1)
-
YO4 (Yoshinao Muramatsu)