link もっと前
   2019年 6月 20日 -
      2019年 6月 11日  
link もっと後

link 未来から過去へ表示(*)
link 過去から未来へ表示

日々

link permalink

GCC を調べる - その 4 - RTL を眺める

RTL は (演算子 引数1 引数2 ...) という形で表記されます。Lisp の S 式に似ているんですかね?前回(2019年 6月 14日の日記参照)出力した RTL のうち 5番目の insn を例にとります。

RTL 1つを取り出した状態

(insn 6 5 7 2 (set (mem/c:SI (plus:SI (reg/f:SI 65 frame)
                (const_int -4 [0xfffffffffffffffc])) [1 a+0 S4 A32])
        (reg:SI 104)) "a.c":3 132 {*movsi_internal}
     (nil))

RTL はいくつも種類があり、code という番号で区別されています。RTL をファイルに出力する際は code は名前に変換され、開きカッコの後に書かれます。

先頭の RTL は (insn ... で始まっているので、code = insn の RTL で、その後 (set ... とあるので、code = set の RTL があるんだな、ということがわかります。上記の RTL に出てくる code は、insn, set, mem, plus, reg, const_int の 6種類です。

RTL を読んでみる

RTL は引数を取ります。先程の例に出てくる RTL の引数は下記のとおりです。

  • insn : uuBeiie
  • set : ee
  • mem : e0
  • plus : ee
  • reg : r
  • const_int: w

例えば set の ee であれば e という種類の引数を 2つ取る、という意味です。GCC では RTL の引数をこのように定義します。かなり意味不明だと思いますが、こういうものだと思うしかないです。

さらに e という種類の 引数は別の RTL を含んで OK なので、RTL は入れ子になります。先の例に出てきた RTL を分割してみます。

RTL の引数の切れ目を明示
                     ____________________________________________________________________________________________________________________________________  ________  ______________________  _______
                    | e insn__________________________________________________________________________________________________________   ________________ | i insn  | i insn                | e insn
                    |      | e set      __________________________________________________________________________  _  _______________  | e set           |         |                       |
                    |      |           | e mem     ______________________  _______________________________________ |0 | mem additional  |                 |         |                       |
                    |      |           |          | e plus     _________  | e plus      _________________________  |  |                 |          ______ |         |                       |
         __  __  _  |      |           |          |           | r reg     |            | w const_int               |  |                 |         | r reg |         |                       |
        | u | u | B |      |           |          |           |           |            |                           |  |                 |         |       |         |                       |
(insn 6 | 5 | 7 | 2 | (set | (mem/c:SI | (plus:SI | (reg/f:SI | 65 frame) | (const_int | -4 [0xfffffffffffffffc])) |  | [1 a+0 S4 A32]) | (reg:SI | 104)) | "a.c":3 | 132 {*movsi_internal} | (nil))

途切れ目が非常にわかりにくいです。私も正直ぱっと見ではわかりません。特に引数 e は入れ子になっていて、ひたすら見づらいです。RTL の引数の正確な切れ目を知るには、print_rtx_operand_code_e() など、引数の print 関数を見るのが一番早いかもしれません。

RTL の引数の切れ目を見るには

RTL の出力をリアルタイムで見たいときは、gdb で print_rtl_with_bb() 辺りにブレークを掛けておいて、ステップ実行していくとわかりやすいです。

その際 printf 系の出力がバッファリングされると、print した文字列がなかなかファイルに出力されません。デバッグ時は print 文と、実際に出力されている文字列の対応が確認しづらいため、最初に setvbuf() を呼んでバッファリングを無効にしておいたほうが見やすいと思います。

RTL の出力のバッファリングを無効にする

/* Like dump_function_to_file, but for RTL.  Print out dataflow information
   for the start of each basic block.  FLAGS are the TDF_* masks documented
   in dumpfile.h.  */

void
print_rtl_with_bb (FILE *outf, const rtx_insn *rtx_first, dump_flags_t flags)
{
  const rtx_insn *tmp_rtx;

  setvbuf(outf, NULL, _IONBF, 0);  //★★この行を足した★★

  if (rtx_first == 0)
    fprintf (outf, "(nil)\n");
  else
    {
      enum bb_state { NOT_IN_BB, IN_ONE_BB, IN_MULTIPLE_BB };

  //...

あとは観察したい RTL ファイルを tail -f とかで追い続ければ良いでしょう。

やっつけ感が満載の GCC

RTL の名前と引数の情報を定義した rtl.def というファイルがあるのですが、これだけを見るといかにも整然としたルールに則っているように見えます。ですが実際は例外だらけで、コードを読んでいるとなかなか辛いものがあります……。

例えば、今回の例で行くと mem の最後に何か([1 a+0 S4 A32] というやつ)出力されていますよね?rtl.def を見ると mem の引数の定義は "e0" なので、"0" の一部だろうと考えたくなりますが、残念ながら、この情報については rtl.def には一切記述がありません。これはひどい。

RTL を文字列として出力する print_rtx() 関数の実装を見ると、最後の方で MEM, CONST_DOUBLE, CONST_WIDE_INT, CONST_POLY_INT, CODE_LABEL だけ特別扱いして、特別に出力が追加されます。16進数だと見づらいし、とりあえず出しておこうという感じでしょうか……。

[編集者: すずき]
[更新: 2019年 6月 17日 23:30]
link 編集する

コメント一覧

  • コメントはありません。
open/close この記事にコメントする



link permalink

GCC を調べる - その 3 - RTL の出力

GCC の内部情報を出力してみます。GCC のバックエンドは GIMPLE と RTL (Register Transfer Language) があります。

ざっくり言って C 言語(など)→ GIMPLE → RTL → アセンブラの順に変換されます。GIMPLE の内容はまだよく知らないので説明できません……。今回は RTL を見ていこうと思います。

RTL を出力する方法

GCC で RTL を出力するには、コンパイル時に -fdump-rtl-all オプションを付けます。

RTL の出力オプション

$ riscv32-unknown-elf-gcc a.c -fdump-rtl-all

試しに下記のコードをコンパイルし、RTL を出力させると、

サンプルコード(C言語, a.c)

void main()
{
        int a = 1, b = 2, c;

        c = a + b;

        return c;
}

下記のような RTL が出力されます(GCC-8.3.0 での結果)。C 言語のファイル名が a.c だとすると、RTL は a.c.NNNr.XXXX という名前で出力されます。NNN は最適化パスの番号、XXXX は最適化パスの名前が入ります。

サンプルコード(RTL, a.c.235r.vregs)

;; Function main (main, funcdef_no=0, decl_uid=1514, cgraph_uid=0, symbol_order=0)

(note 1 0 3 NOTE_INSN_DELETED)
(note 3 1 2 2 [bb 2] NOTE_INSN_BASIC_BLOCK)
(note 2 3 5 2 NOTE_INSN_FUNCTION_BEG)
(insn 5 2 6 2 (set (reg:SI 104)
        (const_int 1 [0x1])) "a.c":3 132 {*movsi_internal}
     (nil))
(insn 6 5 7 2 (set (mem/c:SI (plus:SI (reg/f:SI 65 frame)
                (const_int -4 [0xfffffffffffffffc])) [1 a+0 S4 A32])
        (reg:SI 104)) "a.c":3 132 {*movsi_internal}
     (nil))
(insn 7 6 8 2 (set (reg:SI 105)
        (const_int 2 [0x2])) "a.c":3 132 {*movsi_internal}
     (nil))
(insn 8 7 9 2 (set (mem/c:SI (plus:SI (reg/f:SI 65 frame)
                (const_int -8 [0xfffffffffffffff8])) [1 b+0 S4 A32])
        (reg:SI 105)) "a.c":3 132 {*movsi_internal}
     (nil))
(insn 9 8 10 2 (set (reg:SI 107)
        (mem/c:SI (plus:SI (reg/f:SI 65 frame)
                (const_int -4 [0xfffffffffffffffc])) [1 a+0 S4 A32])) "a.c":5 132 {*movsi_internal}
     (nil))
(insn 10 9 11 2 (set (reg:SI 108)
        (mem/c:SI (plus:SI (reg/f:SI 65 frame)
                (const_int -8 [0xfffffffffffffff8])) [1 b+0 S4 A32])) "a.c":5 132 {*movsi_internal}
     (nil))
(insn 11 10 12 2 (set (reg:SI 106)
        (plus:SI (reg:SI 107)
            (reg:SI 108))) "a.c":5 3 {addsi3}
     (nil))
(insn 12 11 17 2 (set (mem/c:SI (plus:SI (reg/f:SI 65 frame)
                (const_int -12 [0xfffffffffffffff4])) [1 c+0 S4 A32])
        (reg:SI 106)) "a.c":5 132 {*movsi_internal}
     (nil))
(insn 17 12 0 2 (const_int 0 [0]) "a.c":7 240 {nop}
     (nil))

RTL は最適化処理を実行するたびに内容が変わるため、たくさんのファイルが出力されます。上記の RTL は GIMPLE から RTL に変換した後、命令割当のみ行った状態のものです。最適化パス名でいうと vregs というパスが終わった後の RTL です。

長くなってきたので分割します。

[編集者: すずき]
[更新: 2019年 6月 17日 22:25]
link 編集する

コメント一覧

  • コメントはありません。
open/close この記事にコメントする



link もっと前
   2019年 6月 20日 -
      2019年 6月 11日  
link もっと後

管理用メニュー

link 記事を新規作成

合計:  counter total
本日:  counter today

link About www.katsuster.net
RDF ファイル RSS 1.0
QR コード QR コード

最終更新: 6/17 23:30

カレンダー

<2019>
<<<06>>>
------1
2345678
9101112131415
16171819202122
23242526272829
30------

最近のコメント 5件

  • link 19年05月17日
    すずき 「試してみたら、同じみたいです。\nわざわ...」
    (更新:05/25 10:35)
  • link 19年05月17日
    hdk 「実際に試したわけではないので素朴な疑問な...」
    (更新:05/23 21:07)
  • link 19年04月01日
    すずき 「どの CPU というかシステムでも同じ傾...」
    (更新:04/05 11:03)
  • link 19年04月01日
    hdk 「去年Ryzen 7 1700で測りました...」
    (更新:04/02 22:48)
  • link 19年03月05日
    すずき 「> オシロの波形見てて気がつかなか...」
    (更新:03/21 17:45)

最近の記事 3件

link もっとみる
  • link 19年06月15日
    すずき 「[GCC を調べる - その 4 - RTL を眺める] RTL ...」
    (更新:06/17 23:30)
  • link 19年06月14日
    すずき 「[GCC を調べる - その 3 - RTL の出力] GCC の...」
    (更新:06/17 22:25)
  • link 19年06月03日
    すずき 「[抗生物質] 病院に行くと大抵の場合、何らかの抗生物質が処方されま...」
    (更新:06/09 15:04)

こんてんつ

open/close wiki
open/close Java API

過去の日記

open/close 2002年
open/close 2003年
open/close 2004年
open/close 2005年
open/close 2006年
open/close 2007年
open/close 2008年
open/close 2009年
open/close 2010年
open/close 2011年
open/close 2012年
open/close 2013年
open/close 2014年
open/close 2015年
open/close 2016年
open/close 2017年
open/close 2018年
open/close 2019年
open/close 過去日記について

その他の情報

open/close アクセス統計
open/close サーバ一覧
open/close サイトの情報