link もっと前
   2018年 8月 14日 -
      2018年 8月 14日  
link もっと後

link 未来から過去へ表示(*)
link 過去から未来へ表示

日々

link permalink

自分のマシンは何 GFLOPS か? その 2

その 1その 2その 3

LINPACK のビルドができたので、さっそく実行してみます。バイナリは bin ディレクトリの下にあります。

実行の仕方は mpirun -n 4 xhpl のようにします。パラメータファイル(HPL.dat)が置いてあるディレクトリで実行してください。


AMD A10-7800 での実行結果

これが最速パラメータかどうか自信がありませんが、とりあえず 10GFlops だそうです。

しかし hdk 氏の AMD A10-7870K は 19GFlops 出ているそうです。両者ともに Bulldozer 系の APU なのに、倍も差がつく理由がさっぱりわかりません。謎です…。

AMD A10-7800 の性能(追記)

何気なく cblas と atlas のスタティックリンクをやめて、ダイナミックリンクに変更したところ、いきなり性能が上がり 1.7倍の 17GFlops になりました。


AMD A10-7800 での実行結果(ダイナミックリンク版)

えー?なぜ!?とりあえず perf top で見てみると libatlas.so の関数が 8割ほどの実行時間を占めています。ここが効率的になったんでしょうか?そんなに変わるものですかね、さっぱり意味がわかりません…。

ARM も見てみる

Rock64 でも実行してみました。SoC は Rockchip RK3328、CPU は Cortex-A53 x 4 です。


Rock64 での実行結果

大体 1.5GFlops でした。A10-7800 と比べるとやはり 1桁違いますね(PC が 6.7倍速い)(ダイナミックリンク版だと 11倍速い)。

コンパイル実験(2018年 8月 12日の日記参照)のときは PC が 18倍ほど速かったので、コンパイル実験よりは差が縮まっている、とも取れます。

電力効率の点から見ると、PC 1台より Rock64 を 10台並べた方が省エネなのでしょうか?微妙かな…?今度、ワットチェッカーで比べてみましょうか。

[編集者: すずき]
[更新: 2018年 8月 15日 10:08]
link 編集する

コメント一覧

  • hdk 
    なるほど! LINKERを変えていなくてリンクエラーになるのを何とかしようとして手こずっている間に-lcblas -latlasに変えていました... まさかそれが実行時間を短縮するとは... 
    (2018年08月14日 23:06:13)
  • すずき 
    ダイナミックリンクにするだけで性能がほぼ倍になるので、私も驚きです…。 
    (2018年08月15日 08:34:25)
open/close この記事にコメントする



link もっと前
   2018年 8月 14日 -
      2018年 8月 14日  
link もっと後

管理用メニュー

link 記事を新規作成

合計:  counter total
本日:  counter today

link About www.katsuster.net
RDF ファイル RSS 1.0
QR コード QR コード

最終更新: 7/20 00:23

カレンダー

<2018>
<<<08>>>
---1234
567891011
12131415161718
19202122232425
262728293031-

最近のコメント 5件

  • link 19年07月18日
    hdk 「x86の除算例外は8086/8088の頃...」
    (更新:07/20 00:23)
  • link 19年05月17日
    すずき 「試してみたら、同じみたいです。\nわざわ...」
    (更新:05/25 10:35)
  • link 19年05月17日
    hdk 「実際に試したわけではないので素朴な疑問な...」
    (更新:05/23 21:07)
  • link 19年04月01日
    すずき 「どの CPU というかシステムでも同じ傾...」
    (更新:04/05 11:03)
  • link 19年04月01日
    hdk 「去年Ryzen 7 1700で測りました...」
    (更新:04/02 22:48)

最近の記事 3件

link もっとみる
  • link 19年07月18日
    すずき 「[除算命令] 今まであまり CPU アーキテクチャの違いを感じたこ...」
    (更新:07/19 00:41)
  • link 19年07月12日
    すずき 「[OpenVX on OpenCL] 会社の人に OpenVX の...」
    (更新:07/16 02:26)
  • link 19年07月04日
    すずき 「[Unleashed の動作周波数] SiFive FU540 の...」
    (更新:07/06 01:16)

こんてんつ

open/close wiki
open/close Java API

過去の日記

open/close 2002年
open/close 2003年
open/close 2004年
open/close 2005年
open/close 2006年
open/close 2007年
open/close 2008年
open/close 2009年
open/close 2010年
open/close 2011年
open/close 2012年
open/close 2013年
open/close 2014年
open/close 2015年
open/close 2016年
open/close 2017年
open/close 2018年
open/close 2019年
open/close 過去日記について

その他の情報

open/close アクセス統計
open/close サーバ一覧
open/close サイトの情報