パスワードを忘れた? アカウント作成

densukeさんのトモダチの日記。 最新から新しい日記やタレこみを確認できますよ。

15056104 journal
AMD

cyber205の日記: いまどきのBYTEBENCHコンパイル方法

日記 by cyber205

BYTE UNIX BENCHMARK は改良を続けられていて現在も一応メンテナが居る。
現在はGoogleに勤務しているKelly Lucasさんがgithubでソースを公開している。
Linuxシステムにgitが入っていれば、最新版のソースを、
~/src/git$ git clone https://github.com/kdlucas/byte-unixbench.git
Cloning into 'byte-unixbench'...
remote: Enumerating objects: 204, done.
remote: Total 204 (delta 0), reused 0 (delta 0), pack-reused 204
Receiving objects: 100% (204/204), 200.92 KiB | 220.00 KiB/s, done.
Resolving deltas: 100% (105/105), done.
こうやって取得可能。ライセンスはGPL、READMEも付属。
cd byte-unixbench/UnixBench
make all で通常のベンチマークがコンパイル可能。
というか./Runスクリプト走らせれば普通にコンパイルしてベンチ完走まで自動実行。
コンパイル中には1個所、Warningが出る部分があるのだが、どういう意味なのか分からないのと、実害はなさそうなので放置している。

gcc_-o_pgms/execl_-Wall_-pedantic_-O3_-ffast-math_-march=native_-mtune=native_-I_./src_-DTIME_src/execl.c
In_file_included_from_src/execl.c:34:
src/big.c:_In_function_‘dummy’:
src/big.c:196:34:_warning:_‘%02d’_directive_writing_between_2_and_10_bytes_into_a_region_of_size_5_[-Wformat-overflow]
______sprintf(logname,_"masterlog.%02d",_firstuser/MAXCHILD);
__________________________________^~~~
src/big.c:196:23:_note:_directive_argument_in_the_range_[-178956970,_178956970]
______sprintf(logname,_"masterlog.%02d",_firstuser/MAXCHILD);
_______________________^~~~~~~~~~~~~~~~
src/big.c:196:6:_note:_‘sprintf’_output_between_13_and_21_bytes_into_a_destination_of_size_15
______sprintf(logname,_"masterlog.%02d",_firstuser/MAXCHILD);

どうもsprintfのフォーマット指定が桁数的に宜しくないと警告されているようなのだけど、ソースのどの部分をイジればいいのかよく分からないので放置。
計算は普通に通る。

マルチプロセッサ対応になってからは -c オプションでベンチマーク同時実行数を指定できる。例えば6コア12スレッドのRyzenプロセッサなら、
~/src/git/byte-unixbench/UnixBench$ ./Run -c 1 -c 6 -c 12
といった具合。ただし、8スレッド同時実行シェルスクリプト実行テストのように、一部のベンチマークは既にコンカレントなベンチマークで、システムによって処理が適切にCPUへ分配されるので -c オプションで大幅に性能が伸びてきたりはしないようだ。
最近のLinuxで動かすと、LC_ALLのようなLOCALE設定が存在しないと咎められるので、実行時には LC_ALL=C 辺りを変数に指定して動かすと警告を出さずに済む。
どうも、LOCALEによってベンチマークのスコアが変動するらしいので英語圏指定が無難だとか。
~/src/git/byte-unixbench/UnixBench$ LC_ALL=C ./Run -c 1 -c 6 -c 12
こんな感じか。Windows10にLinuxをインストールしている場合には特に出ないようだ。


------------------------------------------------------------------------
Benchmark_Run:_火__1月_05_2021_23:24:49_-_23:52:36
12_CPUs_in_system;_running_1_parallel_copy_of_tests

Dhrystone_2_using_register_variables_______51975383.5_lps___(10.0_s,_7_samples)
Double-Precision_Whetstone_____________________9571.8_MWIPS_(8.9_s,_7_samples)
Execl_Throughput________________________________238.3_lps___(29.7_s,_2_samples)
File_Copy_1024_bufsize_2000_maxblocks________127532.4_KBps__(30.0_s,_2_samples)
File_Copy_256_bufsize_500_maxblocks___________32557.9_KBps__(30.0_s,_2_samples)
File_Copy_4096_bufsize_8000_maxblocks________416717.4_KBps__(30.0_s,_2_samples)
Pipe_Throughput______________________________382489.7_lps___(10.0_s,_7_samples)
Pipe-based_Context_Switching__________________94839.3_lps___(10.0_s,_7_samples)
Process_Creation________________________________304.6_lps___(30.0_s,_2_samples)
Shell_Scripts_(1_concurrent)___________________1692.3_lpm___(60.0_s,_2_samples)
Shell_Scripts_(8_concurrent)____________________484.5_lpm___(60.1_s,_2_samples)
System_Call_Overhead_________________________650749.7_lps___(10.0_s,_7_samples)

System_Benchmarks_Index_Values_______________BASELINE_______RESULT____INDEX
Dhrystone_2_using_register_variables_________116700.0___51975383.5___4453.8
Double-Precision_Whetstone_______________________55.0_______9571.8___1740.3
Execl_Throughput_________________________________43.0________238.3_____55.4
File_Copy_1024_bufsize_2000_maxblocks__________3960.0_____127532.4____322.1
File_Copy_256_bufsize_500_maxblocks____________1655.0______32557.9____196.7
File_Copy_4096_bufsize_8000_maxblocks__________5800.0_____416717.4____718.5
Pipe_Throughput_______________________________12440.0_____382489.7____307.5
Pipe-based_Context_Switching___________________4000.0______94839.3____237.1
Process_Creation________________________________126.0________304.6_____24.2
Shell_Scripts_(1_concurrent)_____________________42.4_______1692.3____399.1
Shell_Scripts_(8_concurrent)______________________6.0________484.5____807.4
System_Call_Overhead__________________________15000.0_____650749.7____433.8
___________________________________________________________________========
System_Benchmarks_Index_Score_________________________________________360.5

------------------------------------------------------------------------
Benchmark_Run:_火__1月_05_2021_23:52:36_-_00:20:28
12_CPUs_in_system;_running_6_parallel_copies_of_tests

Dhrystone_2_using_register_variables______261668204.0_lps___(10.0_s,_7_samples)
Double-Precision_Whetstone____________________52698.6_MWIPS_(8.9_s,_7_samples)
Execl_Throughput________________________________720.8_lps___(30.0_s,_2_samples)
File_Copy_1024_bufsize_2000_maxblocks________122540.3_KBps__(30.0_s,_2_samples)
File_Copy_256_bufsize_500_maxblocks___________30004.5_KBps__(30.0_s,_2_samples)
File_Copy_4096_bufsize_8000_maxblocks________398225.9_KBps__(30.0_s,_2_samples)
Pipe_Throughput_____________________________1517337.4_lps___(10.0_s,_7_samples)
Pipe-based_Context_Switching_________________446095.7_lps___(10.0_s,_7_samples)
Process_Creation________________________________738.1_lps___(30.0_s,_2_samples)
Shell_Scripts_(1_concurrent)___________________4401.8_lpm___(60.1_s,_2_samples)
Shell_Scripts_(8_concurrent)____________________638.2_lpm___(60.2_s,_2_samples)
System_Call_Overhead________________________1588348.9_lps___(10.0_s,_7_samples)

System_Benchmarks_Index_Values_______________BASELINE_______RESULT____INDEX
Dhrystone_2_using_register_variables_________116700.0__261668204.0__22422.3
Double-Precision_Whetstone_______________________55.0______52698.6___9581.6
Execl_Throughput_________________________________43.0________720.8____167.6
File_Copy_1024_bufsize_2000_maxblocks__________3960.0_____122540.3____309.4
File_Copy_256_bufsize_500_maxblocks____________1655.0______30004.5____181.3
File_Copy_4096_bufsize_8000_maxblocks__________5800.0_____398225.9____686.6
Pipe_Throughput_______________________________12440.0____1517337.4___1219.7
Pipe-based_Context_Switching___________________4000.0_____446095.7___1115.2
Process_Creation________________________________126.0________738.1_____58.6
Shell_Scripts_(1_concurrent)_____________________42.4_______4401.8___1038.2
Shell_Scripts_(8_concurrent)______________________6.0________638.2___1063.6
System_Call_Overhead__________________________15000.0____1588348.9___1058.9
___________________________________________________________________========
System_Benchmarks_Index_Score_________________________________________843.2

------------------------------------------------------------------------
Benchmark_Run:_水__1月_06_2021_00:20:28_-_00:48:26
12_CPUs_in_system;_running_12_parallel_copies_of_tests

Dhrystone_2_using_register_variables______403777714.5_lps___(10.0_s,_7_samples)
Double-Precision_Whetstone____________________92749.1_MWIPS_(8.8_s,_7_samples)
Execl_Throughput________________________________721.5_lps___(29.9_s,_2_samples)
File_Copy_1024_bufsize_2000_maxblocks________117854.3_KBps__(30.0_s,_2_samples)
File_Copy_256_bufsize_500_maxblocks___________30271.0_KBps__(30.0_s,_2_samples)
File_Copy_4096_bufsize_8000_maxblocks________393143.3_KBps__(30.0_s,_2_samples)
Pipe_Throughput_____________________________2307971.6_lps___(10.0_s,_7_samples)
Pipe-based_Context_Switching_________________638199.9_lps___(10.0_s,_7_samples)
Process_Creation________________________________732.8_lps___(30.0_s,_2_samples)
Shell_Scripts_(1_concurrent)___________________4238.9_lpm___(60.1_s,_2_samples)
Shell_Scripts_(8_concurrent)____________________546.1_lpm___(60.5_s,_2_samples)
System_Call_Overhead________________________1948408.4_lps___(10.0_s,_7_samples)

System_Benchmarks_Index_Values_______________BASELINE_______RESULT____INDEX
Dhrystone_2_using_register_variables_________116700.0__403777714.5__34599.6
Double-Precision_Whetstone_______________________55.0______92749.1__16863.5
Execl_Throughput_________________________________43.0________721.5____167.8
File_Copy_1024_bufsize_2000_maxblocks__________3960.0_____117854.3____297.6
File_Copy_256_bufsize_500_maxblocks____________1655.0______30271.0____182.9
File_Copy_4096_bufsize_8000_maxblocks__________5800.0_____393143.3____677.8
Pipe_Throughput_______________________________12440.0____2307971.6___1855.3
Pipe-based_Context_Switching___________________4000.0_____638199.9___1595.5
Process_Creation________________________________126.0________732.8_____58.2
Shell_Scripts_(1_concurrent)_____________________42.4_______4238.9____999.7
Shell_Scripts_(8_concurrent)______________________6.0________546.1____910.2
System_Call_Overhead__________________________15000.0____1948408.4___1298.9
___________________________________________________________________========
System_Benchmarks_Index_Score_________________________________________974.7

性能INDEX値は随時変更されていて、現在はSPARC Station 20-61が基準スコアに採用されている。アーキテクチャはsun4mで、CPUはSuperScalarSPARC/60MHzだそうだ。
>128MBのRAMを搭載したSPARCstation20-61、SPARCストレージアレイ、およびSolaris2.3が新しいベースラインです。それぞれで10.0と評価されています
ベンチを回してスコアが"10"なら、このSPARC機と同じ性能ということらしい。
Solaris 2.4を稼働させているSPARC機が15~20(1.5倍から2倍速い)、
Linux 1.3.45を使っていた頃の486DX2-66(Compaq製)が9.1を叩き出す。
(SS20-61比で90%以上の性能。PCUNIXが流行るわけだ)
Pentium 75MHz程度のPCだと20なので、Solaris 2.4で動くSPARCと同等と。
(なるほど、PCUNIXが…以下略)

「グラフィクスベンチマーク機能」
後にビデオまわりの性能を測定する機能が追加されたのだけど、これが結構いろいろコンパイルに追加ライブラリが必要。「libx11-dev xlibmesa-glu-dev xibext-dev」辺りを追加すると、aptなら必要な他のライブラリも一緒にインストールされる。
libx11-dev : libpthread-stubs0-dev libx11-dev libxau-dev libxcb1-dev libxdmcp-dev x11proto-core-dev x11proto-dev xorg-sgml-doctools xtrans-dev
xlibmesa-glu-dev : libegl-dev libgl-dev libgl1-mesa-dev libgles-dev libgles1 libglu1-mesa-dev libglvnd-dev libglx-dev libopengl-dev libopengl0
xlibext-dev : x11proto-xext-dev
先日スコアを計測したCore i7 920@2.67GHzで軽く走らせてみるとこんな感じ。
X-windowのドライバはnouveauを使用。ビデオカードは GigabyteのRadeon入り。
> Subsystem: Gigabyte Technology Co., Ltd Cedar [Radeon HD 5000/6000/7350/8350 Series]

------------------------------------------------------------------------
Benchmark_Run:_Wed_Jan_06_2021_12:20:46_-_12:38:35
8_CPUs_in_system;_running_1_parallel_copy_of_tests

2D_graphics:_aa_polygons_______________________2689.7_score_(51.2_s,_2_samples)
2D_graphics:_ellipses___________________________820.0_score_(52.6_s,_2_samples)
2D_graphics:_images_and_blits_________________64956.6_score_(55.8_s,_2_samples)
2D_graphics:_rectangles________________________3648.1_score_(57.8_s,_2_samples)
2D_graphics:_text____________________________173176.7_score_(38.2_s,_2_samples)
2D_graphics:_windows____________________________123.8_score_(54.1_s,_2_samples)
3D_graphics:_gears_______________________________60.0_fps___(20.0_s,_2_samples)

2D_Graphics_Benchmarks_Index_Values__________BASELINE_______RESULT____INDEX
2D_graphics:_aa_polygons_________________________15.0_______2689.7___1793.1
2D_graphics:_ellipses____________________________15.0________820.0____546.7
2D_graphics:_images_and_blits____________________15.0______64956.6__43304.4
2D_graphics:_rectangles__________________________15.0_______3648.1___2432.1
2D_graphics:_text________________________________15.0_____173176.7_115451.1
2D_graphics:_windows_____________________________15.0________123.8_____82.6
___________________________________________________________________========
2D_Graphics_Benchmarks_Index_Score___________________________________3153.8

3D_Graphics_Benchmarks_Index_Values__________BASELINE_______RESULT____INDEX
3D_graphics:_gears_______________________________33.4_________60.0_____18.0
___________________________________________________________________========
3D_Graphics_Benchmarks_Index_Score_____________________________________18.0

------------------------------------------------------------------------
Benchmark_Run:_Wed_Jan_06_2021_12:38:35_-_12:38:35
8_CPUs_in_system;_running_8_parallel_copies_of_tests

2Dのベンチマークにはx11perfを使っているらしい。
3Dのベンチマークはgearsの表示が採用されている。

15042927 journal
Debian

cyber205の日記: BYTE BENCH @ Core2Duo T5600

日記 by cyber205

------------------------------------------------------------------------
Benchmark_Run:_Tue_Jan_05_2021_00:10:10_-_00:38:42
2_CPUs_in_system;_running_1_parallel_copy_of_tests

Dhrystone_2_using_register_variables________8656919.6_lps___(10.0_s,_7_samples)
Double-Precision_Whetstone_____________________1918.1_MWIPS_(10.2_s,_7_samples)
Execl_Throughput_______________________________1572.2_lps___(29.6_s,_2_samples)
File_Copy_1024_bufsize_2000_maxblocks________165674.4_KBps__(30.0_s,_2_samples)
File_Copy_256_bufsize_500_maxblocks___________48307.4_KBps__(30.0_s,_2_samples)
File_Copy_4096_bufsize_8000_maxblocks________442108.5_KBps__(30.0_s,_2_samples)
Pipe_Throughput______________________________256958.1_lps___(10.0_s,_7_samples)
Pipe-based_Context_Switching__________________26054.6_lps___(10.0_s,_7_samples)
Process_Creation_______________________________2180.2_lps___(30.0_s,_2_samples)
Shell_Scripts_(1_concurrent)___________________4391.2_lpm___(60.0_s,_2_samples)
Shell_Scripts_(8_concurrent)____________________787.4_lpm___(60.0_s,_2_samples)
System_Call_Overhead_________________________216566.8_lps___(10.0_s,_7_samples)

System_Benchmarks_Index_Values_______________BASELINE_______RESULT____INDEX
Dhrystone_2_using_register_variables_________116700.0____8656919.6____741.8
Double-Precision_Whetstone_______________________55.0_______1918.1____348.7
Execl_Throughput_________________________________43.0_______1572.2____365.6
File_Copy_1024_bufsize_2000_maxblocks__________3960.0_____165674.4____418.4
File_Copy_256_bufsize_500_maxblocks____________1655.0______48307.4____291.9
File_Copy_4096_bufsize_8000_maxblocks__________5800.0_____442108.5____762.3
Pipe_Throughput_______________________________12440.0_____256958.1____206.6
Pipe-based_Context_Switching___________________4000.0______26054.6_____65.1
Process_Creation________________________________126.0_______2180.2____173.0
Shell_Scripts_(1_concurrent)_____________________42.4_______4391.2___1035.7
Shell_Scripts_(8_concurrent)______________________6.0________787.4___1312.3
System_Call_Overhead__________________________15000.0_____216566.8____144.4
___________________________________________________________________========
System_Benchmarks_Index_Score_________________________________________355.1

------------------------------------------------------------------------
Benchmark_Run:_Tue_Jan_05_2021_00:38:42_-_01:07:18
2_CPUs_in_system;_running_2_parallel_copies_of_tests

Dhrystone_2_using_register_variables_______17180237.0_lps___(10.0_s,_7_samples)
Double-Precision_Whetstone_____________________3740.2_MWIPS_(10.2_s,_7_samples)
Execl_Throughput_______________________________2933.8_lps___(29.7_s,_2_samples)
File_Copy_1024_bufsize_2000_maxblocks________273424.6_KBps__(30.0_s,_2_samples)
File_Copy_256_bufsize_500_maxblocks___________82476.3_KBps__(30.0_s,_2_samples)
File_Copy_4096_bufsize_8000_maxblocks________641922.8_KBps__(30.0_s,_2_samples)
Pipe_Throughput______________________________505963.0_lps___(10.0_s,_7_samples)
Pipe-based_Context_Switching_________________118158.0_lps___(10.0_s,_7_samples)
Process_Creation_______________________________6515.3_lps___(30.0_s,_2_samples)
Shell_Scripts_(1_concurrent)___________________6001.8_lpm___(60.0_s,_2_samples)
Shell_Scripts_(8_concurrent)____________________796.5_lpm___(60.1_s,_2_samples)
System_Call_Overhead_________________________399735.1_lps___(10.0_s,_7_samples)

System_Benchmarks_Index_Values_______________BASELINE_______RESULT____INDEX
Dhrystone_2_using_register_variables_________116700.0___17180237.0___1472.2
Double-Precision_Whetstone_______________________55.0_______3740.2____680.0
Execl_Throughput_________________________________43.0_______2933.8____682.3
File_Copy_1024_bufsize_2000_maxblocks__________3960.0_____273424.6____690.5
File_Copy_256_bufsize_500_maxblocks____________1655.0______82476.3____498.3
File_Copy_4096_bufsize_8000_maxblocks__________5800.0_____641922.8___1106.8
Pipe_Throughput_______________________________12440.0_____505963.0____406.7
Pipe-based_Context_Switching___________________4000.0_____118158.0____295.4
Process_Creation________________________________126.0_______6515.3____517.1
Shell_Scripts_(1_concurrent)_____________________42.4_______6001.8___1415.5
Shell_Scripts_(8_concurrent)______________________6.0________796.5___1327.4
System_Call_Overhead__________________________15000.0_____399735.1____266.5
___________________________________________________________________========
System_Benchmarks_Index_Score_________________________________________669.4

Core2 Duo で2CPUだとほぼ倍の性能が出るとは思わなかった。

15042887 journal
Debian

cyber205の日記: BYTE BENCH @ Core i7 920

日記 by cyber205


------------------------------------------------------------------------
Benchmark_Run:_Mon_Jan_04_2021_22:17:30_-_22:45:36
8_CPUs_in_system;_running_1_parallel_copy_of_tests

Dhrystone_2_using_register_variables_______30099208.6_lps___(10.0_s,_7_samples)
Double-Precision_Whetstone_____________________4486.0_MWIPS_(10.0_s,_7_samples)
Execl_Throughput_______________________________3267.5_lps___(30.0_s,_2_samples)
File_Copy_1024_bufsize_2000_maxblocks________471723.5_KBps__(30.0_s,_2_samples)
File_Copy_256_bufsize_500_maxblocks__________124418.4_KBps__(30.0_s,_2_samples)
File_Copy_4096_bufsize_8000_maxblocks_______1182844.3_KBps__(30.0_s,_2_samples)
Pipe_Throughput______________________________782640.2_lps___(10.0_s,_7_samples)
Pipe-based_Context_Switching_________________100623.7_lps___(10.0_s,_7_samples)
Process_Creation_______________________________3216.1_lps___(30.0_s,_2_samples)
Shell_Scripts_(1_concurrent)___________________8623.1_lpm___(60.0_s,_2_samples)
Shell_Scripts_(8_concurrent)___________________3821.3_lpm___(60.0_s,_2_samples)
System_Call_Overhead_________________________641745.9_lps___(10.0_s,_7_samples)

System_Benchmarks_Index_Values_______________BASELINE_______RESULT____INDEX
Dhrystone_2_using_register_variables_________116700.0___30099208.6___2579.2
Double-Precision_Whetstone_______________________55.0_______4486.0____815.6
Execl_Throughput_________________________________43.0_______3267.5____759.9
File_Copy_1024_bufsize_2000_maxblocks__________3960.0_____471723.5___1191.2
File_Copy_256_bufsize_500_maxblocks____________1655.0_____124418.4____751.8
File_Copy_4096_bufsize_8000_maxblocks__________5800.0____1182844.3___2039.4
Pipe_Throughput_______________________________12440.0_____782640.2____629.1
Pipe-based_Context_Switching___________________4000.0_____100623.7____251.6
Process_Creation________________________________126.0_______3216.1____255.2
Shell_Scripts_(1_concurrent)_____________________42.4_______8623.1___2033.8
Shell_Scripts_(8_concurrent)______________________6.0_______3821.3___6368.8
System_Call_Overhead__________________________15000.0_____641745.9____427.8
___________________________________________________________________========
System_Benchmarks_Index_Score_________________________________________965.2

------------------------------------------------------------------------
Benchmark_Run:_Mon_Jan_04_2021_22:45:36_-_23:13:42
8_CPUs_in_system;_running_4_parallel_copies_of_tests

Dhrystone_2_using_register_variables______115999649.6_lps___(10.0_s,_7_samples)
Double-Precision_Whetstone____________________17403.3_MWIPS_(10.0_s,_7_samples)
Execl_Throughput______________________________12082.6_lps___(30.0_s,_2_samples)
File_Copy_1024_bufsize_2000_maxblocks________867031.5_KBps__(30.0_s,_2_samples)
File_Copy_256_bufsize_500_maxblocks__________230769.3_KBps__(30.0_s,_2_samples)
File_Copy_4096_bufsize_8000_maxblocks_______2490227.3_KBps__(30.0_s,_2_samples)
Pipe_Throughput_____________________________3004653.6_lps___(10.0_s,_7_samples)
Pipe-based_Context_Switching_________________485157.1_lps___(10.0_s,_7_samples)
Process_Creation______________________________25114.2_lps___(30.0_s,_2_samples)
Shell_Scripts_(1_concurrent)__________________31927.3_lpm___(60.0_s,_2_samples)
Shell_Scripts_(8_concurrent)___________________4946.4_lpm___(60.0_s,_2_samples)
System_Call_Overhead________________________2335862.8_lps___(10.0_s,_7_samples)

System_Benchmarks_Index_Values_______________BASELINE_______RESULT____INDEX
Dhrystone_2_using_register_variables_________116700.0__115999649.6___9940.0
Double-Precision_Whetstone_______________________55.0______17403.3___3164.2
Execl_Throughput_________________________________43.0______12082.6___2809.9
File_Copy_1024_bufsize_2000_maxblocks__________3960.0_____867031.5___2189.5
File_Copy_256_bufsize_500_maxblocks____________1655.0_____230769.3___1394.4
File_Copy_4096_bufsize_8000_maxblocks__________5800.0____2490227.3___4293.5
Pipe_Throughput_______________________________12440.0____3004653.6___2415.3
Pipe-based_Context_Switching___________________4000.0_____485157.1___1212.9
Process_Creation________________________________126.0______25114.2___1993.2
Shell_Scripts_(1_concurrent)_____________________42.4______31927.3___7530.0
Shell_Scripts_(8_concurrent)______________________6.0_______4946.4___8244.0
System_Call_Overhead__________________________15000.0____2335862.8___1557.2
___________________________________________________________________========
System_Benchmarks_Index_Score________________________________________3052.3

------------------------------------------------------------------------
Benchmark_Run:_Mon_Jan_04_2021_23:13:42_-_23:41:51
8_CPUs_in_system;_running_8_parallel_copies_of_tests

Dhrystone_2_using_register_variables______133593064.8_lps___(10.0_s,_7_samples)
Double-Precision_Whetstone____________________29995.1_MWIPS_(10.0_s,_7_samples)
Execl_Throughput______________________________16952.7_lps___(30.0_s,_2_samples)
File_Copy_1024_bufsize_2000_maxblocks________669959.3_KBps__(30.0_s,_2_samples)
File_Copy_256_bufsize_500_maxblocks__________177238.4_KBps__(30.0_s,_2_samples)
File_Copy_4096_bufsize_8000_maxblocks_______1904782.3_KBps__(30.0_s,_2_samples)
Pipe_Throughput_____________________________3682635.1_lps___(10.0_s,_7_samples)
Pipe-based_Context_Switching_________________641653.8_lps___(10.0_s,_7_samples)
Process_Creation______________________________39274.0_lps___(30.0_s,_2_samples)
Shell_Scripts_(1_concurrent)__________________36876.5_lpm___(60.0_s,_2_samples)
Shell_Scripts_(8_concurrent)___________________4910.4_lpm___(60.0_s,_2_samples)
System_Call_Overhead________________________3504566.2_lps___(10.0_s,_7_samples)

System_Benchmarks_Index_Values_______________BASELINE_______RESULT____INDEX
Dhrystone_2_using_register_variables_________116700.0__133593064.8__11447.6
Double-Precision_Whetstone_______________________55.0______29995.1___5453.7
Execl_Throughput_________________________________43.0______16952.7___3942.5
File_Copy_1024_bufsize_2000_maxblocks__________3960.0_____669959.3___1691.8
File_Copy_256_bufsize_500_maxblocks____________1655.0_____177238.4___1070.9
File_Copy_4096_bufsize_8000_maxblocks__________5800.0____1904782.3___3284.1
Pipe_Throughput_______________________________12440.0____3682635.1___2960.3
Pipe-based_Context_Switching___________________4000.0_____641653.8___1604.1
Process_Creation________________________________126.0______39274.0___3117.0
Shell_Scripts_(1_concurrent)_____________________42.4______36876.5___8697.3
Shell_Scripts_(8_concurrent)______________________6.0_______4910.4___8184.0
System_Call_Overhead__________________________15000.0____3504566.2___2336.4
___________________________________________________________________========
System_Benchmarks_Index_Score________________________________________3518.9

15036710 journal
Debian

cyber205の日記: BYTE BENCH @ Core i7 860

日記 by cyber205

最近のBYTEBENCHはグラフィックスコアが測定できたり、マルチコアCPUでの性能が測定できる。
残念なことに、最新のGCCではgithubのソースでエラーが出たり、結果をまとめるスクリプトがperlだったりと、シンプルだった以前の形態から逸脱してるのが多少気になるところ。
LOCALE設定なんかも見ているようで、簡単にエラーなしで実行させるのはちょっと難しそう。

手持ちの高性能(?) な 4C8Tプロセッサ Corei7をベンチにかけてみた。
思ったより性能が出なくて気になっているモデルなので、もう1つ設計の古いCPUと比較してみたい。

------------------------------------------------------------------------
Benchmark_Run:_金__1月_01_2021_23:31:12_-_23:59:12
8_CPUs_in_system;_running_1_parallel_copy_of_tests

Dhrystone_2_using_register_variables_______34109062.2_lps___(10.0_s,_7_samples)
Double-Precision_Whetstone_____________________5042.8_MWIPS_(9.4_s,_7_samples)
Execl_Throughput_______________________________4139.3_lps___(30.0_s,_2_samples)
File_Copy_1024_bufsize_2000_maxblocks________563127.3_KBps__(30.0_s,_2_samples)
File_Copy_256_bufsize_500_maxblocks__________142387.3_KBps__(30.0_s,_2_samples)
File_Copy_4096_bufsize_8000_maxblocks_______1486933.4_KBps__(30.0_s,_2_samples)
Pipe_Throughput______________________________866857.2_lps___(10.0_s,_7_samples)
Pipe-based_Context_Switching_________________192783.5_lps___(10.0_s,_7_samples)
Process_Creation_______________________________8070.5_lps___(30.0_s,_2_samples)
Shell_Scripts_(1_concurrent)___________________9789.3_lpm___(60.0_s,_2_samples)
Shell_Scripts_(8_concurrent)___________________2882.0_lpm___(60.0_s,_2_samples)
System_Call_Overhead_________________________745427.1_lps___(10.0_s,_7_samples)

System_Benchmarks_Index_Values_______________BASELINE_______RESULT____INDEX
Dhrystone_2_using_register_variables_________116700.0___34109062.2___2922.8
Double-Precision_Whetstone_______________________55.0_______5042.8____916.9
Execl_Throughput_________________________________43.0_______4139.3____962.6
File_Copy_1024_bufsize_2000_maxblocks__________3960.0_____563127.3___1422.0
File_Copy_256_bufsize_500_maxblocks____________1655.0_____142387.3____860.3
File_Copy_4096_bufsize_8000_maxblocks__________5800.0____1486933.4___2563.7
Pipe_Throughput_______________________________12440.0_____866857.2____696.8
Pipe-based_Context_Switching___________________4000.0_____192783.5____482.0
Process_Creation________________________________126.0_______8070.5____640.5
Shell_Scripts_(1_concurrent)_____________________42.4_______9789.3___2308.8
Shell_Scripts_(8_concurrent)______________________6.0_______2882.0___4803.4
System_Call_Overhead__________________________15000.0_____745427.1____497.0
___________________________________________________________________========
System_Benchmarks_Index_Score________________________________________1207.3

シングルコア、シングルスレッドでの性能がこの値。
------------------------------------------------------------------------
Benchmark_Run:_金__1月_01_2021_23:59:12_-_00:27:28
8_CPUs_in_system;_running_4_parallel_copies_of_tests

Dhrystone_2_using_register_variables_______90173078.1_lps___(10.0_s,_7_samples)
Double-Precision_Whetstone____________________15653.9_MWIPS_(10.6_s,_7_samples)
Execl_Throughput______________________________11701.4_lps___(30.0_s,_2_samples)
File_Copy_1024_bufsize_2000_maxblocks________792873.8_KBps__(30.0_s,_2_samples)
File_Copy_256_bufsize_500_maxblocks__________203522.1_KBps__(30.0_s,_2_samples)
File_Copy_4096_bufsize_8000_maxblocks_______2458298.5_KBps__(30.0_s,_2_samples)
Pipe_Throughput_____________________________2782591.3_lps___(10.0_s,_7_samples)
Pipe-based_Context_Switching_________________475336.1_lps___(10.0_s,_7_samples)
Process_Creation______________________________20834.4_lps___(30.0_s,_2_samples)
Shell_Scripts_(1_concurrent)__________________22122.9_lpm___(60.0_s,_2_samples)
Shell_Scripts_(8_concurrent)___________________3937.9_lpm___(60.0_s,_2_samples)
System_Call_Overhead________________________2427961.5_lps___(10.0_s,_7_samples)

System_Benchmarks_Index_Values_______________BASELINE_______RESULT____INDEX
Dhrystone_2_using_register_variables_________116700.0___90173078.1___7726.9
Double-Precision_Whetstone_______________________55.0______15653.9___2846.2
Execl_Throughput_________________________________43.0______11701.4___2721.3
File_Copy_1024_bufsize_2000_maxblocks__________3960.0_____792873.8___2002.2
File_Copy_256_bufsize_500_maxblocks____________1655.0_____203522.1___1229.7
File_Copy_4096_bufsize_8000_maxblocks__________5800.0____2458298.5___4238.4
Pipe_Throughput_______________________________12440.0____2782591.3___2236.8
Pipe-based_Context_Switching___________________4000.0_____475336.1___1188.3
Process_Creation________________________________126.0______20834.4___1653.5
Shell_Scripts_(1_concurrent)_____________________42.4______22122.9___5217.7
Shell_Scripts_(8_concurrent)______________________6.0_______3937.9___6563.1
System_Call_Overhead__________________________15000.0____2427961.5___1618.6
___________________________________________________________________========
System_Benchmarks_Index_Score________________________________________2703.1

4コア全部を一応回してみると性能は2.23倍
------------------------------------------------------------------------
Benchmark_Run:_土__1月_02_2021_00:27:28_-_00:55:52
8_CPUs_in_system;_running_8_parallel_copies_of_tests

Dhrystone_2_using_register_variables______111751290.7_lps___(10.0_s,_7_samples)
Double-Precision_Whetstone____________________25548.7_MWIPS_(11.1_s,_7_samples)
Execl_Throughput______________________________15429.8_lps___(30.0_s,_2_samples)
File_Copy_1024_bufsize_2000_maxblocks________633169.5_KBps__(30.0_s,_2_samples)
File_Copy_256_bufsize_500_maxblocks__________166026.4_KBps__(30.0_s,_2_samples)
File_Copy_4096_bufsize_8000_maxblocks_______1978584.9_KBps__(30.0_s,_2_samples)
Pipe_Throughput_____________________________3580670.8_lps___(10.0_s,_7_samples)
Pipe-based_Context_Switching_________________750889.6_lps___(10.0_s,_7_samples)
Process_Creation______________________________32291.7_lps___(30.0_s,_2_samples)
Shell_Scripts_(1_concurrent)__________________25542.0_lpm___(60.0_s,_2_samples)
Shell_Scripts_(8_concurrent)___________________4007.0_lpm___(60.0_s,_2_samples)
System_Call_Overhead________________________3539051.9_lps___(10.0_s,_7_samples)

System_Benchmarks_Index_Values_______________BASELINE_______RESULT____INDEX
Dhrystone_2_using_register_variables_________116700.0__111751290.7___9575.9
Double-Precision_Whetstone_______________________55.0______25548.7___4645.2
Execl_Throughput_________________________________43.0______15429.8___3588.3
File_Copy_1024_bufsize_2000_maxblocks__________3960.0_____633169.5___1598.9
File_Copy_256_bufsize_500_maxblocks____________1655.0_____166026.4___1003.2
File_Copy_4096_bufsize_8000_maxblocks__________5800.0____1978584.9___3411.4
Pipe_Throughput_______________________________12440.0____3580670.8___2878.4
Pipe-based_Context_Switching___________________4000.0_____750889.6___1877.2
Process_Creation________________________________126.0______32291.7___2562.8
Shell_Scripts_(1_concurrent)_____________________42.4______25542.0___6024.1
Shell_Scripts_(8_concurrent)______________________6.0_______4007.0___6678.3
System_Call_Overhead__________________________15000.0____3539051.9___2359.4
___________________________________________________________________========
System_Benchmarks_Index_Score________________________________________3198.9

4コアそれぞれに2スレッド投入して見えている8CPU全てを回すと、
確かに性能が伸びて2.65倍まで性能が上がる。
周辺I/Oアクセスは並列運転が難しいだろうから、CPUコアだけ性能が伸びる条件で、
ここまで性能を稼げるのは立派なのか。

14198425 journal
医療

cyber205の日記: ジェネリック品の効き具合は2割ぐらい変動する 1

日記 by cyber205

ジェネリック医薬品を拒否する科学的理由は存在しない? 先発品がジェネリックになることも
薬価負担が保険制度で低く抑えられている日本だと、大半を払うのは保険制度なので、ジェネリックにするインセンティブは低い。
(タマに「ジェネリック使ったら安くなるよ!」という葉書が来るぐらい)
それに加え、ジェネリック品は有効成分が同じだけで製造ノウハウまでは移転されていないので、実際に使ってみると2割ぐらい効き目が落ちるというのが常識らしい。
もちろん、製造元が製造ノウハウまで移転したモノは全くオリジナルと同じ製法なので、効き目は変わらない。そういう薬は「AG:オーソライズドジェネリック」といって製造方法まで同じなので先発品と全く同じ効き目を期待できる。
先発医薬品メーカーが、子会社を作ってオーソライズドジェネリック薬を作らせるケースもあり、安心して使えるのは間違いないと思うが、いったいどういう意味があるのかよく分からない世界だ。そんなの、薬価下げるだけでOKじゃないのか。

原則として一般名で薬を扱い、デフォルトがジェネリック薬の処方になる国もあるので、そうなれば臨床のほうが嫌でも対応する結果になるだろうから、制度的な問題のような気もするが、日本はそういうところも含めていろいろ恵まれているのだろう。

14077017 journal
Debian

cyber205の日記: そろそろArduinoをきちんと勉強してみたい 3

日記 by cyber205

電子工作にマイコンってのは最近は当然のように行われていて必須の技術なのだけど、
自分でSBC(Single Board Computer)のプログラムを組むってのはなかなか難しく、
そこで、簡単な制御さえできればいいならArduinoがいいらしい、という話は聞いてたのだけど、あれはC言語っぽい何だか別の言語()、ということで本気で勉強はしてなかった。

しかし最近、Arduinoにセンサーを接続し、Raspberry Piでネットにつなぐ、というのが流行っているらしい。以前にどこかで聞いた、F-15イーグルで制空権取って、F-16ファルコンで爆撃する感じのハイローミックスというか、フロントエンド・バックエンドプロセッサの組み合わせがトレンドになってるとか。

性能で言えばRaspberry Piはとんでもなく高性能だが値段はそれなりに安く、
Arduinoは安く作ることもできるが、公式のボードはラズパイの半分ぐらいには値がはる。
結果的に両方の値段を合計すると、もうちょっといいボードが買えそうなものだが、一番手間がかからない開発環境ってのが、これを両方組み合わせたモノになるらしい。

14069943 journal
日記

cyber205の日記: Yahooブログ、本日で終了

日記 by cyber205

以前に作ってたBlogがあったのを思い出した。
2006年の8月28日に開始か。
今2019年でもうすぐ2020年だから、13年も前の自分が書いた記事がまだ閲覧可能だったわけで。
あの頃は若かったな、本当に。

14014008 journal
ゲーム

cyber205の日記: プロゲーマーの団体とはいえ、労組みたいなもんじゃないのね

日記 by cyber205

JeSUという団体がうさんくさい

本当の名前は GeSU だったりして。
必死で他に嫌がらせしても建設的な方向には話が行かないだろうな。

13971293 journal
AMD

cyber205の日記: いつのまにx86はベクトルプロセッサになったのだ 3

日記 by cyber205

【基本】CPUやGPUの理論値FLOPSの計算方法と測定方法
64bit化で随分レジスタセットが拡張されて、割り込みの時にはレジスタの退避とか大変だろうなと思ってはいたのだが、最近のx86は本当に何でもアリな感じになっている。
最近知ったが、スーパーコンピュータに搭載されているようなベクトルレジスタが、今や普通にx86プロセッサには実装されているのだという。
「Intel Xeon Skylake-SP Gold」の例だけど、AVX512命令ってのがあって、64bitの倍精度浮動小数点演算を1命令で8個、しかもFMA演算器を搭載しているので1クロックで足し算と掛け算を実行する。そのALUを2台搭載してるから、1クロックで倍精度の浮動小数点演算を32回も実行できることになる。

12コアタイプのXeonは、ほぼ1TFLOPSの演算性能があるようだ。
ただ、CPUに与える負荷も相当なモノらしく、ベクトルレジスタでの演算中には実効クロックが下がるらしい。

最近、Intelを抜いてCPU販売数首位に躍り出たAMDはというと、AVX512命令ではなく、AVX256とも言うべきAVX2命令セットに対応している。
性能はそこそこだけど、安く買えるのでいろいろ実験するには良さそうだ。

13866962 journal
日記

cyber205の日記: 小足払いに昇竜拳でカウンター 1

日記 by cyber205

プロゲーマーだった中高時代、「底知れない1位」という存在にこだわりたい/じげん社長・平尾 丈
>昇龍拳はコントローラーの「前・下・斜め・パンチ」というコマンド操作で出します。
>4動作なので理論上、相手が動いてから技を繰り出すまでは最速で4フレームです。
>さすがにそれには追い付けませんが、相手の挙動を感じて7、8フレーム後に打てれば、たいてい勝てます。
>これが分かってから85連勝しました。
確かに、未来が読めるんじゃないかというほど勘が当たることはあるが。
「小足見てから昇龍拳かよ」 週刊ダイヤモンドの「挙動を感じて8フレーム後に昇龍」に格ゲーマーからツッコミが殺到した理由
まぁ、無理でしょうな。嘘は良くない。
実際そんなレベルの凄腕プレイヤーが居るという話は当時も無かったそうだ。

typodupeerror

吾輩はリファレンスである。名前はまだ無い -- perlの中の人

読み込み中...