不遇の標準ライブラリ

歌舞伎座.tech#8「C++初心者会」

@Ryosuke839

自己紹介

• @Ryosuke839

• 某工大情報工学科4年生です

• 画像認識の研究始めました

• C++初心者です

–規格書暗記してません

– コンパイラのバグ踏んだことありません

• (‘ω’)

今回のテーマ

標準ライブラリ

今回のテーマ

標準ライブラリ

今回のテーマ

•不遇の標準ライブラリ

今回のテーマ

•不遇の標準ライブラリ

• 次期規格で追加されるライブラリなどのstate of the artな話題ではありません

• C++98(C++の初期規格)から存在するライブラリの話です

– C++に詳しい諸兄はタイトルでピンときているはず

今回のテーマ

• valarray • C++98から存在します

• 単独でヘッダファイルも持っています

– #include <valarray>

• でも使われてません

今回のテーマ

• valarray • 数値計算に特化した可変長配列を実現するテンプレートクラスvalarrayを含んでいます

– vectorと被るような…

• ベクトル演算を簡単に記述できます

• でも使われてません

今回のテーマ

• valarray • どれだけ使われていないか

• 論文の世界では被引用数が論文の価値の目安になるらしいので、被include数を示します

被include数@GitHub

これ

被include数@GitHub

これ

今回のテーマ

• valarray • これだけ使われていないのはかわいそう

• 今回は（無理して）使ってみます

–見た目でわかりやすい画像処理をします

使ってみる

• とりあえずIOを書きます

std::ifstream ifs(name, std::ios::binary); std::valarray<unsigned char> res; res.resize(256 * 256); for (auto& c : res) ifs.read(reinterpret_cast<char*>(&c), 1);

std::ofstream ofs(name, std::ios::binary); for (auto& c : data) ofs.write(reinterpret_cast<const char*>(&c), 1);

使ってみる

• とりあえずIOを書きます

std::ifstream ifs(name, std::ios::binary); std::valarray<unsigned char> res; res.resize(256 * 256); for (auto& c : res) ifs.read(reinterpret_cast<char*>(&c), 1);

std::ofstream ofs(name, std::ios::binary); for (auto& c : data) ofs.write(reinterpret_cast<const char*>(&c), 1);

可変長だけど可変長じゃない！

使ってみる

• あとは処理を書くだけ

auto data = readimg("nico.bmp"); data = (unsigned char)(192) - data / (unsigned char)(2); writeimg("result.bmp", data);

使ってみる

暗黙の変換はしてくれません

使ってみる

• Sliceも取れます auto data = readimg("nico.bmp"); data[std::gslice(112 * 256 + 24, std::valarray<size_t>{32, 160}, std::valarray<size_t>{256, 1})] = (unsigned char)(0); writeimg("result.bmp", data);

使ってみる

• Sliceも取れます auto data = readimg("nico.bmp"); data[std::gslice(112 * 256 + 24, std::valarray<size_t>{32, 160}, std::valarray<size_t>{256, 1})] = (unsigned char)(0); writeimg("result.bmp", data);

使ってみる

• 比較結果でsliceを作ることもできます auto data = readimg("nico.bmp"); data[std::gslice(...)] = (unsigned char)(0); auto text = readimg("text.bmp"); data[text != byte(127)] = std::valarray<byte>(text[text != byte(127)]); writeimg("result.bmp", data);

使ってみる

• 比較結果でsliceを作ることもできます auto data = readimg("nico.bmp"); data[std::gslice(...)] = (unsigned char)(0); auto text = readimg("text.bmp"); data[text != byte(127)] = std::valarray<byte>(text[text != byte(127)]); writeimg("result.bmp", data);

その他の用法

• 内積

• 外積

• ノルム

– L1

– L2

– L∞

(a * b).sum()

a.cshift(1) * b.cshift(-1) - a.cshift(-1) * b.cshift(1)

std::sqrt((a * a).sum())

std::abs(a).sum()

std::abs(a).max()

残念な仕様

• 他にもsin, cos, exp, log等の関数を使えます

– この場合でも引数と戻り値の型は同じです

–他の型のvalarrayにキャストもできません

• Sliceで元のvalarrayへの参照を取れますが、sliceのsliceを取ることはできません

–一旦sliceから新しいvalarrayを生成する必要あり

template<class T> valarray<T> valarray<T>::apply(T func(const T&)) const; template<class T> valarray<T> operator* (const valarray<T>&, const T&); template<class T> valarray<T> pow(const valarray<T>&, const valarray<T>&);

残念な仕様

• valarrayがC++に導入されたそもそもの経緯

– C++が開発された80年代はベクトル型計算機の華の時代

– Fortranではベクトル化最適化が実装されていた

残念な仕様

• valarrayがC++に導入されたそもそもの経緯

– C++が開発された80年代はベクトル型計算機の華の時代

– Fortranではベクトル化最適化が実装されていた

– C++でもFortran並みの最適化を簡単に実現できるよう狙った？[要出典]

–型の制約がきついのも最適化のため？[要出典]

残念な仕様

• 現在はPC向けCPUでもSSEなどのベクトル命令が実装されている

–では、valarrayもそれらに最適化されるのでは…？

残念な仕様

• 現在はPC向けCPUでもSSEなどのベクトル命令が実装されている

–では、valarrayもそれらに最適化されるのでは…？

• ベンチマークしてみます

– Cスタイルの配列とforループ

– std::vectorとstd::transform

– std::valarray

ベンチマーク

gcc clang

array + for loop

606ms FPU

660ms SSE2

vector + algorithm

603ms FPU

641ms SSE2

valarray 603ms FPU

648ms SSE2

Add, mul, sum, sqrt, sin, maxを求めるコードいずれのコンパイラにも高速演算オプション適用

ベンチマーク

gcc clang msvc

array + for loop

606ms FPU

660ms SSE2

vector + algorithm

603ms FPU

641ms SSE2

281ms SSE2

valarray 603ms FPU

648ms SSE2

256ms SSE2

ベンチマーク

gcc clang msvc icc icc+ipp

array + for loop

606ms FPU

660ms SSE2

vector + algorithm

603ms FPU

641ms SSE2

281ms SSE2

184ms AVX

valarray 603ms FPU

648ms SSE2

256ms SSE2

45ms AVX

41ms AVX(ipp)

ベンチマーク

gcc clang msvc icc icc+ipp

array + for loop

606ms FPU

660ms SSE2

47ms SSE4

27ms AVX

vector + algorithm

603ms FPU

641ms SSE2

281ms SSE2

184ms AVX

valarray 603ms FPU

648ms SSE2

256ms SSE2

45ms AVX

41ms AVX(ipp)

まとめ

• valarrayは使われてない割には便利です！

–簡単なベクトル演算をしたい時に俺々ライブラリを書くよりはずっと便利ただし謎の制約多数

–仕様が独特なので、本格的な演算をしたい場合は本格的なライブラリを使いましょう

• vector以上に最適化が効きます

• iccでコンパイルするとvectorの数倍速いです

まとめ

• valarrayは使われてない割には便利です！

–簡単なベクトル演算をしたい時に俺々ライブラリを書くよりはずっと便利ただし謎の制約多数

–仕様が独特なので、本格的な演算をしたい場合は本格的なライブラリを使いましょう

• vector以上に最適化が効きます

• iccでコンパイルするとvectorの数倍速いです

– インテルのコンパイラ今日限り特価140,000円！

不遇の標準ライブラリ - valarray

Transcript of 不遇の標準ライブラリ - valarray

不遇の標準ライブラリ - valarray

Software

Transcript of 不遇の標準ライブラリ - valarray

C++11概要 ライブラリ編

EDIF200を使用した 標準デザイン・ライブラリのイ …¨いう名前で、testという名前のライブラリに保存さ れています。この回路図は、analoglibライブラリのSmartSpice

EEPROM エミュレーション・ライブラリ Pack02 … ファミリ EEPROM エミュレーション・ライブラリ Pack02 パッケージVer.2.00 リリースノート R20UT2645JJ0102

4.2 アップグレードガイド...3.4.8. ライブラリのインストール . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

C++11 概要 ライブラリ編

My ライブラリ」サービスのご案内 · 2018. 12. 14. · 「My ライブラリ」サービスのご案内 ～インターネット・メールサービス～ 「My ライブラリ」とは・・・

SDSoC ユーザー ガイド : プラットフォームおよびライブラリ … · 2019-10-27 · SDSoC環境ユーザーガイド プラットフォームおよびライブラリ

Fortran ライブラリ・リファレンス - Oracle...vi Fortran ライブラリ・リファレンス• 2005 年 1 月 2. Fortran 95 組み込み関数 2-1 2.1 標準の Fortran

「mbed 」 –––– NXP LPC マイコンを用いた 高速 ... ライブラリの例 オンラインで用意されているもの mbed ライブラリmbed ライブラリ(続き

サーバー製品 テープオートローダー ライブラリ編 …...O VERVIEW テープオートローダー・ライブラリ 3 構成手順 1．ホスト接続 オプション選択

C++ SIMD クラス・ライブラリ - インテル: タブレット … C++ SIMD 命令 クラス・ライブラリ リファレンス・マニュアル 第3 章 Ivec クラス 用語の定義

Spartan-6 ライブラリ ガイド (HDL 用) - Xilinx...目次 ザイリンクス商標および著作権情報 2 1:このマニュアルについて 13

jQuery 対応ライブラリと TypeScript

サイボウズ デヂエ 8 ライブラリ管理マニュアル › ... › pdf › manual_dz8_library.pdf目次 ライブラリ管理マニュアル 目次 8 ライブラリ管理マニュアル

MGC3030/3130 GestIC ライブラリ インターフェイス ユーザ …ww1.microchip.com/downloads/jp/DeviceDoc/40001718E_JP.pdfMGC3030/3130 GestIC®ライブラリ インターフェイス

Oracle Java 標準ライブラリ AtomicReferenceArray クラスにおけ … · Oracle Java 標準ライブラリ AtomicReferenceArray クラスにおける デシリアライズに関する脆弱性

APPGALLERY COBOL COBOL85 MIOS7 DataStage EUR … · 目次 APPGALLERY COBOL COBOL85 MIOS7 互換ライブラリ、 ビジネス用ライブラリ DataStage EUR Groupmax Hitachi Advanced

JRE標準ライブラリの脆弱性事例を理解する (AtomicReferenceArrayクラス と Type Confusion)

サイボウズ デヂエ ライブラリ構築マニュアル...ホーム > マニュアル > ライブラリ構築マニュアル > ライブラリ・フォルダの作成 > ライブラリの作成

サーバー製品 テープオートローダー ライブラリ編 システム ......O VERVIEW テープオートローダー・ライブラリ 3 構成手順 1．ホスト接続

C++11概要ライブラリ編

EDIF200を使用した標準デザイン・ライブラリのイ …¨いう名前で、testという名前のライブラリに保存されています。この回路図は、analoglibライブラリのSmartSpice

C++11 概要ライブラリ編

My ライブラリ」サービスのご案内 · 2018. 12. 14. · 「My ライブラリ」サービスのご案内～インターネット・メールサービス～「My ライブラリ」とは・・・

SDSoC ユーザーガイド : プラットフォームおよびライブラリ … · 2019-10-27 · SDSoC環境ユーザーガイドプラットフォームおよびライブラリ

「mbed 」 –––– NXP LPC マイコンを用いた高速 ... ライブラリの例オンラインで用意されているもの mbed ライブラリmbed ライブラリ(続き

サーバー製品テープオートローダーライブラリ編 …...O VERVIEW テープオートローダー・ライブラリ 3 構成手順 1．ホスト接続オプション選択

C++ SIMD クラス・ライブラリ - インテル: タブレット … C++ SIMD 命令クラス・ライブラリリファレンス・マニュアル第3 章 Ivec クラス用語の定義

Spartan-6 ライブラリガイド (HDL 用) - Xilinx...目次ザイリンクス商標および著作権情報 2 1:このマニュアルについて 13

サイボウズデヂエ 8 ライブラリ管理マニュアル › ... › pdf › manual_dz8_library.pdf目次ライブラリ管理マニュアル目次 8 ライブラリ管理マニュアル

MGC3030/3130 GestIC ライブラリインターフェイスユーザ …ww1.microchip.com/downloads/jp/DeviceDoc/40001718E_JP.pdfMGC3030/3130 GestIC®ライブラリインターフェイス

Oracle Java 標準ライブラリ AtomicReferenceArray クラスにおけ … · Oracle Java 標準ライブラリ AtomicReferenceArray クラスにおけるデシリアライズに関する脆弱性

APPGALLERY COBOL COBOL85 MIOS7 DataStage EUR … · 目次 APPGALLERY COBOL COBOL85 MIOS7 互換ライブラリ、ビジネス用ライブラリ DataStage EUR Groupmax Hitachi Advanced

JRE標準ライブラリの脆弱性事例を理解する (AtomicReferenceArrayクラスと Type Confusion)

サイボウズデヂエライブラリ構築マニュアル...ホーム > マニュアル > ライブラリ構築マニュアル > ライブラリ・フォルダの作成 > ライブラリの作成

サーバー製品テープオートローダーライブラリ編システム ......O VERVIEW テープオートローダー・ライブラリ 3 構成手順 1．ホスト接続