English
Home
各種検索
研究業績検索
論文・著書検索
( 詳細検索 )
特許検索
( 詳細検索 )
研究ハイライト検索
( 詳細検索 )
研究者検索
組織・担当から絞り込む
サポート
よくあるご質問(FAQ)
T2R2登録申請
学位論文登録について
組織単位データ出力について
(学内限定)
サポート・問合せ
T2R2について
T2R2とは?
運用指針
リーフレット
本文ファイルの公開について
関連リンク
東京科学大学
東京科学大学STARサーチ
国立情報学研究所(学術機関リポジトリ構築連携支援事業)
Home
>
ヘルプ
論文・著書情報
タイトル
和文:
疎行列ベクトル積計算を対象とした GPU 向けメ モリアクセス削減手法
英文:
著者
和文:
長坂侑亮
,
額田彰
,
松岡聡
.
英文:
Yusuke Nagasaka
,
Akira Nukada
,
SATOSHI MATSUOKA
.
言語
Japanese
掲載誌/書名
和文:
英文:
情報処理学会研究報告
巻, 号, ページ
Vol. 2015-HPC-151 No. 8 pp. 1-7
出版年月
2015年9月23日
出版者
和文:
情報処理学会
英文:
会議名称
和文:
第151回ハイパフォーマンスコンピューティング研究発表会
英文:
開催地
和文:
英文:
沖縄
アブストラクト
科学技術計算において巨大で疎な問題行列を持つ連立一次方程式を解く際,疎行列ベクトル積計算が実行時間の大部分を占めている.疎行列ベクトル積計算の GPU 向けの高速化も数多く行われてきているものの,疎行列ベクトル積計算がメモリバウンドなカーネルであることや入力ベクトルへのランダムアクセスによって発生する局所性低下等が要因となって性能向上が妨げられている.我々は GPU での疎行列ベクトル積計算時のメモリアクセス量とアクセス頻度を効果的に削減する疎行列フォーマットである AMB(Adaptive Multi-level Blocking) フォーマットを提案する.16bit integer の利用と種々のブロッキング手法によって,列インデックスの圧縮を行い,メモリアクセス量の削減を図っている.Florida 大学の疎行列データセットから選出した 40 個の行列に対して,既存手法との比較を行い,cuSparse と比較して最大で 2.81 倍,平均で 1.77 倍の性能向上を果たし,また,近年提案された高速な疎行列ベクトル積ライブラリである yaSpMV と比較して最大で 1.38 倍,平均で 1.13 倍の性能向上を果たした.
©2007
Institute of Science Tokyo All rights reserved.