Панин А.Г. Точёная М.Н.
Несколько подходов к оптимизации алгоритма вейвлет-преобразования, реализованного на графическом процессоре
Reporter: Панин А.Г.
В данной работе описаны особенности реализации алгоритмов вейвлет-преобразований для платформы NVIDIA CUDA.
Архитектура CUDA обладает сложной структурой памяти, и для того, чтобы максимально использовать вычислительную мощность графического процессора, необходимо уделить пристальное внимание оптимизации работы с памятью.
В статье описаны несколько различных способов работы с памятью, приводится сравнение скорости работы. Так же из-за того, что для полноценной загрузки GPU нужны тысячи нитей, важным вопросом является разделение данных на подзадачи.Приводится зависимость скорости работы алгоритма от различных параметров при разделении данных. Ещё одной особенностью реализации, рассмотренной в статье, является оптимизация арифметических выражений.
Abstracts file: | Панин, Точёная - тезисы.doc |
Full text file: | Панин, Точёная_статья.pdf |
To reports list