Задача | Кто делает |
---|---|
Прояснение алгоритма sunset: http://www.graphicon.ru/1999/Short_Papers_Sketches_Posters/Abrosimov_Zelenogorsky_ Kryukov.pdf, http://oceanworld.tamu.edu/resources/ocng_textbook/chapter16/chapter16_04.htm, Таблица для разного , Еще о Московитцском спектре | kuv, bea, dumb |
Сравнение оптимизации тригонометрии ipp и mkl | zps |
Замена найденных алгоритмов реализациями из mkl | zps |
Поиск подсказок по оптимизации со стороны vtune | bea, kvm |
Переводы координат | kel |
Преобразование Фурье | kuv, kel |
Профилирование программ собранных icc | kvm, dumb |
Ускорение тестовых примеров неравномерное: в cfg1 мы догнали intel, но cfg2 и особенно 3 значительно отстают | dumb, требуется помощь |
Решенные задачи
Задача | Решение |
---|---|
SEGFAULT ipp/gcc -fopenmp | убрать из линковки -lguide: segfault там, внутри вызова omp_set_dynamic() |
Странные результаты icc -openmp -axT | во-первых -axT слишком круто (: заменил на -xP; во-вторых, #pragma omp parallel for ordered – это явный глюк: ни одной секции ordered внутри цикла нет; убрал ordered; скорость возрасла, результат не ухудшился. gcc с этим справился сам, однако… |