Международная конференция «Математические и информационные технологии, MIT-2011»
(IX конференция «Вычислительные и информационные технологии в науке,
технике и образовании»)
№ гос. регистрации 0321102644, ISBN 978-5-905569-02-9
Поляков А.Ю. Молдованова О.В. Карасев Б.И.Подходы к оптимизации контрольных точек восстановления параллельных программДокладчик: Поляков А.Ю.
Распределенные вычислительные системы (ВС) являются важнейшим инструментом решения сложных научных, инженерных и экономических задач. Такие системы являются большемасштабными, количество процессорных ядер в их составе варьируется от десятков до сотен тысяч, а число узлов ввода-вывода (УВВ) – от нескольких десятков до сотен. Физически несколько процессорных ядер обычно располагаются на вычислительном узле (ВУ). При построении большемасштабных ВС используются высоконадежные компоненты, однако время между частичными отказами в них составляет в среднем несколько дней. Это ставит под сомнение осуществимость решения трудоемких задач, представленных параллельными программами (ПП) с количеством ветвей, близким к числу ядер в ВС.
К списку докладов |