В работе обсуждаются вопросы основанной на правилах трансформации данных из произвольных электронных таблиц в реляционную форму. Определяется новая объектная модель произвольной таблицы и предметно-ориентированный язык правил анализа и интерпретации табличной структуры. Предлагается оригинальная система извлечения и трансформации данных электронных таблиц (TABBYXL). Экспериментальная оценка показывает высокую точность (от 93,7% до 100%) и полноту (от 93,9% до 99,8%) для восстановления различных функциональных единиц данных и их отношений на известном тестовом наборе 200 произвольных таблиц одного жанра (государственных статистических отчетов).
Abstracts: | abstracts_417647_ru.pdf |