Зоркальцев А.В. Давыдова А.В.
Последствия подмены вероятностей частотами при оценке энтропии
Докладчик: Зоркальцев А.В.
\documentclass[10pt]{article}
\usepackage{amsmath}
\usepackage{amsfonts,amssymb}
\usepackage{amsthm}
\usepackage[active]{srcltx}
\usepackage[utf8]{inputenc}
\usepackage[russian]{babel}
\usepackage[final]{graphicx}
\newenvironment{ltrtr}{
\vspace{0.5\baselineskip} \noindent {\footnotesize{СПИСОК ЛИТЕРАТУРЫ}} \vspace{-0.5\baselineskip}
\begin{enumerate}
\partopsep=0pt\topsep=0pt\itemsep=1pt\parsep=0pt\parskip=0pt}{\end{enumerate}}
\textwidth 13cm
\textheight 18cm
\topmargin 0mm
\oddsidemargin 5mm
\begin{document}
\setcounter{figure}{0} \setcounter{equation}{0}
\setcounter{table}{0} \setcounter{footnote}{0}
\begin{center}
\title{}{\bf ПОСЛЕДСТВИЯ ПОДМЕНЫ ВЕРОЯТНОСТЕЙ ЧАСТОТАМИ ПРИ ОЦЕНКАХ ЭНТРОПИИ
}
\author{}{Зоркальцев А. В., Давыдова А. В.}
{\it Новосибирский государственный университет, Новосибирск}
{\it avazork@mail.ru}
\end{center}
При расчетах статистических показателей, использующих вероятности событий, часто вместо точно не известных вероятностей используются данные о частотах реализации событий в располагаемых ограниченных выборках. В докладе излагается методика, алгоритмы и результаты анализа последствий от такой подмены применительно к расчету показателя энтропии Шеннона.
Базой для исследования отдельных ситуаций является многократная имитация методом Монте-Карло выборок заданного объема дискретных случайных событий. Для каждой выборки рассчитываются частоты появления каждого из рассматриваемых событий. Эти частоты используются в качестве оценок вероятности реализации событий, по которым рассчитывается показатель энтропии. В итоге получаем набор рассчитанных значений показателя энтропии. На основе этого набора вычисляются характеристики надежности оценок энтропии при замене исходных вероятностей реализации событий на частоты реализации событий в выборках заданного объема. В число этих характеристик входят (1) математическое ожидание оценок энтропии и его смещение относительно истинного значения; (2) среднеквадратическое отклонение оценок энтропии от истинного значения и от математического ожидания оценок энтропии; (3) вероятность попадания в заданный интервал (например, в 5\% или 10\% от истинного значения и от математического ожидания) оценок энтропии; (4) энтропия оценок энтропии.
В докладе представлены результаты исследований влияния на указанные показатели объемов выборки, числа событий и степени равномерности распределений вероятностей реализации событий. Одна из целей исследования состояла в определении минимально необходимого объема выборки (при оценках частот). Получаемые оценки смещения математического ожидания могут помочь скорректировать оценку энтропии.
Доклад является развитием исследований, отраженных в статье \cite{1}, где более подробно представлены составляющие излагаемой методики, вычислительные алгоритмы, возможные области применения и некоторые результаты.
\begin{ltrtr}
\bibitem{1}
{\it Зоркальцев В. И. , Зоркальцев А. В.} Погрешности в оценках энтропии из-за замены вероятностей событий на частоты в выборках // System Analysis & Mathematical Modeling – 2024 – Vol.6, №3 (в печати).
\bibitem{2}
{\it Соболь И.М.} Метод Монте-Карло (Популярные лекции по математики). –М.: Наука, 1968.- 64 с.
\bibitem{3}
{\it Шеннон К.} Работы по теории информации и кибернетике. – М.: Издательство иностранной литературы, 1973. – 830 с.
\end{ltrtr}
\end{document}
К списку докладов