Система автоматизации библиотек ИРБИС


Статистическая обработка данных


Режим предназначен для формирования статистических распределений документов БД по значениям различных элементов описания - в качестве таковых имеет смысл рассматривать те элементы описания, которые принимают значения из некоторого конечного списка (например: коды классификаторов, коды видов документов, коды стран, коды языков и т.п.).

Статистические распределения представляются в виде табличных форм, имеющих две графы: в первой указываются значения элемента описания, в другой - количество документов, содержащих данное значение. Данные статистических распределений могут быть использованы для содержательного анализа состава БД.

В качестве исходных для статистического анализа могут использоваться все документы БД, группа документов, определенных в виде диапазона внутренних номеров (MFN), документы, отобранные в результате поиска или отмеченные в процессе просмотра.

Следует помнить, что режим статистической обработки связан с текущим контекстом работы, т.е. с установленной подплоскостью: если установлена подплоскость БАЗА ДАННЫХ/ MFN, предполагается статобработка документов из установленной базы данных по номерам (MFN); если установлена подплоскость РЕЗУЛЬТАТ ПОИСКА, предполагается статобработка результатов поиска по текущему запросу. В частности, если, например, установлена подплоскость РЕЗУЛЬТАТ ПОИСКА и не выбран ни один из запросов (это может быть, когда не проводился ни один поиск) или выбран запрос с нулевым результатом поиска, то нажатие кнопки СТАТИСТИКА не дает никакого эффекта.

Информация о том, по каким элементам описания проводить статистический анализ, а также какие документы должны участвовать в обработке, указывается с помощью соответствующей формы, которая возникает после нажатия кнопки СТАТИСТИКА (см. рис. 3.3.4а).

В качестве исходных документов, подвергающихся статистической обработке, можно задать:  

ВСЕ - в этом случае статобработке будут подвергаться все документы в соответствии с контекстом работы: если установлена подплоскость БАЗА ДАННЫХ/MFN - все документы текущей базы данных; если подплоскость РЕЗУЛЬТАТ ПОИСКА - полностью результат поиска по текущему запросу;


ОТМЕЧЕННЫЕ - при этом статобработке будут подвергаться только документы, отмеченные на установленной подплоскости просмотра (имеет смысл только в случае, когда таковые имеются);

КРОМЕ ОТМЕЧЕННЫХ - статобработке будут подвергаться все документы текущего контекста за исключением отмеченных (при отсутствии отмеченных это равносильно значению ВСЕ);

ДИАПАЗОН MFN - статобработке будут подвергаться документы текущего контекста, попадающие в указанный диапазон внутренних номеров (MFN). Например, если установлена подплоскость РЕЗУЛЬТАТ ПОИСКА, берутся документы из результата поиска, чьи номера попадают в указанный диапазон. По умолчанию, если не указана ни нижняя, ни верхняя границы диапазона, понимается весь диапазон документов базы данных от первого до последнего. Если указана лишь одна из границ, вторая считается равной первой, т.е. рассматривается диапазон, содержащий один документ.



Рис. 3.3.4а.

Форма для ввода задания на статобработку

Параметры собственно статистической обработки указывается в таблице ЗАДАНИЕ НА СТАТ.ОБРАБОТКУ. Одно статистическое распределение определяется одной строкой данной таблицы. За один прогон режима может быть сформировано произвольное число статистических распределений. Новые строки таблицы образуются при щелчке мышью по колонке нумерации строк. Для задания каждого статистического распределения указываются четыре параметра (в соответствующих колонках таблицы):

ЭЛЕМЕНТ - параметр определяет элемент описания, по которому должно быть сформировано статистическое распределение. Задается с помощью ниспадающего меню. Состав данного меню, т.е. список возможных элементов описания для статистической обработки в БД Электронного каталога и других БД, определяется при установке системы в соответствии с требованиями пользователя;

ДЛИНА ЗНАЧЕНИЯ - параметр определяет максимальную длину (в символах) значений элемента описания. Значение по умолчанию - 10;

КОЛ-ВО ЗНАЧЕНИЙ - параметр определяет максимальное количество возможных значений элемента описания.Значение по умолчанию - 1000;

СОРТИРОВКА - параметр определяет способ сортировки статистического распределения. Возможны четыре значения: НЕТ – сортировка не производится; ПО ЗНАЧЕНИЮ - сортировка по значениям элемента описания; ПО КОЛИЧЕСТВУ (УБЫВАНИЕ) - сортировка по количеству документов в порядке убывания; ПО КОЛИЧЕСТВУ (ВОЗРАСТАНИЕ) - сортировка по количеству документов в порядке возрастания.

Результаты статобработки, т.е. таблицы статистических распределений, могут сохраняться в файле (параметр ВЫХОДНОЙ НОСИТЕЛЬ/ФАЙЛ) в формате RTF или непосредственно выводиться на печатающее устройство (параметр ВЫХОДНОЙ НОСИТЕЛЬ/БУМАГА).

Собственно процесс статобработки начинается после нажатия кнопки ВЫПОЛНИТЬ. Если в качестве выходного носителя выбран файл, система дополнительно предлагает стандартное диалоговое окно для указания пути и имени файла сохранения результатов статобработки.


Содержание раздела