Общие сведения
Язык форматирования (язык манипулирования данными) представляет собой средство, с помощью которого осуществляется разнообразное представление данных для многих операций и режимов системы, в частности, для показа и печати документов, для создания словарей, для импорта/экспорта данных, для формально-логического контроля и т.д.
Язык форматирования системы ИРБИС базируется на языке форматирования системы CDS/ISIS (ЮНЕСКО).
Язык форматирования включает в себя набор команд и функций. Совокупность команд и функций, записанных в соответствии с требованиями данного языка, называется форматом. В общем случае формат определяет некоторое подмножество данных из записи базы данных, которые затем могут использоваться системой для выполнения определенных функций.
Для понимания языка форматирования необходимо быть знакомым с такими понятиями как:
поле данных - структурная единица документа (записи), имеющая числовую идентификацию (метку поля) и содержащая один элемент описания (например, первый индивидуальный автор, основное заглавие и т.д.):
подполе - структурная единица поля, которая определяется двумя символами, предшествующими собственно данным подполя: первый из этих символов знак ^, второй символ может быть латинской буквой (прописные и строчные не различаются) или цифрой и называется разделителем подполя.
Для новичков может показаться, что некоторые форматы являются очень сложными для понимания. Однако, все форматы, даже громоздкие, состоят по сути из довольно простых команд или функций, разделенных запятыми или пробелами. Кажущаяся сложность связана с тем, что формат может состоять из многих таких команд. В связи с эти, ключом к пониманию форматов является последовательный анализ всех присутствующих в них команд.
Обрабатывая формат, система работает с тремя объектами: запись базы данных, собственно формат и рабочая область, в которой размещаются выходные данные. Команды выполняются последовательно в порядке их представления в формате. Одни из команд порождают выходные данные (например, значения полей данных), другие - инициируют некоторые действия (например, переход на другую строку, создание нескольких пустых строк и т.д.).
Таблица выбора полей (ТВП) определяет критерий выбора одного или более элементов из записей базы данных. В зависимости от конкретного использования ТВП создаваемые элементы могут затем использоваться либо для создания терминов инвертированного файла (словаря), либо для переформатирования записей во время операций импорта/экспорта или копирования.
Таблица выбора полей как отдельная структура сохраняется в текстовом файле с расширением FST.
Примеры ТВП смотри в директориях БД системы ИРБИС.
ТВП состоит из набора строк, каждая из которых содержит следующие три параметра, разделенные знаком пробел:
1. идентификатор поля (ИП);
2. метод индексирования (МИ);
3. формат выборки данных, представленный на языке форматирования системы (см. Приложение 4).
Когда появляется необходимость в выборке элементов с использованием ТВП, система производит чтение требуемых записей файла документов и выполняет следующие действия по каждой записи и каждой строке ТВП:
1. отрабатывает формат выборки применительно к текущему документу;
2. к данным, извлеченным форматом, применяет указанный метод индексирования (об этом см. ниже);
3. присваивает каждому созданному таким образом элементу соответствующий идентификатор поля.
Этот процесс является чисто механическим и подразумевает только то, что описано в этих трех пунктах. Шаги связаны только лишь данными, которые создаются при их выполнении. Например, тот факт, что на шаге 1 произошла выборка данных из конкретного поля, является несущественным на шаге 2. На шаге 1 могут использоваться все возможности языка форматирования для создания строки символов, которая затем поступает в распоряжение шага 2. На шаге 2 поступившие строки символов обрабатываются в соответствии с указанным методом индексирования. Методы индексирования представляют собой некоторый процесс, определяемый на строках символов, а не на записях или полях. Именно благодаря такому универсальному пониманию сути ТВП, предоставляется возможность использовать их для таких, на первый взгляд совершенно независимых целей, как определение содержимого инвертированного файла и способ преобразования данных при импорте документов.
В самом общем смысле ТВП может восприниматься как некоторый механизм порождения элементов данных на основе имеющихся в документе с целью последующего выполнения некоторой определенной задачи.
Пакетная корректировка выполняет единовременную корректировку группы записей базы данных. Корректировка выполняется на уровне записи, полей и подполей. Можно задать следующие виды корректировки записи:
§
изменить значение поля или подполя;
§ заменить целиком поле или подполе;
§ добавить в запись поле или подполе в поле;
§ удалить поле или подполе;
§ удалить запись;
§ создать новую запись в указанной базе данных и перейти к ее наполнению;
§ задать MFN записей в указанной базе данных и перейти к их корректировке.
Для выполнения корректировки необходимо создать файл задания, в котором задаются операторы корректировки и в каждом операторе необходимые данные: обозначение поля или подполя, повторение поля, форматы, определяющие способ корректировки.
Экранные формы, используемые для ввода данных (плоскость ВВОД АРМа "Каталогизатор") - рабочие листы (РЛ), - делятся на два вида:
РЛ полей - служат для ввода полей данных, составляющих один документ;
РЛ подполей - служат для ввода подполей данных, составляющих одно поле документа.
Для формирования новых экранных форм ввода и/или корректировки уже имеющихся, а также для создания/корректировки неиерархических справочников пользователю предоставляется специальный редактор, который запускается из АРМа "Администратор". Его интерфейс представлен на рис. 1.
Рис.1.
Редактор РЛ и справочников
Меню Файл содержит режимы, которые позволяют:
· Открыть файл описания полей - загрузить список и описание всех полей БД, который будет использоваться при создании/корректировке РЛ полей (по умолчанию это файл DEFAULT.WS в директории БД);
· Новый - приступить к созданию новой формы ввода или справочника;
· Открыть
- загрузить для корректировки готовую форму ввода или справочник;
· Сохранить
- сохранить откорректированную форму ввода или справочник;
· Сохранить как… - сохранить под другим именем созданную/откорректированную форму ввода или справочник.
Интерфейс содержит три закладки РЛ полей, РЛ подполей и Справочник, предназначенные соответственно для создания/корректировки РЛ и справочников.
РЛ полей сохраняются в файле с расширением WS. РЛ подполей сохраняются в файле с расширением WSS. Справочники сохраняются в файле с расширением MNU.
Табличными формами называются специальные выходные формы - указатели и собственно таблицы, - которые формируются в АРМе "Каталогизатор" в режиме ПЕЧАТЬ - ТАБЛИЦЫ (на плоскости ПРОСМОТР/ВЫВОД).
Для формирования собственных табличных форм (отсутствующих или отличающихся от тех, что включены в стандартный набор системы ИРБИС) пользователю предлагается специальный генератор, который запускается из АРМа "Администратор", - его интерфейс представлен на рис. 1.
Для полноценной работы с данным инструментом желательно, чтобы пользователь знал язык форматирования, описанный в Приложении 4.
Рис. 1. Интерфейс генератора выходных табличных форм