Рейтинг
Порталус

ИЩИ, ЭВМ!

Дата публикации: 23 октября 2012
Автор(ы): В. КОРНЕЕВ
Публикатор: Научная библиотека Порталус
Рубрика: ИНТЕРЕСНО ОБО ВСЁМ
Источник: (c) http://portalus.ru
Номер публикации: №1350976680


В. КОРНЕЕВ, (c)

Как облегчить поиск нужных документов в безбрежном архивном "море"? За это непростое дело взялась Автоматизированная информационно-поисковая система (АИПС), разработанная в Научно-исследовательском центре технической документации Главархива СССР.

...Колода перфокарт с запросами вложена в специальное устройство. И вот уже начался диалог "человек - машина". Причем первым спрашивает компьютер:

- Какую программу вызвать?

- Программу ретроспективного поиска информации.

- Каков носитель?

- Перфокарты.

- Нужен ли формально-логический контроль?

- Да.

- На скольких лентах записана база данных?

- На одной.

...После такого дотошного, но короткого опроса начинается поиск. Стремительно крутятся бобины с магнитной лентой - машина ищет... Ищи-ищи! Вот, кажется, нашла... "Куда вывести результаты?" - спрашивает.

- На алфавитно-цифровое печатающее устройство принтер hp photosmart premium, - решает нажатием клавишей кандидат технических наук А. С. Шапошников. И мы спешим туда, где начинает сходить с барабанов полоса перфорированной бумаги с отпечатанными результатами поиска...

У нас было всего два запроса (здесь их, кстати, можно одновременно "прогонять" почти 50). Заведующего сектором центра Шапошникова и корреспондента интересовали описания архивных документов, имеющих отношение к замечательному архитектору прошлого Матвею Казакову и к зданию Сената в Кремле. В памяти компьютера оказалось 9 описаний, упоминавших Казакова, 22 - Сенат, 386 (!) - Кремль, а вот на Сенат и Кремль, вместе взятые, их пришлось только 7... Зато каждое сообщало точный адрес хранения нужного документа: архив, фонд, опись, дело, лист.

- В рамках нашей автоматизированной системы тематический комплекс "Памятники архитектуры и градостроительства" охватывает пока лишь 15 тысяч документов, - говорит Шапошников. - Ориентировочный же его объем-110 тысяч. Достигнем его - и поиск ЭВМ будет намного удачливей.

- Интересно, а как начиналась АИПС?

- Прежде всего замечу, что Государственный архивный фонд - это где-то 200 миллионов дел. Сами понимаете, что ввести целиком подобный информационный массив в систему автоматизированного поиска было просто нереально. Слишком цифра велика. Решили: выбирать узкие тематические комплексы документов, пользующихся повышенным спросом исследователей. Выяснили - те, что имеют отношение к архитектуре, наиболее популярны, их постоянно запрашивают в архивах. Также имело смысл вводить в систему сведения о документах, находящихся в разных архивах. (Если они, скажем, собраны в одном месте, то исследователь и без автоматизации их найдет - пусть даже год ему придется "копать"). Короче, выбрали тематику - "Памятники архитектуры и градостроительства", определили круг архивов-соисполнителей (тех, кто хранит документы, относящиеся к ней). Их оказалось шесть, расположенных в Москве и Ленинграде. Головным стал Центральный государственный исторический архив СССР. Так называемые предмашинные форматы (то, что должно вводиться в память ЭВМ), заполненные описаниями обнаруженных документов, проходят в ЦГИА СССР необходимый контроль- с точки зрения истории и археографии. Этот архив создает информационную базу комплекса. Наш же Сектор занимается его лингвистическим, математическим и техническим обеспечением.

- Поконкретней, пожалуйста...

- Ну, прежде всего мы разрабатываем информационно-поисковый язык - на основе лексики, содержащейся в описаниях архивных документов. Иными словами, у нас идет своеобразный перевод с естественного языка на язык формализованный, "понятный" ЭВМ. Для чего? Чтобы обеспечить полноту и точность поиска.

Миновав такой вот лексический фильтр, предмашинные форматы поступают на обработку в вычислительный центр, где с помощью оптического читающего устройства "переходят" с бумаги на магнитную ленту...

- И с этой информацией уже можно работать?

- Не торопитесь... Такую информацию, распечатанную на алфавитно-цифровом устройстве, еще внимательно вычитает целая группа наших корректоров. Найденные ошибки исправят на ЭВМ. Потом весь этот откорректированный информационный массив "загрузят" в память машины. Только тогда его можно считать полностью готовым к использованию.

- Какому?

- Можно вести тематический! поиск информации по запросам (вы это видели), а можно готовить - опять же автоматизированным методом - архивные справочники.

- Итак, пока в комплекс входят 15 тысяч описаний...

- Да. 15 тысяч описаний документов по истории памятников архитектуры и градостроительства Москвы, Ленинграда и их пригородов, относящихся к досоветскому периоду (начиная с XVII века). А со временем не только увеличится объем этого тематического комплекса, но и расширится его география.

Опубликовано на Порталусе 23 октября 2012 года

Новинки на Порталусе:

Сегодня в трендах top-5


Ваше мнение?



Искали что-то другое? Поиск по Порталусу:


О Порталусе Рейтинг Каталог Авторам Реклама