1
. Электронный архив ЦБ РФ
Решение о создании Центрального электронного архива ЦБ РФ было принято в 2000 году. Сотрудники Главного Центра Информатизации (ГЦИ) ЦБ РФ разработали концепцию Центрального электронного архива и в качестве основы для его создания рассмотрели ряд программ российских и западных производителей. Летом 2000 года была выбрана система LanDocs, разработанная компанией ЛАНИТ.
Специалисты Банка России и ЛАНИТ начали работы с подготовки технического задания на адаптацию системы LanDocs в соответствии со спецификой деятельности архивных служб банка. На первом этапе сотрудники холдинга разработали специализированные компоненты, обеспечивающие автоматизацию базовых функций архива, и внедрил технологию поточного (массового) сканирования и распознавания текстов документов.
В декабре 2000 года система Центрального электронного архива была принята в промышленную эксплуатацию. База данных электронного архива функционирует под управлением СУБД Oracle. В течение 2001 года в соответствии с планом ЛАНИТ производил работы по расширению функциональности ПО, завершившиеся к декабрю 2001 года. В 2002 году компания ведет работы по созданию подсистемы автоматизированной передачи дел из системы автоматизации делопроизводства Центрального аппарата в электронный архив.
Долгосрочным планом было предусмотрено не только внедрение системы в Центральном архиве Банка России, но и ее тиражирование в территориальных учреждениях банка. Для этого специалисты ЛАНИТ обеспечили поддержку СУБД Microsoft SQL Server.
В связи с большим количеством территориальных учреждений тиражирование системы рассчитано на несколько лет. В сентябре 2002 года ГЦИ закупил первые лицензии. По словам начальника Управления систематизации документов Административного департамента ЦБ РФ Анатолия Викторовича Дуванова, «в результате осуществления проекта было улучшено информационное обслуживание руководства и работников подразделений Банка России, а также значительно снижен риск утраты бумажных документов архива благодаря использованию их электронных копий».
Система LanDocs, на базе которой создан электронный архив ЦБ РФ, предназначена для комплексной автоматизации процессов делопроизводства и ведения архива электронных документов в организациях различного масштаба и специализации. Продукты семейства LanDocs позволили включить в контур делопроизводственной деятельности ЦБ не только пользователей архива, объединенных в локальной вычислительной сети, но и территориально удаленных – обеспечивая доступ через INTERNET и через системы электронной почты.
В состав системы, обеспечивающей функционирование электронного архива ЦБ РФ, вошли следующие компоненты:
« Делопроизводство»
Базовая система автоматизации процессов делопроизводства и ведения архива электронных документов. Реализована в архитектуре “клиент-сервер” на базе промышленной СУБД и функционирует в локальной вычислительной сети персональных компьютеров с ОС Windows 95 / 98 / NT / 2000. Поставляется для работы с СУБД Oracle или Microsoft SQL Server. Снабжена документированным OLE-интерфейсом для встраивания сервиса управления документами LanDocs в Windows-приложения сторонних разработчиков;
«Сервер документов»
Серверное программное обеспечение для централизованного управления хранением документов (файлов документов) в электронном архиве. Взаимодействует с системой «LanDocs: Делопроизводство» и осуществляет поддержку операций чтения, поиска, записи, удаления, передачи файлов документов на долговременное хранение на специализированном сервере под управлением ОС Windows NT 4.0/2000;
«Сервер документов» обеспечивает возможность поиска слов и фраз в текстах документов с учетом правил морфологии русского языка;
«Сканирование и визуализация изображений»
Система сканирования бумажных документов и визуализации их электронных образов.Позволяет комфортно работать с электронными копиями бумажных документов, перемещаться на нужную страницу, выводить изображение в разных масштабах, рассматривать детали в режиме «увеличительного стекла», панорамировать, удалять с изображения пятна и многое другое.
«Интернет-доступ»
Специализированный WEB-сервер, обеспечивающий пользователям возможность доступа к информации системы автоматизации делопроизводства и корпоративному архиву электронных документов через сеть Internet, используя в качестве платформенно- независимого клиента стандартный Internet Browser (Microsoft Internet Explorer, Netscape Navigator);
«Почтовый сервер»
Специализированное серверное программное обеспечение, выполняющее роль шлюза к MAPI-совместимой системе электронной почты. Обеспечивает возможность рассылки сообщений, заданий и документов из системы LanDocs исполнителям, на рабочих местах которых не установлено клиентское ПО «Делопроизводство».
«Почтовый клиент»
Клиентское программное обеспечение, работающее в среде MS Exchange, MS Outlook, Lotus Notes. Обеспечивает пользователю возможность получать задания и документы из базы данных LanDocs и отчитываться об исполнении заданий, находясь в почтовом ящике MS Exchange, MS Outlook, Lotus Notes.
«Подсистема безопасности»
Подсистема безопасности LanDocs предназначена для защиты информации посредством электронной цифровой подписи и шифрования. Подсистема включает Сервер безопасности и клиентские части пользовательских приложений LanDocs. Сервер безопасности реализует функции Центра сертификации, который обеспечивает выпуск сертификатов открытых ключей на основе запросов пользователей и организацию оперативного доступа пользователей к базе данных сертификатов (формат сертификатов соответствует рекомендациям ITU-T X.509). Клиентская часть подсистемы позволяет пользователю подписывать своим личным ключом документы, сообщения и другие информационные объекты LanDocs, производить проверку подписей других пользователей. Конфиденциальные документы шифруются на индивидуальных ключах. События, связанные с использованием электронной цифровой подписи, шифрованием, генерацией ключей и выпуском сертификатов фиксируются в протоколах работы
подсистемы.
«Маршрутизация»
Программное обеспечение, расширяющее возможности «Делопроизводства» по управлению процессами обработки документов. Моделирование процессов движения документа производится удобным и наглядным образом - посредством построения графических карт. Карта определяет маршрут движения сообщения и документа и определяет условия перехода от одного этапа обработки к другому. Созданный таким образом маршрут используется для инициирования движения документа и последующего управления маршрутом его движения. Функции анализа позволяют получать статистические данные по фактическим параметрам деловых процессов.
Справочные подсистемы
Включают в себя корпоративные справочники типов файлов, типов документов, способов доставки, номенклатуры дел, корреспондентов, типов сообщений, типов делопроизводственных операций и другие.
Основываясь на приведенной информации об электронной системе LanDocs, использованной для создания электронного архива ЦБ РФ, и о некоторых особенностях этого архива, можно выделить следующие достоинства рассматриваемого электронного архива: |
Соответствие нормам отечественного делопроизводства: архив базируется на отечественных стандартах и нормах делопроизводства, практике организации учета документов и контроля действий исполнителей в государственных и негосударственных структурах;
Универсальность и функциональность: функциональность архива обеспечивает комплексную поддержку офисных деловых процессов, максимально используя накопленные навыки делопроизводственного персонала и сложившуюся инфраструктуру;
Прогрессивная архитектура: система архива может строиться в любой из трех давно и хорошо зарекомендовавших себя архитектур:
в двухзвенной архитектуре «клиент-сервер» на базе основных промышленных СУБД;
в трехзвенной архитектуре со специализированным WEB-сервером приложений, обеспечивающим возможность удаленного доступа к данным системы через сеть Internet или в среде корпоративной Intranet сети, используя в качестве универсального платформенно - независимого клиента стандартный Internet Browser;
на базе стандартного клиента электронной почты Microsoft Exchange или Lotus Notes.
На практике разумное комбинирование методов доступа к данным LanDocs дает возможность гибкого и экономичного конфигурирования лицензий в соответствии со спецификой делопроизводственной нагрузки на конкретных рабочих местах организации-заказчика;
Открытость: система архива предоставляет пользователям:
документированный OLE-интерфейс, который обеспечивает возможность встраивания сервисов управления документами в Windows-приложения, проектируемые внешними разработчиками;
поддержку промышленных стандартов, за счет которых она может быть интегрирована с внешними программными системами и специализированным оборудованием - системами электронной почты (интерфейс MAPI), системами электронной торговли (с использованием XML), сканерным оборудованием (интерфейс TWAIN), системой FineReader (для распознавания текстов сканированных документов).
Защищенность данных: реализованный в системе механизм управления разграничением полномочий пользователей реализован на трех уровнях (ОС, СУБД, программное обеспечение) и дает возможность:
обеспечить идентификацию/аутентификацию пользователя;
определить для каждого пользователя функциональные права - права на выполнение тех или иных функций системы (в частности на доступ к тем или иным журналам регистрации документов);
определить для каждого документа уровень конфиденциальности, а для каждого пользователя - права доступа к документам различного уровня конфиденциальности;
подтвердить правомочность действий пользователя с помощью механизма электронной подписи;
обеспечить необходимый уровень информационной защиты конфиденциальных документов путем их шифрования, а также шифрования всей информации, передающейся по открытым каналам связи, например, по электронной почте; шифрование производится с использованием сертифицированных криптографических средств;
протоколировать все действия пользователей в журналах аудита (в журнале регистрации входа и выхода из системы, журнале совершенных операций).
К недостаткам архива ЦБ РФ, созданного на базе системы LanDocs, можно отнести его относительно ограниченную целевую направленность (не предусмотрена возможность взаимодействия на международном уровне и, как следствие, работа с зарубежными партнерами/клиентами, что представляется весьма важным для банка уровня ЦБ) и чрезмерную насыщенность архивной системы многочисленными приложениями, некоторые из которых вполне могли бы быть унифицированы, что существенно облегчило бы процесс освоения и использования электронного архива.
2. Электронный архив Газпромбанка
Около года назад компания Cognitive Technologies объявила о завершении внедрения электронного архива финансовых и организационно-распорядительных документов в филиалах КБ «Газпромбанк» по России.
Поставленная руководством «Газпромбанка» перед компанией Cognitive Technologies задача выглядела следующим образом: создание автоматизированной системы, предназначенной для обработки и архивирования банковских документов операционного дня и закрытых договоров, организации безбумажного архива документов, повышения надежности хранения документов и создания эффективной технологии оперативной работы с архивом документов.
Следует заметить, что КБ «Газпромбанк» — один из крупнейших коммерческих банков России, занимающий 3-е место по размеру чистых активов и 5-е место по размеру собственного капитала.
По мере увеличения объемов обрабатываемой информации в филиалах и отделениях Газпромбанка возникла потребность в применении новейших информационных технологий ввода, хранения и обработки документов, а также в обеспечении информационной безопасности при работе с конфиденциальными документами. Учитывая положительный опыт и высокий эффект, полученный от реализации данных технологий в центральном офисе, а также с целью унификации ПО, применяемого для ведения электронного архива в филиалах, руководством КБ «Газпромбанк» было принято решение распространить методику создания электронных архивов, разработанную компанией Cognitive Technologies, на все филиалы и отделения банка.
Компанией Cognitive Technologies было предложено решение: создание электронного архива на основе технологий архивации, поиска и извлечения документов (Евфрат/400 для AS/400), оптического распознавания CuneiForm, обработки изображений документов, потокового ввода документов и ввода стандартных форм документов Cognitive Forms.
В первую очередь была выполнена унификация ПО банковских электронных систем. Целями унификации ПО в центральном офисе и филиалах банка являлись:
минимизация средств на поддержку ПО;
объединение электронных архивов в одну распределенную систему;
использование новейших информационных технологий на базе Интернет/интранет-технологий (удаленное администрирование).
Аппаратное обеспечение разрабатываемой архивной системы включало в себя:
Сканер: базовая конфигурация, односторонний, устройство подачи и позиционирования оригиналов: Kodak ImageLink 500s (A4/A3, ADF 500 листов, разрешение до 300 dpi, скорость сканирования /A4, 200 dpi/-70 dpm); Сервер: IBM AS/400 (ОС OS400, СУБД DB2/400); ПЭВМ на рабочих местах конечных пользователей: Pentium*100/16-32MB RAM3.
В качестве программного обеспечения были выбраны следующие программы:
ПО сканера: Kodak HV Capture 2.04; ЭА Евфрат/400 для IBM AS/400; Евфрат/400 – Сервер; Евфрат/400 – Клиент; Евфрат/400 - Администратор Системы; Евфрат/400 - Администратор Безопасности; Система распознавания: CuneiForm; Система ввода стандартных форм документов: Cognitive Forms; Сетевая ОС: NetWare, Windows NT; Автоматизированная Банковская Система: Диасофт – Банк.
Компанией Cognitive Technologies была проделана большая работа по адаптации существовавшей версии центрального электронного архива «Газпромбанка» под цели данного проекта. Были выполнены:
создание инсталлятора архива для тиражирования в филиалах;
адаптация под сканеры компаний Kodak и Fujitsu;
добавление элемента удаленного администрирования из центрального офиса архивов в филиалах;
адаптация системы обеспечения информационной безопасности для хранения и обработки информации разной степени конфиденциальности;
добавление модуля для потенциальной связи архивов в единый архив.
Электронный архив финансовых и организационно-распорядительных документов «Газпромбанка» предназначен для сокращения затрат труда и времени при работе в системе документооборота. Он позволяет вести учет документов, хранить их представления (графические образы) в компьютерной форме, осуществлять быстрый поиск документов по реквизитам, показывать графические образы найденных документов и облегчать поиск оригинальных бумажных документов.
В случае «Газпромбанка» электронный архив органично дополняет архив оригинальных бумажных документов, поскольку эта организация, согласно своей стратегии, не отказывается от ведения полноценного «бумажного» варианта архива. В случае необходимости получить информацию о конкретном документе электронный архив помогает быстро увидеть его графический образ и указывает его реальное местонахождение. Программное обеспечение электронного архива реализовано в клиент-серверной архитектуре: рабочие места пользователей являются клиентскими приложениями, которые обращаются с запросами к серверным приложениям, выполняющимся на AS/400. Сервер AS/400 выступает в качестве файл-сервера (обслуживание массива образов документов) и в качестве сервера базы данных (обслуживание таблиц и индексов поисковой информации). Клиентское ПО выполняется в операционной системе Windows 9x/NT, серверное ПО — в операционной системе OS/400.
На каждом рабочем месте пользователя электронного архива «Газпромбанка» установлено программное обеспечение, соответствующее функциям данного пользователя:
рабочее место сканирования — программа сканирования (Kodak Capture Software для сканеров Kodak или «Агент сканирования» для остальных) позволяет пользователю ввести графические образы документов, которые помещаются в виде файлов на сервер AS/400 в эмулятор файловой системы (IFS);
рабочее место верификации и индексации — программа верификации позволяет установить соответствие между графическими образами документов и реестром документов, полученных из банковской программы. В результате формируются индексы документов (реквизиты), необходимые для последующего поиска документов. Индексы хранятся в базе данных на сервере AS/400;
рабочее место поиска — программа поиска позволяет обратиться к серверу с запросом на поиск документов, удовлетворяющих определенному признаку или набору признаков, а затем просмотреть перечень найденных документов и их графические образы;
рабочее место администратора системы — программа администратора позволяет задавать функции пользователей системы (принадлежность пользователя к конкретной группе) и их права на доступ к документам данного типа, а также просматривать перечень всех активных (зарегистрированных в системе в данный момент) пользователей. Кроме того, на компьютере администратора системы выполняется серверная компонента, обеспечивающая доступ всех пользователей к серверу AS/400;
рабочее место администратора безопасности — программа просмотра журнала позволяет проследить всю историю действий пользователей системы с целью выявления попыток несанкционированного доступа к документам.
В созданном электронном архиве, в силу его многопользовательской специфики и автоматизации, одновременно должна была храниться и обрабатываться информация разной степени конфиденциальности. Поэтому, для полного соответствия всем требованиям «Газпромбанка», специалистами Cognitive была разработана система обеспечения информационной безопасности, включающая:
Подсистему управления доступом;
Подсистему регистрации и учета;
Подсистему обеспечения целостности;
Реестр архивируемых за день документов, получаемых из АБС «Диасофт-Банк». За счет внедрения этой технологии, возможность изменения информации в обход системы безопасности была полностью исключена. При этом, каждому пользователю заранее определен объем информации, к которому он допущен.
Серверные компоненты программного обеспечения на AS/400 выполняют многочисленные функции обслуживания текущих запросов пользователей системы: работу с очередями, таблицами и индексами базы данных, файлами графических образов документов и журналом системы. Через эти компоненты реализуется механизм прав доступа пользователей к конкретной информации: если полномочия пользователя недостаточны, запрашиваемая информация не выдается.
В настоящее время рассмотренный электронный архив в полной мере введен в промышленную эксплуатацию в центральном отделении и филиалах «Газпромбанка». Пополнение архива осуществляется со скоростью до 5000 документов в день, архивируются банковские платежные, организационно-распорядительные и другие типы документов.
Возможно, в силу специфики документации, с которой ведется работы в «Газпромбанке», либо в связи с неполным соответствием возможностей аппаратного обеспечения потребностям программных компонентов системы электронного архива, нарекания пользователей вызывает быстродействие системы. Как следствие, периодически отмечаются трудности с доступом к архивным документам и с помещением в архив архивируемой информации. Тем не менее, в настоящее время специалисты компании Cognitive Technologies, используя гибкость архитектуры системы и заложенные изначально возможности совершенствования электронного архива как в плане ПО, так и в плане аппаратной составляющей, завершают модернизацию электронного архива «Газпромбанка» (по крайней мере, сообщение об этом появилось на официальном сайте компании).
3. Электронный архив НПО «Аврора»
В 2002 году НПО "Аврора" - крупнейший в России научно-производственный центр в области корабельной автоматики - успешно завершило внедрение электронного архива TeraSafe в систему корпоративного документооборота Documentum 4i.
По результатам тендера НПО «Аврора» выбрало три фирмы. Компания Documentum должна была поставить программное обеспечения для электронного архива, Xerox — системы ввода-вывода документации, «Эврика» — системы электронного архива.
Работы проводились специалистами компании "Эврика", которая разработала TeraSafe.
В течение последних нескольких лет "Аврора", обладающая собственным конструкторским бюро, а также рядом научных, инженерных и производственных подразделений, ведет работу по модернизации своей информационной инфраструктуры, и последним достижением стало внедрение электронного архива в уже существующую систему корпоративного документооборота.
В архиве НПО «Аврора» хранилось огромное количество бумажной документации — более 10 млн документов. Без специализированного инструмента поиск нужной информации в этом хранилище был чрезвычайно сложен и трудоемок. Кроме того, движение документации по цепочке разработка — согласование — утверждение — передача в архив занимало слишком много времени. С введением в эксплуатацию электронного архива отпадают многие рпоблемы.
Предприятию предстоит загрузить в электронный архив все электронные документы и ввести в него бумажные чертежи тех изделий, аналоги которых могут быть использованы в последующих разработках. Хранение электронных образов бумажных чертежей предполагалось осуществлять как в растровом, так и (по возможности) в векторном виде. В ближайшей перспективе электронный архив должен стать единым хранилищем для общесистемных, конструкторских, эксплуатационных, ремонтных, пусконаладочных, программных, договорных и прочих документов.
Разработку многоуровневых иерархических информационных моделей данных об изделиях предполагается осуществить в соответствии с требованиями стандартов семейства ISO 10303 (STEP). Следует заметить, что создание электронного архива - лишь начало серьезных изменений в информационной поддержке основных производственных процессов предприятия. Ближайший этап - автоматизация коллективной работы с технологическими документами в ходе реализации производственных проектов. В качестве инструмента для управления проектами будет использоваться Microsoft Project 2002. Одним из ключевых факторов выбора именно этого продукта стали его возможности интеграции с другими программными средствами.
Основой для архива стал комплекс TeraSafe, разработанный компанией «Эврика». TeraSafe обеспечивает поддержку электронного архива, доступ к информации, позволяет организовать хранилище данных и может быть интегрирован в любую систему конструкторского или корпоративного документооборота, то етсь полностью удовлетворяет потребностям НПО «Аврора». Комплекс TeraSafe интегрирован с системой документооборота Documentum 4i. В результате пользователям НПО «Аврора» обеспечивается доступ к архивным данным и возможность автоматизированного переноса информации из временного хранилища (жестких дисков сервера) на DVD-диски.
Фактически, TeraSafe в той версии, в которой он был поставлен для НПО «Аврора» – это аппаратно-программный комплекс, состоящий из DVD-чейнджера, используемого как устройство хранения данных и сервера, управляющего доступом к информации. EURECA TeraSafe Server позволяет надежно, долго и дешево хранить большие объемы данных любого формата, получать оперативный доступ к ним, эффективно вести поиск по базе, создавая произвольные, сколь угодно сложные запросы. Немаловажным достоинством данного устройства является простота администрирования.
Ядром электронного архива, созданного для НПО «Аврора», является управляющий сервер, который связан с чейнджером по SCSI-шине. Дисковое пространство сервера используется как:
область системного и специализированного ПО;
кэш-память для файлов, находящихся в работе;
временное хранилище архивных файлов. При добавлении нового файла в архив, он может быть временно записан в эту область, причем для пользователя он виден так же, как и файлы, хранящиеся в библиотеке. При накоплении достаточного объема новых файлов, они записываются на DVD (CD) болванку и добавляются в основной архив. Очевидно, что ПО службы каталога позволяет размещать файлы с одного физического диска в разные области виртуального каталога. Вместе с файлом могут быть записаны его атрибуты, вплоть до положения в виртуальном каталоге. Это гарантирует полное восстановление системы даже при потере всей информации на жестких дисках сервера
В соответствии с потребностями НПО, система на базе TeraSafe предоставляет возможность хранения больших и сверхбольших объемов данных. Как хранилище информации в TeraSafe Server используется роботизированная библиотека Pioneer. В конфигурации, которая установлена на НПО «Аврора», использована библиотека на 620 DVD с 6 читающими дисководами. Этот чейнджер создан по кассетному принципу, имеет 15 кассет, рассчитанных на 50 дисков или 2 дисковода каждая и дополнительную кассету на 20 дисков. В зависимости от решаемых задач, число дисков и дисководов может варьироваться. При использовании DVD-дисков емкостью 4.7 Gb TeraSafe Server вмещает до 2.85 Tb данных. В одном устройстве объединены 6 чейнджеров, что увеличивает суммарную емкость до 17.1 Tb.
DVD-библиотекой управляет двухпроцессорный сервер производства компании «Эврика». В рамках проекта эта компания также поставила заказчику станцию записи данных на DVD и две мощные графические станции для сотрудников архива.
Существенным плюсом архивной системы на НПО «Аврора» является дешевизна хранения данных. Вся информация базы данных хранится на CD или DVD, самых дешевых носителях на сегодняшний день. Стоимость хранения единицы информации на этих дисках, по меньшей мере, в 10 раз ниже, чем на традиционных жестких дисках.
Оперативность доступа к данным электронного архива обеспечивается тем, что управляющий сервер в EURECA TeraSafe используется не только как средство доступа к данным, но и как кэш-память для файлов базы, находящихся в работе. При запросе пользователя, робот библиотеки перемещает нужный диск в свободный дисковод, происходит считывание и параллельная запись запрошенного файла в кэш-область дискового пространства управляющего сервера. После этого дисковод освобождается и может быть использован для следующего запроса, а вся работа с файлом осуществляется с жестких дисков сервера. Однажды запрошенный файл остается в кэш-области сервера и время доступа к нему определяется долями секунды.
Сотрудниками НПО
Пользовательский интерфейс представляет хранимые файлы в виде иерархической структуры (виртуального каталога) неограниченной вложенности. Кроме того, каждый файл может иметь произвольный набор ключевых параметров, по которым осуществляется поиск и фильтрация.
По заверениям представителей фирмы-разработчика архива, гарантия сохранности данных максимальна. Основным хранилищем данных является DVD-ROM диски, удалить информацию с которых невозможно. Длительность хранения данных на CD и DVD-дисках, по данным компаний - производителей превышает 40-50 лет. Многие фирмы, например, авторитетная SONY, дают гарантию до 100 лет, что превышает длительность хранения данных на HDD в 10-20 раз.
Оценивая результативность введения электронного архива, следует отметить, что оно более чем в 10 раз сократило время поиска прототипов изделий и требуемой документации. Более чем вдвое уменьшилось время движения документации по цепочке от разработки до передачи в архив. При этом площадь, занимаемая архивом, также уменьшилась более чем в 10 раз.
«Электронный архив TeraSafe позволяет нам не только быстро получать необходимую информацию в рабочем формате, но и обеспечивает конструкторскую и технологическую устойчивость проектирования, возможность использовать базу накопленных знаний и разработок», — цитата из интервью Сергея Куликова, начальника конструкторского бюро НПО «Аврора».
Наиболее любопытным фактом является то, что в реализации проекта участвовало всего два человека, что говорит о крайней простоте внедрения архива с технологической точки зрения. Сейчас вводом информации в архив занимаются двое, адаптацией и настройкой ПО под требования предприятия — трое, вводом-выводом документации — один человек. Напрямую с электронным архивом работают 45 сотрудников НПО «Аврора».
4. Электронный архив Пенсионного фонда РФ
В 2001 году Пенсионным фондом России (ПФР) был проведен тендер на создание электронного архива документов персонифицированного учета. По его результатам победителем была объявлена компания Cognitive Technologies. Среди критериев, по которым производился выбор, рассматривался опыт работы с компанией, а так же опыт самой компании по внедрению подобного рода систем, причем второму омменту уделялось большее внимание.
Одним из основных назначений электронного архива в Пенсионном фонде является переход от большого количества скопившихся бумажных носителей к электронному представлению документов. Это позволяет обеспечить компактность и простоту хранения документов Пенсионного фонда, а также оперативность работы с ними. Особое внимание представители Пенсионного фонда уделили требованиям возможности использования электронной цифровой подписи для заверения вводимых в архив данных и электронных образов документов, что должно было позволить обеспечить идентичность хранящихся в электронном виде документов их бумажным носителям.
Специалистам Cognitive Technologies была поставлена задача создания архива с возможностью организации ввода больших объемов информации (около 30 млн. документов в год) в системе персонифицированного учета (СПУ) ПФ РФ для создания единой базы данных, содержащей сведения о всех работающих гражданах и осуществляющей учет их доходов. Основными типами вводимых документов в СПУ РФ ПФ являются стандартные бланки с рукописным заполнением, такие, как анкеты застрахованного лица; бланки "Индивидуальные сведения о стаже и заработке"; опись документов, содержащихся в пачках; другие документы СПУ.
В рамках проекта, помимо основного – центрального - архива, были созданы и находятся на стадии внедрения три варианта конфигурации архивов: "Район", "Межрайонный пункт" и "Регион". Архивы различных уровней будут интегрированы между собой.
Ввод документов в архив осуществляется с помощью сканера и системы ввода стандартных форм документов Cognitive Forms, причем система может работать с различными сканерами – от планшетных до потоковых промышленных с автоподатчиком. Количество сканеров, используемых в системе, не ограничено.
Электронный архив фирмы Cognitive Technologies для Пенсионного фонда включает в себя четыре связанные друг с другом основные подсистемы: подсистема ввода, подсистема архивации, подсистема безопасности, подсистема статистики и анализа. Электронный архив имеет возможность гибкого конфигурирования. Определенная независимость подсистем и их внутренняя архитектура позволяют варьировать как используемое оборудование, так и конфигурации подсистем.
В ходе разработки и внедрения архива специалисты фирмы столкнулись со следующей проблемой. Анализ всех организационных и технологических процессов показал, что крайне большие временные и материальные затраты связаны с ручным вводом информации в базу данных. Даже наличие 30-50 операторов не достаточно для ручного ввода информации в периоды пиковых нагрузок. Компанией Cognitive Technologies было предложено комплексное решение автоматизации ввода информации с документов СПУ, заполненных вручную, для ОПФР по г. Москве, основанное на технологии Cognitive Forms, включающее:
разработку машиночитаемых форм различных типов документов СПУ;
организацию потокового сканирования с использованием высокопроизводительного промышленного сканера;
автоматизированную сортировку входящих документов по типам;
автоматическую комплектацию многостраничных документов;
автоматическое распознавание;
средства визуального контроля и коррекции результатов распознавания;
экспорт данных, полученных в процессе распознавания, в Базу Данных ПФР;
автоматическое формирование статистической отчетности о результатах работы системы.
При создании электронного архива Пенсионного фонда было использовано следующее аппаратное обеспечение:
Сканеры Kodak ImageLink 9500 (паспортная производительность: 144 стр. А4/мин. или 8640 стр. А4/час); Станция сканирования: IBM PC Pentium*166/32MB RAM/1GB; Станция сортировки и комплектования отсканированных документов: IBM PC Pentium*166/64MB RAM/1GB; Станция распознавания: IBM PC Pentium*166/64MB RAM/1GB; Станция редактирования: IBM PC Pentium*166/16MB RAM/1GB; Файл сервер: IBM PC Pentium*166/64MB RAM/4GB; Сеть: Ethernet 10Mb/s; Сервер баз данных: IBM AS/400.
Программное обеспечение включило в себя:
ПО сканера: Kodak HV Capture 2.0; ПО создания описания форм: Cognitive FormDesigner; ПО станции распознавания: Cognitive FormReader (рукописное заполнение и отметки); ПО станции редактирования: Cognitive FormEditor; Сетевая операционная система: Novell 3.12; Операционная система на станциях сканирования, распознавания, редактирования: Windows 95; База данных: IBM DB2/400.
Система архива построена по принципу гибкой масштабируемости. В зависимости от конкретной ситуации, в систему могут быть добавлены (изъяты) технические средства, без изменения технологического процесса обработки информации. При увеличении нагрузок (количества обрабатываемых документов в день) к системе автоматически подключается необходимое количество станций распознавания (редактирования). В обычном режиме, для обработки нескольких тысяч документов в день, используется следующая комплектация технических средств:
1 станция сканирования,
1 станция сортировки и комплектования отсканированных документов,
1 станция распознавания,
20 станций редактирования,
1 файл-сервер.
Систему Cognitive Forms пришлось адаптировать к реальному качеству поступающих документов, т.к. анкеты печатались в разных типографиях и отличались размерами и качеством печати. Дополнительно было разработано следующее специализированное программное обеспечение: ПО диспетчеризации для равномерной загрузки всех доступных станций распознавания и редактированияж ПО статистического анализа результатов ввода; ПО сортировки входящих документов по типам и комплектации многостраничных документов; ПО обработки пачек, отбракованных на этапе сортировки (ПО принятия решений, определяющее дальнейших ход пачек: пересканирование (в случае слипания бланков документов) или возврат пачек работодателю с указанием допущенной неточности (ошибки); ПО автоматического распознавания типа формы документа. Специалистами фирмы была произведена настройка общего технологического процесса для достижения максимальной производительности операторов и повышения показателей эргономики, были написаны конверторы в уникальные форматы базы данных ОПФР.
Представители ПФ РФ предъявляли особые требования к уровню защищенности информации, хранящейся в архиве, поэтому особое внимание было также уделено разработке мер информационной защиты архива.
Информационная безопасность архива обеспечивается за счет наличия в составе средств, обеспечивающих конфиденциальность работы с информацией. В многопользовательской автоматизированной системе одновременно хранится и обрабатывается информация разных уровней конфиденциальности. Информация в системе хранится в закодированном виде. Каждому пользователю заранее определен объем информации, к которому он допущен. Подсистема управления доступом строится на основе, так называемой трехмерной матрицы разграничения доступа. Для каждого пользователя системы определяются объекты (программы, данные, устройства) к которым он имеет доступ и полномочия (открытие, сохранение, копирование, просмотр и т.д.) доступа. Система обеспечивает:
осуществление идентификации и проверки подлинности субъектов доступа при входе в систему по идентификатору и паролю длиной не менее шести символов;
возможность пользователю самостоятельно изменять свой пароль, если это разрешено администратором безопасности;
возможность администратору безопасности изменить пароль пользователя;
хранение идентификаторов и паролей в Системе в неявном виде;
идентификацию и аутентификацию пользователя с клавиатуры;
управление уровнями конфиденциальности (не менее 5);
контроль доступа и аутентификацию субъектов к защищаемым ресурсам;
для каждого пользователя - право работы с определенных рабочих мест, согласно перечню; идентификация и аутентификация пользователя как с клавиатуры, так и с помощью технических средств, допустимых операционной системой, идентификация и аутентификация программ, томов, файлов, каталогов.
Целостность системы обеспечивается программно - аппаратными средствами. При инсталляции системы целостность программного продукта проверяется автоматически и сообщение о результатах проверок выводится на экран монитора. При загрузке обеспечивается целостность средств защиты информации от несанкционированного доступа, целостность программного обеспечения, целостность записей в базу данных. Ошибочные действия пользователей и обслуживающего персонала не нарушают работу средств защиты информации. Предусматривается возможность дублирования программно - аппаратного комплекса и оперативного перехода на резервные компоненты. Предусматривается также возможность дублирования средств защиты информации ведением двух копий и возможность периодического обновления этих средств с контролем их работоспособности.
Подсистема криптографической защиты обеспечивает целостность и конфиденциальность как хранимой, так и передаваемой информации. Осуществляется шифрование всей конфиденциальной информации, выводимой на внешние носители. При этом осуществляется автоматическое освобождение областей памяти, содержащих ранее незашифрованную информацию. Доступ субъектов к операциям шифрования и криптографическим ключам контролируется подсистемой управления доступом.
Анализируя результаты разработки и внедрения электронного архива в Пенсионном фонде РФ, можно прийти с следующим заключениям.
Был достигнут бесспорный прогресс в повышении эффективности деятельности предприятия. Система введена в круглосуточную эксплуатацию, что позволило выполнять работы по пополнению архива новыми документами и переводу старых бумажных документов в электронный вид без задержек. Чтобы оценить сравнительное повышение производительности труда, следует сказать, что до реализации проекта один оператор Пенсионного фонда был в состоянии обработать 100-120 бумажных документов (1 страница А4) за 8 часовую смену. После внедрения электронного архива и сопутствующих систем обработки информации один оператор вводит и проверяет правильность ввода 500-600 документов в смену. Планируемый рост производительности ввода – до 800-1,000 документов в смену. Фактически, производительность ввода возросла в 4-5 раз для каждого оператора. За 4 первых месяца эксплуатации было введено 3 млн. анкет, что было бы невозможно старыми средствами.
За время эксплуатации электронного архива Cognitive Technologies не было отмечено существенных сбоев в работе системы; операторы и служащие ПФ, работающие с архивом, отмечают легкость освоения и обращения с программным обеспечением.
5. Электронный архив ФГУП «ЦНИИМинАтомИнформ»
В 2002 году руководство ФГУП «ЦНИИМинАтомИнформ» приняло решение о полном переводе архивов предприятия и систем документооборота в электронный вид.
ФГУП «ЦНИИМинАтоминформ» (далее в тексте – ФГУП) является головным научно-методическим центром по важнейшим направлениям управленческой, экономической и информационной деятельности МИНАТОМа России.
В качестве базы для создания электронного архива была выбрана система Search 5.0, разработанная НПП «Интермех».
Летом 2002 года было проведено сканирование регистрационных и информационных карт отраслевых НИОКР, выполненных на предприятиях атомной промышленности с 1970 по 1995 гг. В течение 10 дней было переведено в электронный вид около 78 тысяч карт. Это позволило начать упорядочивание всего фонда документации, провести ревизию информационного ресурса.
Электронный архив, разработанный для ФГУП, предусматривает решение следующих задач:
хранение документов различных типов; управление доступом к документам; быстрый поиск документов и документов-прототипов; согласование-утверждение документов; проведение изменений документов и управление версиями документов; поддержка групповой работы над проектами.
Архив ФГУП представляет собой базу данных, в которой хранятся документы и информация, необходимая для их идентификации и поиска — обозначение, наименование, формат и т. д.
Архив построен в архитекутре клиент-сервер, в которой в качестве сервера базы данных архива может использоваться одна из СУБД – Interbase фирмы Borland или всем известный Oracle. Обе СУБД имеют версии своих SQL-серверов, работающие на разных аппаратных и операционных платформах, поэтому, в зависимости от выбранной версии СУБД, серверная часть архива может работать на разных платформах - Windows 95 & NT, Novell Netware, UNIX, SUN и др. Клиентская часть архива работает в ОС Windows 95, Windows 98 или NT 4.0 или более поздних версий. В настоящее время серверная и клиентская части электронного архива ФГУП работает под управлением Windows 95.
Для группирования документов по их статусу (утвержден/не утвержден), типу (конструкторские/технологические) и другим признакам, компоненты системы Search 5.0 обеспечивает гибкую модель архива, состоящего из нескольких архивов, определяемых администратором системы, например — архив ОГК, архив ОГТ, рабочий архив сектора и т. д. Для каждого из архивов администратором системы определяются права доступа пользователей к документам этого архива, набор параметров документов архива, набор необходимых подписей, которые документ должен получить для того, чтобы попасть в архив и т. д. Search 5.0 позволяет хранить в архиве любые типы документов — чертежи, спецификации, текстовые документы и т. д. Для каждого типа документов можно назначить программы просмотра и редактирования. Поддерживаются документы, состоящие из нескольких файлов (например, чертежи на нескольких листах, гибридные чертежи TIFF + DWG и др.), а также документы, включающие в себя ссылки на другие документы (например, XREF в AutoCAD и т. д.). Можно регистрировать в архиве информацию о документах, выполненных на бумажных носителях.
Для хранения архивных данных в электронном архиве ФГУП используются так называемые электронные шкафы с документами — сегменты базы данных архива, куда система архивирования помещает упакованные (сжатые в 5-10 раз) файлы архивируемых документов. По мере роста количества документов в архиве и постоянно растущих потребностях в дисковой памяти, администратор системы имеет возможность создавать новые шкафы документов как на файл-сервере, на котором установлена система, так и на любом другом файл-сервере в локальной сети предприятия. Хранение документов в электронных шкафах исключает возможность получения доступа к документам в обход системы. Специальный модуль маршрутизации документов, входящий в систему, обеспечивает различные функции, необходимые при групповой работе над проектом — выдача рабочих заданий и контроль их исполнения, пересылка документов и рабочих запросов одним пользователем другому, рассылка сообщений и уведомлений. Архив ФГУП обеспечивает проведение изменений утвержденных документов с выпуском извещения об изменении (ИИ), утверждением данного ИИ со сбором необходимых подписей и с сохранением старых (до изменения или аннулированных) версий документов. Обеспечивается удаленный доступ к архиву из Web-браузеров (Internet Explorer, Netscape Navigator и др.) из любой ОС (Windows, UNIX, MacOS, Linux, OS/2 и др.). Система Search 5.0 понимает внутренний формат файлов чертежей системы AutoCAD и позволяет автоматически считывать информацию из основной надписи чертежей (обозначение, наименование и т. д.) непосредственно из файлов DWG и записывать эту информацию в архив, избавляя от ручного ввода такой информации при регистрации чертежей в архиве. Вместе с возможностью пакетной регистрации чертежей это обеспечивает быстрое первоначальное наполнение архива уже имеющимися чертежами сразу после установки системы.
В архиве ФГУП реализована функция проведения изменений в принятых документах.
Изменения в утвержденных документах производится на основании извещений об изменениях (ИИ). В состав системы входит специализированный редактор извещений об изменениях, позволяющий оформлять извещения в полном соответствии с требованиями ЕСКД. Search 5.0 позволяет проводить изменения в бумажных копиях документов различными способами - как заменой (перевыпуском) документов, так и традиционными способами (подчисткой, зачеркиванием и т.д.). Электронная же версия документа всегда соответствует последней его редакции и после утверждения извещения становится актуальной, что весьма важно для такого большого предприятия, как ФГУП.
Для просмотра истории изменений в документе Searchсохраняет его предыдущие версии в архиве и ведет список версий. Кроме ИИ, архив позволяет выпускать также предварительные извещения (ПИ) и предложения об изменении (ПР). Извещения могут выпускаться как на один, так и на несколько документов.
Редактор извещений позволяет вставлять в извещение графические и текстовые фрагменты из документов, выполненных при помощи любых редакторов, поддерживающих OLE (чертежи АвтоКАДа, документы MS Word, Excel и т.д.).
Аппаратная часть электронного архива ФГУП предоставляется корпорацией NSM Storage — модульная серия Элар НСМ x000. Емкость архива весьма крайне велика за счет использовании двухсторонних DVD-дисков и устройства для переворачивания дисков. Каждая из библиотек Элар НСМ совместима с другими моделями CD/DVD-библиотек этого же модульного ряда и содержит одинаковые основные элементы (приводы, роботику, CD-магазины), что расширяет возможности по модернизации/развитию архива. Вмещая от 135 (в Элар НСМ 2000) до 620 (в Элар НСМ 6000) CD- или DVD-носителей и от 1 до 14 (в Элар НСМ 6000) считывающих или записывающих приводов, библиотеки обеспечивают электронному архиву ФГУП емкость от 0,6 ТБ (Элар НСМ 2000) до 6 ТБ (Элар НСМ 6000) данных. В библиотеках использованы следующие технологии:
легкосъемные магазины «hot-swap» для адаптации емкости и конфигурации устройства к специфике задачи конкретного заказчика;
memory track, позволяющая системе записывать и считывать информацию о содержимом магазина; перемещение дисков «no-touch», исключающая контакт с поверхностью диска в накопителе;
модуль переворота дисков (флиппер). В большинстве накопителей распознавание диска начинается только после его «раскрутки» в приводе (так называемый «spin up»). В Элар НСМ, благодаря технологии быстрого распознавания дисков Turbo TDD, распознавание диска начинается сразу после установки диска в привод, что сокращает время доступа к диску в приводе до 120 мс, а среднее время замены диска (представляющее собой сумму из времени доставки диска из слотового магазина накопителя (от 2 до 4 с) и смены диска непосредственно в самом приводе (2,5 с)) составляет в среднем порядка 5 секунд. Объем памяти устройств может быть практически неограниченно расширен виртуально.
Информация хранится на CD/DVD в самой библиотеке, а на жестком диске или сервере хранятся только заголовки файлов, расположенных на CD/DVD. Когда происходит запись на однократно записываемый носитель, — зависит от применяемого ПО. В принципе, каждое ПО имеет свой планировщик заданий на изготовление CD-R или DVD-носителя. На жестком диске компьютера формируется образ CD или DVD, который при заполнении переносится посредством записи на записывающем приводе в CD/DVD-библиотеку. По времени это может происходить так, как будет спланировано в ПО, прилагаемом к библиотеке (сразу, в фоновом режиме, ночью и пр.).
В качестве программного решения для электронного архива ФГУП используется ПО OTG ArchiveXtender с поддержкой чтения и записи на CD/DVD-носители. Все содержимое хранилища доступно клиентским станциям и приложениям, как единый сетевой том. Система поддерживает множественные форматы файлов — ISO9660, Rockridge, Apple HFS, UDF и смешанные конфигурации носителей — CD-R, CD-ROM, DVD-R, DVD-ROM, DVD-RAM.
По всей видимости, вариант электронного архива, реализованный на ФГУП «ЦНИИМинАтомИнформ», является наиболее совершенным из всех рассмотренных примеров.
Из опубликованной информации фактически следует, он обеспечивает возможности, предоставляемые обычно тремя классами систем - собственно систем управления документами (в западной терминологии TDM - Technical Data Management), систем управления данными об изделиях (PDM - Product Data Management) и систем маршрутизации документов и заданий (Workflow).
Также, архитектурой архива предусмотрена возможность построения многоуровневой иерархической системы «подархивов» предприятия, соответствующей его организационной структуре и сложившемуся документообороту.
Однако, по сравнению с остальными рассмотренными примерами, электронный архив ФГУП явно требует от пользователя большей квалификации и навыков в работе с подобными системами.
Заключение
Построение электронного архива любого предприятия сугубо индивидуально. Каждая организация уникальна и требует учета специфики работы, степени ее автоматизации, имеющегося парка технических средств, квалификации специалистов и, наконец, платежеспособности.
Инженерно-технические трудности внедрения технологии электронного архивирования заключаются в решении двух крупных задач: наполнение электронного архива (в настоящее время это, как правило, перевод скопившейся за предшествующие десятилетия «бумажной» документации) и обеспечение эффективного поиска.
Первая захватывает ряд инженерно-технических проблем, решение которых может потребовать существенных временных затрат. Этим обусловлена важность эффективной организации процесса разработки, включающей оптимальное планирование процессов, анализ и синтез наработанных технологий, создание системы управления качеством и др. Негибкость экономической деятельности в большинстве госструктур определяет ограничения на поэтапность и наращиваемость государственных электронных архивов. Это повышает требования к системному и детальному проектированию, созданию опытного образца, организации испытаний и тестирования. При этом систему нельзя считать законченной, пока не будет введен основной накопленный объем документов.
Несмотря на то, что массовый ввод - важнейшая и наиболее трудоемкая задача в создании электронного архива, - он не является самоцелью. Целевая задача - обеспечение эффективного доступа к имеющимся данным с применением интеллектуальных средств. На этом этапе наиболее актуальными являются вопросы оптимизации запросов по критерию скорости выполнения. Здесь все зависит от технических параметров системы и, как следствие, от финансовых возможностей предприятия, для которого архив создается.
Учитывая определенные затраты на создание системы, можно выделить основные достоинства электронного архива.
Во-первых, повышение полноты и оперативности отработки запросов к архиву. Особенно это эффективно при выполнении нестандартного нерегламентированного запроса. Ответ, которого раньше ждали месяцами, причем без всякой уверенности, что он окажется положительным, теперь можно получить за секунды и в совершенно ином качестве.
Во-вторых, компактность и надежность хранения. Можно отказаться от дорогостоящих хранилищ документов, сокращать издержки и занимаемые площади. Сужение круга допущенных лиц, контроль и учет доступа к системе позволит повысить не только сохранность, но и безопасность конфиденциальной информации. Хранение документов в электронном виде приводит к тому, что ряд архивных функций, таких как ксерокопирование, микрофильмирование, ведение автоматизированных картотек, будут сокращены за ненадобностью.
В-третьих, создается возможность проведения оперативного анализа имеющейся информации, что, повысит обоснованность решений, принимаемых высшим и средним звеньями руководителей, которые полагаются пока только на свой опыт и интуицию.
К сожалению, весьма затруднительно провести подробный и объективный анализ внедрения электронных архивов в России в частности и в мире вообще, поскольку информация такого рода предприятиями-владельцами архивов публикуется крайне скупо, тогда как компании, разрабатывающие и внедряющие электронные архивы, по вполне понятным причинам избегают просачивания в прессу негативных отзывов о своей продукции. Из пяти примеров, рассмотренных в данной работе, наиболее совершенным, хотя и наиболее сложным технически, представляется электронный архив на базе системы Search 5.0, функционирующий в ФГУП «ЦНИИМинАтомИнформ».