База данных (database) – это совокупность описаний объектов реального мира, определенным образом структурированных и связанных между собой, актуальных для конкретной прикладной области и представленных на машиночитаемых носителях в форме, пригодной для применения в информационных технологиях.
База данных — организованная в соответствии с определtнными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователей.
Организация данных в базе данных требует предварительного выбора и построения модели данных, назначение которой – систематизация информации и отражение ее свойств (по содержанию, структуре, объему, связям, динамике, источникам и т.д.).
База данных характеризуется следующими отличительными признаками:
- База данных хранится и обрабатывается в вычислительной системе. Таким образом, любые внекомпьютерные хранилища информации (архивы, библиотеки, картотеки и т.п.) базами данных не являются.
- Данные в базе данных логически структурированы (систематизированы) с целью обеспечения возможности их эффективного поиска и обработки в вычислительной системе. Структурированность подразумевает явное выделение составных частей (элементов), связей между ними, а также типизацию элементов и связей, при которой с типом элемента (связи) соотносится определенная семантика и допустимые операции.
- База данных включает схему, или метаданные, описывающие логическую структуру базы данных в формальном виде (в соответствии с некоторой метамоделью). В частности, постоянные данные в среде базы данных включают в себя схему и базу данных. Схема включает в себя описания содержания, структуры и ограничений целостности, используемые для создания и поддержки базы данных. База данных включает в себя набор постоянных данных, определенных с помощью схемы. Система управления данными использует определения данных в схеме для обеспечения доступа и управления доступом к данным в базе данных.
Базы данных неразрывно связаны со всеми информационными ресурсами общества, создаются на их основе, а многие из них и могут использоваться только вместе с документальными источниками информации. Информационные ресурсы рассматриваются как важная часть национальных ресурсов, а проблемы их развития – как часть общих проблем информатизации общества. Построение такой модели осуществляется в несколько этапов с последовательным приближением к оптимальному варианту, который наиболее адекватно отражает моделируемую предметную область.
Для создания базы данных в первую очередь определяют интересующие объекты (например, поставщики, потребители, предприятия, работники и др.), а затем выделяют для каждого объекта набор характеризующих его свойств – минимально возможную смысловую единицу («реквизит»). Например, свойствами предприятия могут быть: его название, адрес, расчетный счет в банке, тип выпускаемой продукции и т.п.
Объекты реального мира, сведения о которых хранятся в базе данных, называют «сущностями», а их актуальные признаки – «атрибутами». Вопрос об информационном содержании базы данных решается не только путем определения предметной области, но и с учетом интенсивности работы с различными видами информации, их динамическими характеристиками, частотой корректировок, степенью их взаимосвязи.
Как правило, пользователь интересуется не всей информацией, содержащейся в базе данных, поэтому необходимо обеспечить ему возможность выделения отдельной части (подмодели, локальной модели). Структура организации данных в базе данных должна учитывать связи между различными видами данных и обеспечивать быстрый доступ к ним.
Существует три основных типа логической организации данных:
- иерархическая модель (имеет структуру в виде графа и выражает только вертикальные связи типа подчинения нижнего уровня верхнему);
- сетевая модель (представляется в виде графа общего вида, где присутствуют горизонтальные и обратные связи);
- реляционная модель (совокупность таблиц, называемых «отношениями», над которыми выполняются операции, формулируемые в терминах реляционной алгебры, для реализации автоматизированного ответа на запросы пользователей системы).
Наибольшее распространение в настоящее время имеют реляционные базы данных. Разновидность реляционной модели – постреляционная модель данных, позволяющая строить высокоэффективные информационные системы, обеспечивающие одновременный доступ к информации большому числу пользователей.
По виду данных выделяют базы данных:
- документографические (документальные) с подразделением их на библиографические и реферативные;
- фактографические;
- числовые;
- полнотекстовые;
- лексикографические;
- смешанные (гибридные).
По назначению содержащейся информации различают базы данных:
- деловой информации (социальная информация, кадастры, регистры, статистическая, коммерческая, финансовая, управленческая информация; данные о продукции и т.п.);
- информации для специалистов (научно-техническая, экономическая, маркетинговая, правоохранительная, исследовательская, производственная, конструкторская, технологическая информация и т.п.);
- массовой информации (правовая, библиотечно-библиографическая, архивная, учебная, справочная, общественно-политическая, словарно-энциклопедическая информация, информация о культуре, спорте, досуге и т.п.).
По способу доступа базы данных делят на:
- размещенные на хостузлах (доступные через вычислительные сети);
- тиражируемые в коммуникативных форматах;
- тиражируемые программными средствами (включая CD-ROM);
- локальные.
Стандартные формы баз данных дополняются сегодня мультимедийными документами, графическими образами, хронологическими рядами, процедурными или активными данными и прочими сложными информационными формами.
Источники для формирования баз данных – первичные документы: техническая документация, отчеты, формы статистической отчетности, специальные журналы, монографии, аналитические обзоры, информационные листки, материалы конференций, выставок, проспекты изданий и услуг и т.д. Все больше используются также вторичные источники информации: СМИ (статьи из газет и журналов, рефераты, лицензии, каталоги отечественных и зарубежных фирм, теле- и радиоинформация, рекламные объявления, адресные и специализированные справочники, регистрационные карточки, публикуемые балансы предприятий и банков, письма, анкеты, паспорта предприятий, статистические публикации, договора, прейскуранты и т.п.).
Важнейшие характеристики базы данных – тематический состав (база данных законодательной информации, информации о персоналиях, адресно-справочные, коммерческие информации и т.п.); полнота информационных ресурсов (охват различных тематических предметных областей (наличие пробелов) и полнота их отражения в оригинальных базах данных, а также мера удовлетворения соответствующих пользователей предлагаемыми формами и режимами предоставления информации).
БД должна отражать объекты реального мира однозначно и непротиворечиво (условие целостности базы данных– database integrity). Для поддержания информационной базы в рабочем состоянии применяют комплекс программных и языковых средств – систему управления базой данных (СУБД).
СУБД – это пакет программ, обеспечивающий ввод, хранение, корректировку, сохранность и перемещение данных, формирование ответов на запросы, связь с другими программными средствами. Совокупность одной или нескольких баз данных, справочника базы данных, СУБД, библиотеки запросов и прикладных программ называют банком данных (англ. databank).
Выбор управляющих программ определяется типом логической модели, имеющимися программными и техническими средствами. Основные критерии выбора СУБД: минимизация сложности освоения системы, ее внедрения и использования; качество технической документации и уровень сопровождения.
Удобство работы пользователя определяется пользовательским интерфейсом – частью СУБД, ориентированной на взаимодействие пользователя с компьютером.
Доступ к данным осуществляется в виде запросов, которые формулируются на стандартном языке запросов. Действие, осуществляемое над базой данных, называется транзакцией.
Особенность современных реляционных баз данных – их распределенный характер (distributed databank), т.е. содержание фрагментов из нескольких баз данных, которые располагаются на различных узлах сети компьютеров и, возможно, управляются разными СУБД.
Потребности в более удобных и мощных средствах моделирования предметной области, чем реляционные базы данных, удовлетворяет развивающееся направление семантических, или объектно-ориентированных, СУБД, полнее обеспечивающих возможности выражения семантики данных. Появляются СУБД новых поколений – объектно-реляционные и дедуктивно-объектно-ориентированные.
Наиболее эффективное средство представления сведений о базах данных – их электронные каталоги, или базы метаданных. С помощью баз метаданных могут решаться следующие задачи:
- организация учебы баз данных;
- планирование развития информационных ресурсов;
- информационное обеспечение процессов формирования научно-технической политики в различных областях экономики и социальной сферы для определения перспектив и путей их информатизации.
Составной частью интеллектуальных, в частности экспертных, систем, применяемых в управлении, экономике, финансово-кредитной сфере, образовании и т.п., являются базы знаний (knowledge base) (базы данных на основе семантической сети, процедурной, фреймовой и других моделей, организованные способом, позволяющим системе отвечать на вопросы, ответы на которые в явном виде в базе отсутствуют).
Экспертные системы, содержащие базы знаний, алгоритмы решения конкретных задач и программно-технические средства, дают возможность пользователю на основе вводимых данных о текущем состоянии объекта управления или анализируемой ситуации получать варианты рекомендаций для выбора управленческих действий.