База данных

База данных (database) – совокупность описаний объектов реального мира, определенным образом структурированных и связанных между собой, актуальных для конкретной прикладной области и представленных на машиночитаемых носителях в форме, пригодной для применения в информационных технологиях.

База данных — организованная в соответствии с определtнными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователей.

Организация данных в базе данных требует предварительного выбора и построения модели данных, назначение которой – систематизация информации и отражение ее свойств (по содержанию, структуре, объему, связям, динамике, источникам и т.д.).

База данных характеризуется следующими отличительными признаками:

  1. База данных хранится и обрабатывается в вычислительной системе. Таким образом, любые внекомпьютерные хранилища информации (архивы, библиотеки, картотеки и т.п.) базами данных не являются.
  2. Данные в базе данных логически структурированы (систематизированы) с целью обеспечения возможности их эффективного поиска и обработки в вычислительной системе. Структурированность подразумевает явное выделение составных частей (элементов), связей между ними, а также типизацию элементов и связей, при которой с типом элемента (связи) соотносится определенная семантика и допустимые операции.
  3. База данных включает схему, или метаданные, описывающие логическую структуру базы данных в формальном виде (в соответствии с некоторой метамоделью). В частности, постоянные данные в среде базы данных включают в себя схему и базу данных. Схема включает в себя описания содержания, структуры и ограничений целостности, используемые для создания и поддержки базы данных. База данных включает в себя набор постоянных данных, определенных с помощью схемы. Система управления данными использует определения данных в схеме для обеспечения доступа и управления доступом к данным в базе данных.

Базы данных неразрывно связаны со всеми информационными ресурсами общества, создаются на их основе, а многие из них и могут использоваться только вместе с документальными источниками информации. Информационные ресурсы рассматриваются как важная часть национальных ресурсов, а проблемы их развития – как часть общих проблем информатизации общества. Построение такой модели осуществляется в несколько этапов с последовательным приближением к оптимальному варианту, который наиболее адекватно отражает моделируемую предметную область.

Для создания базы данных в первую очередь определяют интересующие объекты (например, поставщики, потребители, предприятия, работники и др.), а затем выделяют для каждого объекта набор характеризующих его свойств – минимально возможную смысловую единицу («реквизит»). Например, свойствами предприятия могут быть: его название, адрес, расчетный счет в банке, тип выпускаемой продукции и т.п.

Объекты реального мира, сведения о которых хранятся в базе данных, называют «сущностями», а их актуальные признаки – «атрибутами». Вопрос об информационном содержании базы данных решается не только путем определения предметной области, но и с учетом интенсивности работы с различными видами информации, их динамическими характеристиками, частотой корректировок, степенью их взаимосвязи.

Как правило, пользователь интересуется не всей информацией, содержащейся в базе данных, поэтому необходимо обеспечить ему возможность выделения отдельной части (подмодели, локальной модели). Структура организации данных в базе данных должна учитывать связи между различными видами данных и обеспечивать быстрый доступ к ним.

Существует три основных типа логической организации данных:

  1. иерархическая модель (имеет структуру в виде графа и выражает только вертикальные связи типа подчинения нижнего уровня верхнему);
  2. сетевая модель (представляется в виде графа общего вида, где присутствуют горизонтальные и обратные связи);
  3. реляционная модель (совокупность таблиц, называемых «отношениями», над которыми выполняются операции, формулируемые в терминах реляционной алгебры, для реализации автоматизированного ответа на запросы пользователей системы).

Наибольшее распространение в настоящее время имеют реляционные базы данных. Разновидность реляционной модели – постреляционная модель данных, позволяющая строить высокоэффективные информационные системы, обеспечивающие одновременный доступ к информации большому числу пользователей.

По виду данных выделяют базы данных:

  • документографические (документальные) с подразделением их на библиографические и реферативные;
  • фактографические;
  • числовые;
  • полнотекстовые;
  • лексикографические;
  • смешанные (гибридные).

По назначению содержащейся информации различают базы данных:

  • деловой информации (социальная информация, кадастры, регистры, статистическая, коммерческая, финансовая, управленческая информация; данные о продукции и т.п.);
  • информации для специалистов (научно-техническая, экономическая, маркетинговая, правоохранительная, исследовательская, производственная, конструкторская, технологическая информация и т.п.);
  • массовой информации (правовая, библиотечно-библиографическая, архивная, учебная, справочная, общественно-политическая, словарно-энциклопедическая информация, информация о культуре, спорте, досуге и т.п.).

По способу доступа базы данных делят на:

  • размещенные на хостузлах (доступные через вычислительные сети);
  • тиражируемые в коммуникативных форматах;
  • тиражируемые программными средствами (включая CD-ROM);
  • локальные.

Стандартные формы баз данных дополняются сегодня мультимедийными документами, графическими образами, хронологическими рядами, процедурными или активными данными и прочими сложными информационными формами.

Источники для формирования баз данных – первичные документы: техническая документация, отчеты, формы статистической отчетности, специальные журналы, монографии, аналитические обзоры, информационные листки, материалы конференций, выставок, проспекты изданий и услуг и т.д. Все больше используются также вторичные источники информации: СМИ (статьи из газет и журналов, рефераты, лицензии, каталоги отечественных и зарубежных фирм, теле- и радиоинформация, рекламные объявления, адресные и специализированные справочники, регистрационные карточки, публикуемые балансы предприятий и банков, письма, анкеты, паспорта предприятий, статистические публикации, договора, прейскуранты и т.п.).

Важнейшие характеристики базы данных – тематический состав (база данных законодательной информации, информации о персоналиях, адресно-справочные, коммерческие информации и т.п.); полнота информационных ресурсов (охват различных тематических предметных областей (наличие пробелов) и полнота их отражения в оригинальных базах данных, а также мера удовлетворения соответствующих пользователей предлагаемыми формами и режимами предоставления информации).

БД должна отражать объекты реального мира однозначно и непротиворечиво (условие целостности базы данных– database integrity). Для поддержания информационной базы в рабочем состоянии применяют комплекс программных и языковых средств – систему управления базой данных (СУБД).

СУБД – это пакет программ, обеспечивающий ввод, хранение, корректировку, сохранность и перемещение данных, формирование ответов на запросы, связь с другими программными средствами. Совокупность одной или нескольких баз данных, справочника базы данных, СУБД, библиотеки запросов и прикладных программ называют банком данных (англ. databank).

Выбор управляющих программ определяется типом логической модели, имеющимися программными и техническими средствами. Основные критерии выбора СУБД: минимизация сложности освоения системы, ее внедрения и использования; качество технической документации и уровень сопровождения.

Удобство работы пользователя определяется пользовательским интерфейсом – частью СУБД, ориентированной на взаимодействие пользователя с компьютером.

Доступ к данным осуществляется в виде запросов, которые формулируются на стандартном языке запросов. Действие, осуществляемое над базой данных, называется транзакцией.

Особенность современных реляционных баз данных – их распределенный характер (distributed databank), т.е. содержание фрагментов из нескольких баз данных, которые располагаются на различных узлах сети компьютеров и, возможно, управляются разными СУБД.

Потребности в более удобных и мощных средствах моделирования предметной области, чем реляционные базы данных, удовлетворяет развивающееся направление семантических, или объектно-ориентированных, СУБД, полнее обеспечивающих возможности выражения семантики данных. Появляются СУБД новых поколений – объектно-реляционные и дедуктивно-объектно-ориентированные.

Наиболее эффективное средство представления сведений о базах данных – их электронные каталоги, или базы метаданных. С помощью баз метаданных могут решаться следующие задачи:

  • организация учебы баз данных;
  • планирование развития информационных ресурсов;
  • информационное обеспечение процессов формирования научно-технической политики в различных областях экономики и социальной сферы для определения перспектив и путей их информатизации.

Составной частью интеллектуальных, в частности экспертных, систем, применяемых в управлении, экономике, финансово-кредитной сфере, образовании и т.п., являются базы знаний (knowledge base) (базы данных на основе семантической сети, процедурной, фреймовой и других моделей, организованные способом, позволяющим системе отвечать на вопросы, ответы на которые в явном виде в базе отсутствуют).

Экспертные системы, содержащие базы знаний, алгоритмы решения конкретных задач и программно-технические средства, дают возможность пользователю на основе вводимых данных о текущем состоянии объекта управления или анализируемой ситуации получать варианты рекомендаций для выбора управленческих действий.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

15 − восемь =