Чем отличается информация от данных. Понятия информации, даваемые различными науками. Отличие от сведений данных и знаний

Часто данные и информация отождествляются, однако между двумя терминами есть существенное различие:

Информация - знания, касающиеся понятий и объектов (факты, события, вещи, процессы, идеи) в человеческом мозге;

Данные - представление переработанной информации, пригодной для передачи, толкования, или обработки (компьютерные файлы, бумажные документы, записи в информационной системе).

Отличие информации от данных состоит в том, что:

1) данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач.

Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

2)данные - это носители информации, а не сама информация.

3)Данные превращаются в информацию только тогда, когда ими заинтересуется человек. Человек извлекает информацию из данных, оценивает, анализирует ее и по результатам анализа принимает то или иное решение.

Данные превращаются в информацию несколькими путями:

Контекстуализация: мы знаем, для чего эти данные нужны;

Подсчет: мы обрабатываем данные математически;

Коррекция: мы исправляем ошибки и ликвидируем пропуски;

Сжатие: мы сжимаем, концентрируем, агрегируем данные.

Таким образом, если существует возможность использовать данные для уменьшения неопределенности знаний о каком-либо предмете, то данные превращаются в информацию. Поэтому можно утверждать, что информацией являются используемые данные.

4)Информацию можно измерять. Мера измерения содержательности информации связана с изменением степени неосведомленности получателя и основана на методах теории информации.

2. Предметная область - это часть реального мира, данные о которой мы хотим отразить в базе данных. Предметная область бесконечна и содержит как существенно важные понятия и данные, так и малозначащие или вообще не значащие данные. Таким образом, важность данных зависит от выбора предметной области.

Модель предметной области . Модель предметной области - это наши знания о предметной области. Знания могут быть как в виде неформальных знаний в мозгу эксперта, так и выражены формально при помощи каких-либо средств. Опыт показывает, что текстовый способ представления модели предметной области крайне неэффективен. Гораздо более информативными и полезными при разработке баз данных являются описания предметной области, выполненные при помощи специализированных графических нотаций. Имеется большое количество методик описания предметной области. Из наиболее известных можно назвать методику структурного анализа SADT и основанную на нем IDEF0, диаграммы потоков данных Гейна-Сарсона, методику объектно-ориентированного анализа UML, и др. Модель предметной области описывает скорее процессы, происходящие в предметной области и данные, используемые этими процессами. От того, насколько правильно смоделирована предметная область, зависит успех дальнейшей разработки приложений.

3. Ба́за да́нных - представленная в объективной форме совокупность самостоятельных материалов (статей, расчётов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ).

Многие специалисты указывают на распространённую ошибку, состоящую в некорректном использовании термина «база данных» вместо термина «система управления базами данных», и указывают на необходимость различения этих понятий.

ОСНОВНЫЕ ПОЛОЖЕНИЯ

1. В быту люди часто используют термин «информация», вкладывая в него простой смысл - «сообщение». Когда говорят: «Нам не хватает информации», «Даю информацию!», «Это- научная информация», то интуитивно под термином «информация» подразумевают достаточно широкий круг значений: «совокупность знаний», «данные», «понятия», «представления», «новости», «сведения».

Общепринятой научной формулировки термина «информация» пока еще нет. Предлагаемые варианты страдают неполнотой, часто расплывчатостью и неточностью. В таком случае в науке принято строить определение, перечисляя, описывая свойства объекта или явления.

Рассмотрим основные свойства информации. В качестве исходного, рабочего определения возьмем самое распространенное: информация - это какие-либо сведения (1). Здесь слова «информация» и «сведения» рассматриваются как снноннмы. Однако существует достаточно много ситуаций, когда сведения не несут информации. Так, А. П. Чехов в рассказе «Учитель словесности» вкладывает в уста героя, учителя Ипполита Ипполитовича, фразу, ставшую символом коммуникативной банальности: «Волга впадает в Каспийское море, а лошадн кушают овес н сено». Эти сведения являются истинной правдой, однако информации они не содержат. Важный момент в понимании сущности изучаемого явления: данное сообщение не несет информации, оно содержит об-щеизвестный факт.

Информативными являются не всякие сведения, а лишь те, которые несут нечто важное, новое, ценное для получателя. Именно получатель сообщения решает, считать ли сообщение информативным для себя нлн нет. Учитывая сказанное, можно уточнить предыдущую формулировку: информация - это такие сведения, которые либо имеют значимость (ценность) для принимающего, либо приобретают ее (2). Уточним ряд позиций:

информация существует в определенных условиях, она с ними связана, существует источник сведений, объект- информатор, который может распространять некоторые сведения;

информация обладает неодинаковой ценностью с точки зрения пользователей, принимающих ее;

принимающий сведения производит отбор, разделение их на информативные и бесполезные (последние называются шумом).

Информация в человеческом общении всегда имеет смысл, основана на разрыве в знаниях между говорящими.

Специалист по связям с общественностью или журналист должен понимать: его сообщение будет восприниматься как информативное лишь тогда, когда оно актуально либо по-новому представляет факты, значительно возбуждает интерес.

Правомерно говорить о субъективной ценности информации. Не все люди будут воспринимать одни и те же сведения как значимые для себя. Сведения о курсе мировых валют имеют значимую ценность (информативны) для бизнесмена, для владельца валюты, но к ним безразлично отнесется тот, кто не связан с валютными операциями. Информация функционально связана с целями получателя. В обыденном понимании поступление сообщения связано с некоторыми событиями. Именно события являются источником сообщения, содержащего или не содержащего информацию.

Процесс обмена информацией играет важную роль в жизнн любого существа. Способность к передаче или приему информации в самом широком смысле является критерием жизни Сообщение об изменении условий в среде существования обнаруживается живым организмом как благоприятное нлн опасное, требующее определенных реакций. Понятие информация настолько всеобъемлюще, что некоторые ученые включают его в определение жизни, на-пример Н". Винер.

Информация участвует в актах связи с внсшннм миром. Коммуникация - это связь, это обмен информацией.

Таким образом, коммуникация, информация, жизнеспособность - это понятия одного круга.

Еще одно свойство информации. Потеряв новизну, информация исчезает. Мы не перечитываем букварь, так как в нем все известно, неинформативно

Отсюда некоторые допотитепъные выводы:

информация - это неизвестное, неопределенное,

субъективная информация исчезает после ее восприятия пользователем.

Неопределенность и информативность связаны математическими зависимостями чем больше неопределенность, тем сооби(ение информативнее.

Итак, у информации имеется два противоречивых свойства:

это некоторый объем данных, который существует объективно, независимо, может быть измерен (например, данные в компьютере; объем, количество печатных символов в книге);

информационная ценность, польза этих данных определяется тем, что они будут понятны людям, смогут расширить, уточнить их знания. Следовательно, оценка «информативности» конкретных данных является субъективной; она зависит от объема знаний конкретного нндиаидуума. Факт, что соотношение 2x2 = 4 для первоклассника является настоящим открытием, но уже через некоторое время эти сведения становятся для него банальностью.

В XX в. в связи с развитием научного познания понятие информации существенно углубилось. Информация стала рассматриваться как нечто самостоятельное в рамках новой науки, кибернетики, изучающей процессы управления. Кибернетика доказывает, что информация участаует в процессах управления и развития любых систем (живых организмов или автоматических устройств), обеспечивающих устойчивость н выживаемость. Опираясь на исходные кибернетические идеи, философы пытаются дать широкое обоснование своим аоззреииям на свойства информации как философской категории. В философской науке сложилось две ведущих идеи, по- разному объясняющие свойства информации и ее характе-ристики.

Приверженцы одной школы (Б. В. Бирюков, И. Б. Но- внк, А. Д. Урсул н др.) квалифицируют информацию как свойство любых материальных объектов. По мнению по-следователей этого направления (их иногда называют атрибуты стам и), информация может быть извлечена из любого материального объекта жнвой н неживой природы. Материя рассматривается как хранилище «мертвой информации». Информация содержится объективно, но в скрытом аиде. В составе объектов природы всегда существует некая структура (набор частей, когда обязательно учитываются связи между составными частями), которую возможно познать. Поэтому такую информацию называют скрытой, структурной (иногда - связанной). Извлечь информацию может лишь наблюдатель, человек. Он обрабатывает ее, кодирует н перекодирует для передачи информации от объекта к субъекту. Итак, информация - это активно и целесообразно используемая часть знаний (3).

Смысл активности заключается в непосредственном или опосредованном (например, с помощью межличностного контакта в общении и т. п.) взаимодействии с объектом познания. Информация становится востребованной лишь при наличии разумного существа, получателя информации, способного осмыслить содержание хранящегося сообщения. Информация актуализируется при появлении познающего, мыслящего субъекта, воздействует на рецепторы его органов чувств, вызывает соответствующие реакции, принятие решений, вовлекается в управление поведением. Этот процесс (извлечение информации) индивидуален. Например, художник любуется особым оттенком в цвете глаз натурщицы, а врач усматривает в этих же оттенках цвета глаз признаки опасного заболевания.

Данные - это совокупность сведений, которые зафиксированы на каком-либо носителе - бумаге, диске, пленке. Эти сведения должны быть в форме, пригодной для хранения, передачи и обработки. Дальнейшее преобразование данных позволяет получить информацию. Таким образом, информацией можно назвать результат анализа и преобразования данных. В базе хранятся различные данные, а система управления может выдавать по определенному запросу требуемую информацию. К примеру, можно узнать из школьной базы данных, кто из учеников живет на определенной улице или кто в течение года не получил плохой отметки и др. Данные превращаются в информацию тогда, когда ими заинтересуются. Можно утверждать, что информация - это используемые данные.

Слово «информация» произошло от латинского informatio, «сведения, изложение, разъяснение». Также информацией называют сведения об объектах, явлениях окружающей среды, их свойствах, которые уменьшают степень неопределенности, неполноты знаний. В результате обмена сведениями формируется более полное представление о предмете, повышается уровень осведомленности.

Информация не существует изолированно, сама по себе. Всегда есть источник, который ее производит и , ее воспринимающий. В роли источника или приемника выступает любой объект - человек, компьютер, животное, растение. Информация всегда предназначается конкретному объекту.

Человек получает информацию из самых разных источников - при чтении, прослушивании радио, просмотре телепередач, когда он дотрагивается до предмета, пробует на вкус еду. Одну и ту же информацию разные люди могут воспринимать по-разному.

В зависимости от сферы использования существует научная, техническая, экономическая и другие виды информации. Это сильнейшее средство воздействия на и на общество в целом. Согласно известному выражению, кто владеет наибольшей информацией по какому-либо вопросу, тот владеет миром, то есть, находится в выигрышном положении в сравнении с другими. В повседневной жизни от информации зависит развитие общества, здоровье и жизнь людей.

На протяжении тысячелетий человечество накопило огромные знаний, которые все продолжают увеличиваться. Объем информации в наши дни удваивается каждые два года. В любой ситуации, даже самой обыденной, эффективна лишь актуальная, полная, достоверная и понятная информация. Только актуальные, то есть, вовремя полученные сведения могут принести пользу людям. Прогноз погоды или предупреждение об урагане важно узнать накануне, а не в этот же день.

5.1. Отличия знаний от данных

Характерным признаком интеллектуальных систем является наличие знаний, необходимых для решения задач конкретной предметной области. При этом возникает естественный вопрос, что такое знания и чем они отличаются от обычных данных, об­рабатываемых ЭВМ.

Данными называют информацию фактического характера, описывающую объекты, процессы и явления предметной облас­ти, а также их свойства. В процессах компьютерной обработки данные проходят следующие этапы преобразований:

Исходная форма существования данных (результаты наблю­дений и измерений, таблицы, справочники, диаграммы, графики и т.д.);

Представление на специальных языках описания данных, предназначенных для ввода и обработки исходных данных в ЭВМ;

Базы данных на машинных носителях информации.

Знания являются более сложной категорией информации по сравнению с данными. Знания описывают не только отдельные факты, но и взаимосвязи между ними, поэтому знания иногда на­зывают структурированными данными. Знания могут быть полу­чены на основе обработки эмпирических данных. Они представ­ляют собой результат мыслительной деятельности человека, на­правленной на обобщение его опыта, полученного в результате практической деятельности.

Для того чтобы наделить ИИС знаниями, их необходимо представить в определенной форме. Существуют два основных способа наделения знаниями программных систем. Первый - по­местить знания в программу, написанную на обычном языке про­граммирования. Такая система будет представлять собой единый программный код, в котором знания не вынесены в отдельную категорию. Несмотря на то что основная задача будет решена, в этом случае трудно оценить роль знаний и понять, каким образом они используются в процессе решения задач. Нелегким делом яв­ляются модификация и сопровождение подобных программ, а проблема пополнения знаний может стать неразрешимой.

Второй способ базируется на концепции баз данных и заклю­чается в вынесении знаний в отдельную категорию, т.е. знания представляются в определенном формате и помещаются в БЗ. Ба­за знаний легко пополняется и модифицируется. Она является автономной частью интеллектуальной системы, хотя механизм логического вывода, реализованный в логическом блоке, а также средства ведения диалога накладывают определенные ограниче­ния на структуру БЗ и операции с нею. В современных ИИС при­нят этот способ.

Следует заметить, что для того, чтобы поместить знания в компьютер, их необходимо представить определенными структурами данных, соответствующих выбранной среде разработки ин­теллектуальной системы. Следовательно, при разработке ИИС сначала осуществляются накопление и представление знаний, причем на этом этапе обязательно участие человека, а затем зна­ния представляются определенными структурами данных, удоб­ными для хранения и обработки в ЭВМ. Знания в ИИС сущест­вуют в следующих формах:

Исходные знания (правила, выведенные на основе практи­ческого опыта, математические и эмпирические зависимости, отражающие взаимные связи между фактами; закономерности и тенденции, описывающие изменение фактов с течением време­ни; функции, диаграммы, графы и т. д.);

Описание исходных знаний средствами выбранной модели представления знаний (множество логических формул или про­дукционных правил, семантическая сеть, фреймы и т. п.);

Представление знаний структурами данных, которые пред­назначены для хранения и обработки в ЭВМ;

Базы знаний на машинных носителях информации.

Что же такое знания? Приведем несколько определений.

Из толкового словаря С. И. Ожегова: 1) «Знание - постиже­ние действительности сознанием, наука»; 2) «Знание - это сово­купность сведений, познаний в какой-либо области».

Определение термина «знания» включает в себя большей частью философские элементы. Например, знание - это проверенный практикой результат познания действительности, верное ее отображение в сознании человека.

Знание есть результат, полученный познанием окружающего мира и его объектов. В простейших ситуациях знания рассматривают как констатацию фактов и их описание.

Исследователями в области ИИ даются более конкретные оп­ределения знаний.

«Знания - это закономерности предметной области (принци­пы, связи, законы), полученные в результате практической дея­тельности и профессионального опыта, позволяющие специали­стам ставить и решать задачи в этой области» .

«Знания - это хорошо структурированные данные или дан­ные о данных, или метаданные» .

«Знания - формализованная информация, на которую ссы­лаются или используют в процессе логического вывода» .

В области систем ИИ и инженерии знаний определение знаний увязывается с логическим выводом: знания - это информация, на основании которой реализуется процесс логического вывода, т.е. на основании этой информации можно делать различные заключения по имеющимся в системе данным с помощью логического вывода. Механизм логического вывода позволяет связывать воедино отдельные фрагменты, а затем на этой последовательности связанных фрагментов делать заключение.

Знания - это формализованная информация, на которую ссылаются или которую используют в процессе логического вывода (рис. 5.1.).


Рис. 5.1. Процесс логического вывода в ИС

Под знанием будем понимать совокупность фактов и правил. Понятие правила, представляющего фрагмент знаний, имеет вид:

Если <условие> то <действие>.

Это определение есть частный случай предыдущего определения.

Однако признается, что отличительные качественные особенности знаний обусловлены наличием у них больших возможностей в направлении структурирования и взаимосвязанности составных единиц, их интерпретируемости, наличие метрики, функциональной целостности, активности.

Существует множество классификаций знаний. Как правило, с помощью классификаций систематизируют знания конкретных предметных областей. На абстрактном уровне рассмотрения можно говорить о признаках, по которым подразделяются зна­ния, а не о классификациях. По своей природе знания можно разделить на декларативные и процедурные.

Декларативные знания представляют собой описания фактов и явлений, фиксируют наличие или отсутствие таких фактов, а также включают описания основных связей и закономерностей, в которые эти факты и явления входят.

Процедурные знания - это описания действий, которые воз­можны при манипулировании фактами и явлениями для дости­жения намеченных целей.

Для описания знаний на абстрактном уровне разработаны специальные языки - языки описания знаний. Эти языки также делятся на языки процедурного типа и декларативного. Все языки описания знаний, ориентированные на использование тради­ционных компьютеров фон-неймановской архитектуры, являют­ся языками процедурного типа. Разработка языков декларатив­ного типа, удобных для представления знаний, является актуаль­ной проблемой сегодняшнего дня.

По способу приобретения знания можно разделить на факты и эвристику (правила, которые позволяют сделать выбор при отсут­ствии точных теоретических обоснований). Первая категория знаний обычно указывает на хорошо известные в данной пред­метной области обстоятельства. Вторая категория знаний осно­вана на собственном опыте эксперта, работающего в конкретной предметной области, накопленном в результате многолетней практики.

По типу представления знания делятся на факты и правила, Факты - это знания типа «А - это А», такие знания характерны для баз данных и сетевых моделей. Правила, или продукции, - это знания типа «ЕСЛИ А, ТО В».

Кроме фактов и правил существуют еще метазнания - знания о знаниях. Они необходимы для управления БЗ и для эффектив­ной организации процедур логического вывода.

Форма представления знаний оказывает существенное влия­ние на характеристики ИИС. Базы знаний являются моделями человеческих знаний. Однако все знания, которые привлекает человек в процессе решения сложных задач, смоделировать не­возможно. Поэтому в интеллектуальных системах требуется чет­ко разделить знания на те, которые предназначены для обработ­ки компьютером, и знания, используемые человеком. Очевидно, что для решения сложных задач БЗ должна иметь достаточно большой объем, в связи с чем неизбежно возникают проблемы управления такой базой. Поэтому при выборе модели представ­ления знаний следует учитывать такие факторы, как однород­ность представления и простота понимания. Однородность пред­ставления приводит к упрощению механизма управления знани­ями. Простота понимания важна для пользователей интеллекту­альных систем и экспертов, чьи знания закладываются в ИИС. Если форма представления знаний будет трудна для понимания, то усложняются процессы приобретения и интерпретации зна­ний. Следует заметить, что одновременно выполнить эти требо­вания довольно сложно, особенно в больших системах, где неиз­бежным становится структурирование и модульное представле­ние знаний.

Решение задач инженерии знаний выдвигает проблему преобразования информации, полученной от экспертов в виде фактов и правил их использования, в форму, которая может быть эффективно реализована при машинной обработке этой информации. С этой целью созданы и используются в действующих системах различные модели представления знаний.

К классическим моделям представления знаний относятся логи­ческая, продукционная, фреймовая и модель семантической сети.

Каждой модели отвечает свой язык представления знаний. Однако на практике редко удается обойтись рамками одной мо­дели при разработке ИИС за исключением самых простых случа­ев, поэтому представление знаний получается сложным. Кроме комбинированного представления с помощью различных моде­лей, обычно используются специальные средства, позволяющие отразить особенности конкретных знаний о предметной области, а также различные способы устранения и учета нечеткости и не­полноты знаний.



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: