Что такое семантика простыми словами? Разработка структуры хранилища данных

В кн.: Образы, традиции и культура межнационального мира и согласия. Иркутск: Издательство ИГУ, 2014. С. 51-63.

На основе авторской методологической схемы «образ мира - образ жизни» и моделей образа мира и образа жизни описываются профессиональные, региональные и этнокультурные особенности образа мира и образа жизни, предлагаются схемы дальнейшего описания.

На основе материалов консультирования и специально организованных исследований описано перераспределение и изменение основных функций семьи (воспитательная, психотерапевтическая, эротическая, хозяйственно-бытовая, защитная и др.) при работе мужа вахтовым или сезонным методом.

Ставится проблема необходимости эргономического описания и проектирования про- фессионально специфичного образа жизни для тех специалистов, деятельность которых невозможна без организации особого образа жизни. Приведены примеры, перечислены факторы и параметры описания профессионально специфичного образа жизни. In article the problem of necessity of the ergonomic description and designing of professionally specific way of life for those specialists which activity is impossible without the organization of a special way of life is put. Examples are resulted, factors and parameters of the description of professionally specific way of life are listed.

Предметом психосемантики является субъективная реальность и индивидуально-специфические способы ее структурной организации. Субъективная реальность - это тот образ мира, в котором конкретный человек живет, это система определенным образом структурированных, аффективно окрашенных знаний, воспринимаемых как истинные. Понятие «субъективный образ мира» занимает важное место в теории деятельности А.Н. Леонтьева, который полагал, что проблема психического и должна ставиться как «проблема построения в сознании индивида многомерного образа мира, образа реальности» (Леонтьев, 1983. С. 254).

Существуют многочисленные отечественные и зарубежные исследования, показывающие, что субъективный опыт (структурированные следы предшествующих реализуемому в данный момент психическому акту деятельности) является регулятором деятельности, и, следовательно, представления мира, образа мира. В работах Дж. Брунера (1977) показана зависимость результатов восприятия от сложившейся в прошлых деятельностях категориальной сетки восприятия.

Субъективный опыт, подобно образу мира, имеет уровневую организацию. В понимании этой уровневой организации существуют как различия, так и общие черты. С.Д. Смирнов (1981) предложил разделение поверхностных и ядерных структур: поверхностные структуры - чувственно оформленное представление о мире, а ядерные - отторгнутые от чувственности, амодальные, знаковые системы - отражение мира в целом. В.В. Петухов (1984) указал на зависимость уровней от «языка» описания: поверхностные структуры - это представления о мире, а ядерные - представления мира.

Согласно Б.Ф. Ломову (1984), основными уровнями отражения являются перцептивные процессы, представления, рече-мыслительные процессы и понятийное мышление.

Другим основанием для выделения слоев субъективного опыта, используемым Е.Ю. Артемьевой (1983) является специфика их по форме фиксации следа деятельности. Внешне деление на слои по этому основанию похоже на описанное выше, но функционально они различны.

Первый слой соответствует первой и второй ступеням генеза - сенсорно-перцептивному и представленческому уровняю отражения. Он задается как множество упорядоченных друг относительно друга объектов, среди которых и тело субъекта. Объекты образуют пространство, движутся относительно субъекта и самих себя. Кроме четырех координат пространства - времени перцептивный мир характеризуется значениями и смыслами. Специфичность этого слоя в том, что его «строительный материал», его фактура - модальные.

Следующий слой - семантический. Следы взаимодействия с объектами зафиксированы в этом слое в виде многомерных отношений: следы атрибутированы субъективными отношениями (хороший - плохой, сильный - слабый и т.д.). «Инструментально такие отношения и описываются методами экспериментальной психосемантики и по природе близки к семантикам - системам так или иначе понимаемых «значений» (Артемьева, 1999. С. 20).



Самый глубокий слой, соотносимый с ядерными структурами образа мира и формируемый при участии и самом существенном вкладе понятийного мышления - слой амодальных структур, образующихся при «обработке» семантического слоя. «Нам совсем неизвестен «язык» этого слоя, устройство его структуры. Понятно только, что разделителями элементов первой очереди являются адаптационные координаты: противопоставление «опасный - неопасный» во главе иерархии» (Артемьева, 1999. С. 21). Этот слой мира Артемьева предлагает называть образом мира в узком смысле слова.

При другом подходе, наиболее разработанном в исследованиях В.Ф. Петренко, и опирающемся на представление о связи иерархии уровней сознания с генезисом форм отражения глубинный уровень соотносится с наиболее архаичными формами отражения, имеющими дознаковый и тем более допонятийный характер.

Аналогом категориальной структуры индивидуального сознания выступают семантические пространства, заданные пересечением семантических категорий. При этом размерность пространства - число независимых факторов - категорий - соответствует когнитивной сложности сознания субъекта в данной содержательной области.

Наиболее простым (глубинным) является уровень, образованный небольшим числом коннотативных, т.е. эмоционально-образных оснований категоризации. Этому уровню соответствуют коннотативные семантические пространства Ч. Осгуда, образованные факторами «Оценка», «Сила», «Активность» и некоторые другие, выделенные в работах Бентлера и Лавойе. «Основания категоризации этого уровня задаются в форме эмоционально насыщенной и не жестко структурированной образности, не несущей в себе завершенной предметности, и реализуются механизмами синестезии, являющейся наиболее простой формой категоризации... семантическая организация этого уровня идентична как для образной. Так и для вербальной психосемантики, т.е. существует единый глубинный код, являющийся универсальным для восприятия различной модальности» (Петренко, 1997. С. 191). Этот уровень, как показывают исследования Ч. Осгуда и его коллег, является универсальным для представителей разных языковых культур, разного уровня образования, нормы и патологии.

Более развитые формы категоризации опосредованны системой перцептивных эталонов, символов, языковых значений и других социально выработанных в данной конкретной культуре форм обобщения значений. Как отмечает В.Ф. Петренко, предполагается взаимосвязь глубинных коннотативных форм категоризации и предметных (в том числе и понятийных), определяющая возможность перехода от одного уровня сознания к другому. Операционально этому переходу соответствует расчленение коннотативных факторов в пучки боле узких, факторов, отражающих предметные (денотативные) признаки. «Актуальное порождение значения можно представить как последовательный переход от коннотативной нерасчлененности к предметно-категориальной организации, включающей обогащение содержанием на каждом уровне порождения» (Петренко, 1997. С. 192).

Такое понимание позволяет понять тенденцию к уменьшению размерности семантического пространства и переход к более емким «аффективным обобщениям» как своеобразный переход в семантической организации лексики к более глубинным коннотативным уровням организации. «Аффект, таким образом, выступает как фактор, изменяющий характер категоризации. Аффект является своеобразным оператором перехода от более расчлененных (предметно-категориальных) форм категоризации к аффективно-ситуативным (коннотативным) формам категоризации» (Петренко, 1997. С. 193).

Как показывают исследования В.Ф. Петренко и В.В. Кучеренко (1998), изменение семантической структуры сознания происходит и в измененных состояниях сознания. Изменения заключаются, прежде всего, в переходе от преимущественной опоры на вербально-логические, понятийные структуры, к отражению в форме наглядно-чувственных (довербальных) образов.

Близкой позиции придерживается и А.Г. Шмелев, который, говоря о многослойности субъективной семантики так же выделяет поверхностный, социально детерминированный слой, и глубинный слой «зоологически-детерминированной психики, в котором объекты, в том числе и социальные, отражаются в виде нерасчлененного единства объективных сенсорных признаков и реакций субъекта (Шмелев, 2000).

Психосемантика изучает как общепсихологические аспекты процесса категоризации, т.е. единые для всех людей, так и дифференциально-психологические, т.е. индивидуально-специфические, свойственные конкретному человеку. В первом случае задачей психосемантики является выявление наиболее общих структур сознания, характеризующих коллективные представления (С. Московичи), обыденное, житейское, «наивное» сознание. В последнем случае задача состоит в воссоздании системы представлений конкретного индивида о мире путем реконструкции системы его индивидуальных значений и личностных смыслов (Смирнов, .... 1996. С.398). Психосемантический подход открывает возможность исследования личности через анализ «пристрастности» индивидуального сознания человека, проявляющейся, в частности, во влиянии мотивационной направленности на характер и организацию категориальных структур восприятия и осознания субъектом предметной и социальной действительности, т.е. в широком смысле во влиянии мотивационной системы субъекта на его образ мира (Петренко, 1988. С. 9).

Общей задачей методов психосемантики является реконструкция (воссоздание) категориальных структур сознания.

Категориальной структурой сознания является иерархизированный, упорядоченный набор наиболее общих категорий, определяющих построение и содержание значения. Категоризация - это процесс отнесения объекта к той или иной категории на основе существенных признаков. Это процесс может осуществляться как под контролем сознания, при опоре на осознаваемые признаки, так и бессознательно. Суть категоризации, как указывает Дж. Брунер, состоит в приписывании явно различающимся вещам эквивалентности, объединении предметов, событий и людей в классы и реагировании на них в зависимости от принадлежности к разным классам, а не от их своеобразия (Брунер, 1977). Являясь атрибутом, (принадлежностью) сознания, категориальные структуры сами как таковые могут не осознаваться, а их нерефлексивное, «ненаучное» содержание отражает структуру «наивного», житейского сознания, определяющего наше поведение в обыденной жизни.

Характер выделяемых семантических единиц, в том числе и семантических категорий зависит и от внешних факторов - от содержания и объема экспериментального материала, позволяющего актуализироваться тем или иным отношениям, оппозициям; от мотивов и целей испытуемых, определяющих уровень и характер категоризации; от присущего субъекту когнитивного стиля, эмоционального состояния и т.д.

Моделью категориальной структуры индивидуального или группового сознания является семантическое пространство . Семантическим пространством называется совокупность определенным образом организованных признаков, описывающих и дифференцирующих объекты некоторой содержательной области (Петренко, 1988. С. 45). При этом выделяется некоторое правило группировки отдельных признаков (дескриптов) в более емкие категории, которые и являются исходными единицами этой упрощенной системы описания - семантического пространства. (пространства значений). В более узком смысле слова семантическим пространством называют такое пространство признаков, для которого правила объединения отдельных признаков-дескриптов заданы статистическими процедурами.

Размещение в семантическом пространстве тех или иных значений позволяет проводить их анализ, судить об их сходстве и различии. Математически субъективное семантическое пространство выражается с помощью координатных осей, точек и вычисления расстояния между ними.

Субъективные семантические пространства, используемые как операциональные модели категориальных структур индивидуального сознания, позволяют оценивать когнитивную сложность субъекта в различных содержательных областях, выделять субъективную значимость оснований категоризации и описывать имплицитную теорию субъекта относительно различных сфер предметной и социальной действительности (Петренко, 1989. С. 8). В семантическом пространстве могут быть выделены отдельные семантические поля.

Семантическое поле - это совокупность слов вместе с их ассоциациями. По определению А.Р. Лурия семантическое поле слова составляют комплексы ассоциативных значений, непроизвольно всплывающих при его восприятии. Семантические поля являются формой фиксации семантических связей. А.Р. Лурия, говоря о семантическом поле слова отмечал, что «... слово становится центральным узлом для целой сети вызываемых им образов и «коннотативно» связанных с ним слов, которые говорящий или воспринимающий задерживает, тормозит с тем, чтобы из всей сети «коннотативных» значений выбрать нужное...» (Лурия, 1979. С. 40 - 41). Этот процесс выбора осуществляется далеко не всегда на сознательном уровне и будет ли выбрано конкретное слово, или затормозится, будет отброшено зависит от многих факторов, и, в частности, от действия цензуры.

3. Семантическая структура сознания занимает промежуточное положение между осознанным миром значений и миром смыслов, осознание которых не является обязательным.

На формирование субъективной реальности большое влияние оказывает язык, дающий возможность обобщать, группировать, структурировать отдельные чувственные впечатления опираясь на результаты общественного - исторического опыта, он и обладая значительной свободой. Посредством языка субъективная реальность одного человека может быть соотнесена с субъективными реальностями других людей и они, если повезет, могут найти нечто общее в видении мира. Однако в силу неоднозначности слов, недостаточностью средств языка для выражения тонких отличий мыслей и чувств полное совпадение принципиально невозможно. Два человека, говоря о любви или «хорошей прогулке» могут подразумевать совершенно разные вещи, и даже дополнительные подробные разъяснения далеко не всегда гарантируют точное понимание (точность которого и невозможно проверить). Что наполняет содержанием (заставляет вспомнить) известные слова Тютчева: «мысль изреченная есть ложь». Мысль не совпадает со словесной формой выражения, что подчеркивал Л.С. Выготский: «Единицы мысли и единицы речи не совпадают. Один и другой процессы обнаруживают единство, но не тождество. Они связаны друг с другом сложными переходами, сложными превращениями, но не перекрывают друг друга, как наложенные друг на друга прямые линии» (Выготский, Т.2. 1982. С. 354). Психосемантика рассматривает именно ту систему значений и смыслов, которая расположена на «до языковом уровне», «скрывается под слоем слов» и еще не искажена словами, но сама определяет смысловое наполнение словесных и иных знаковых систем.

Хранилище данных Deductor Warehouse - это специально организованная база данных, ориентированная на решение задач анализа данных и поддержки принятия решений, обеспечивающая максимально быстрый и удобный доступ к информации. ХД Deductor Warehouse соответствует модели ROLAP (схема «снежинка») и может быть развернуто на СУБД Firebird.

Хранилище данных Deductor Warehouse включает в себя потоки данных, поступающие из различных источников, и специальный семантический слой, содержащий так называемые метаданные (данные о данных). Семантический слой и сами данные хранятся в одной СУБД.

Запрос к хранилищу осуществляется непосредственно сквозь семантический слой, который через внутреннюю систему команд (скрытую от пользователя и аналитика) подбирает запрашиваемую информацию из многообразия хранимых данных. Работу семантического слоя можно сравнить с деятельностью библиотекаря, который по просьбе читателя достает с разрозненных полок книги и раскрывает их на нужных страницах.

Все данные в Deductor Warehouse хранятся в структурах типа «снежинка», где в центре расположены таблицы фактов, а «лучами» являются измерения, причем каждое измерение может ссылаться на другое измерение. Именно эта схема используется в данном хранилище данных.

Для описания структуры таблиц хранилища данных и связей между ними была использована модель ERD в нотации DM .

В Deductor Warehouse имеются следующие типы объектов:

Измерение - последовательность значений одного из анализируемых параметров. В таблице 3.6 представлены используемые для анализа данных оптовых закупок сумок сетями спортивных магазинов.

Таблица 3.6 - «Измерения»

Атрибут - свойство измерения (то есть точки в пространстве). Атрибут как бы скрыт внутри другого измерения и помогает пользователю полнее описать исследуемое измерение. В таблице 3.7 представлены используемые атрибуты.

Таблица 3.7 - «Атрибуты»

Тип данных

Название сети

Строковый

Тип товара

Строковый

Код типа товара

Наименование товара

Строковый

Код товара

Строковый

Факт - значение, соответствующее измерению. Факты - это данные, отражающие сущность события. Как правило, фактами являются численные значения, например, доход (см. таблицу 3.8).

Таблица 3.8 - «Факты»

Ссылка на измерение - установленная связь между двумя и более измерениями. Дело в том, что некоторые бизнес-понятия (соответствующие измерениям в хранилище данных) могут образовывать иерархии. В данном случае измерение «Код товара» содержит ссылку на измерение «Код типа товара».

Процесс - совокупность измерений, фактов и атрибутов. По сути, процесс и есть «снежинка». Процесс описывает определенное действие.

Все загружаемые в ХД данные обязательно должны быть определены как измерение, атрибут либо факт.

Информация о принадлежности данных к тому или иному типу (измерение, ссылка на измерение, атрибут или факт) содержится в семантическом слое хранилища.

Структура процесса «Хранилище» представлена на рисунке 3.1.

Рисунок 3.1 - Процесс «Хранилище»

Свойство

OLTP-система

СППР

Цели использования данных

Быстрый поиск, простейшие алгоритмы обработки

Аналитическая обработка с целью поиска скрытых закономерностей, построения прогнозов и моделей и т.д.

Уровень обобщения (детализации) данных

Детализированные

Как детализированные, так и обобщенные (агрегированные)

Требования к качеству данных

Возможны некорректные данные (ошибки регистрации, ввода и т.д.)

Ошибки в данных не допускаются, поскольку могут привести к некорректной работе аналитических алгоритмов

Формат хранения данных

Данные могут храниться в различных форматах в зависимости от приложения, в котором они были созданы

Данные хранятся и обрабатываются в едином формате

Время хранения данных

Как правило, не более года (в пределах отчетного периода)

Годы, десятилетия

Изменение данных

Данные могут добавляться, изменяться и удаляться

Допускается только пополнение; ранее добавленные данные изменяться не должны, что позволяет обеспечить их хронологию

Периодичность обновления

Часто, но в небольших объемах

Редко, но в больших объемах

Доступ к данным

Должен быть обеспечен доступ ко всем текущим (оперативным) данным

Должен быть обеспечен доступ к историческим (то есть накопленным за достаточно длительный период времени) данным с соблюдением их хронологии

Характер выполняемых запросов

Стандартные, настроенные заранее

Нерегламентированные, формируемые аналитиком «на лету» в зависимости от требуемого анализа

Время выполнения запроса

Несколько секунд

До нескольких минут

4. Семантический слой в хранилище данных.

“Семантический слой - механизм, позволяющий аналитикам оперировать данными бизнес-терминами.” - Тоноян С. А.

Важнейшим элементом ХД является семантический слой - механизм, позволяющий аналитику оперировать данными посредством бизнес-терминов предметной области. Семантический слой дает пользователю возможность сосредоточиться на анализе и не задумываться о механизмах получения данных.

5. Основные требования к хранилищу данных.

Требования:

    высокая скорость получения данных из хранилища;

    автоматическая поддержка внутренней непротиворечивости данных;

    возможность получения и сравнения срезов данных;

    наличие удобных средств для просмотра данных в хранилище;

    обеспечение целостности и достоверности хранящихся данных.

6. Свойства хранилища данных.

    Проблемно-предметная ориентация. Данные объединяются в категории и хранятся в соответствии с областями, которые они описывают, а не с приложениями, которые они используют.

    Интегрированность . Данные объединены так, чтобы они удовлетворяли всем требованиям предприятия в целом, а не единственной функции бизнеса.

    Некорректируемость . Данные в хранилище данных не создаются: то есть поступают из внешних источников, не корректируются и не удаляются.

    Зависимость от времени . Данные в хранилище точны и корректны только в том случае, когда они привязаны к некоторому промежутку или моменту времени.

Хранилище данных - предметно-ориентированный, интегрируемый, неизменяемый и поддерживающий хронологию набор данных, предназначенный для обеспечения регламентированных и управленческих решений. Основные свойства:

    ориентированность

Хранилище данных разрабатывается с учетом специфики области, а не аналитической платформы, где его будут использовать. Другими словами: данные объединяются в категории и хранятся в соответствии с областями, которые они описывают, а не с приложениями, которые они используют. Структура должна отражать представление информации, с которой работает аналитик. Предметная ориентация позволяет хранить в ХД только те данные, которые необходимы для средств анализа, что существенно сокращает затраты на носители информации и повышает безопасность доступа к данным.

2) интеграция

требуется обеспечить возможность загрузки информации из различных источников, поддерживающих различные форматы данных.

    единые правила именования объектов

    единые единицы измерения для однотипных объектов

    единое физическое представление

    единое представление атрибутов и т.д.

3) принцип неизменчивости - в хранилище возможно только добавление и чтение данных.

4) поддержка хронологии - точное и единое представление о временной привязке всех данных.

На рынке существует множество Business Intelligence решений, которые, как правило, решают одну задачу - построить корпоративную отчетность, или, иными словами, reporting. Грубо говоря, они выступают заменителями Microsoft Excel. Кстати, Excel тоже можно отнести к инструментам BI, поэтому те, кто работал с данными в Excel, строил графики и т.п., отчасти - BI разработчики. А если вам еще необходимо было собирать требования на построение отчета, подключаться к базам данных и использовать Pivot в Excel, то вы точно можете считать себя BI разработчиком.

К сожалению, Excel имеет ограниченный функционал и не подходит крупным организациям (Enterprise), поэтому существует отдельный класс BI приложений от именитых вендоров, таких как Oracle, SAP, IBM и другие. Для того чтобы лучше разбираться в основных игроках BI-рынка, можно ознакомиться с ежегодными результатами крупнейших аналитических агентств, таких как Gartner или Forrester . Каждый год они публикуют список лидеров и указывают их сильные и слабые стороны. Если вам когда либо придется выбирать для своей компании BI инструмент, то необходимо начинать именно с этого.

Давайте определимся: что же такое BI инструмент? Это решение, которое создано специально для людей, не знающих и не понимающих, как работают базы данных (им в принципе это и не нужно). Эти люди сосредоточены на бизнес-процессах, и они привыкли работать с удобными для них наименованиями, такими как «Доход», «Номер договора», «Ставка» и т.п. Им совершенно всё равно, откуда берутся данные, как они хранятся или как рассчитывается тот или другой показатель. Им нужно решение, с помощью которого они смогут получить быстрый ответ на свой бизнес-вопрос, например «Сколько телефонов было продано в прошлом месяце?» или «Какой самый популярный продукт в линейке продуктов?». BI приложение имеет удобный интерфейс, в котором бизнес-пользователь может легко «накидать» (используя drag and drop) необходимые поля, и построить отчет. Затем он легко сохраняет свой отчет и отправляет коллегам.

Прежде чем изучать любой BI продукт, необходимо понять из чего он состоит:

  • Коннектор к данным - это может быть ODBC, JDBC или любой другой драйвер, который позволяет подключаться к базам данных или к обычным «плоским» файлам;
  • Семантический слой - сердце любого BI инструмента, здесь происходит вся магия. Если по-простому, то семантический слой - прослойка между технически сложными вещами, такими как «база данных», «таблица», «соединение» и бизнес-объектами, с которыми будет работать пользователь.
  • Бизнес-объекты - непосредственно сами показатели и атрибуты, для построения отчетности.

Таким образом, когда бизнес пользователь хочет получить ответ на свой бизнес-вопрос, он просто накидывает объекты, нажимает кнопочку «обновить отчет» и получает необходимые данные для работы. Когда человек накидывает объекты, создается SQL, MDX которые отправляется в базу данные, (конечно если у нас в качестве источника данных - база данных или куб), дальше база данных отправляет результат в кеш BI приложения, чтобы пользователь мог работать, выстраивая графики и отчеты.



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: