СЕМАНТИКА СООБЩЕНИЙ В ТЕЛЕКОММУНИКАЦИОННЫХ СИСТЕМАХ В.Я. Цветков Московский государственный университет геодезии и карто...
31 downloads
251 Views
451KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
СЕМАНТИКА СООБЩЕНИЙ В ТЕЛЕКОММУНИКАЦИОННЫХ СИСТЕМАХ В.Я. Цветков Московский государственный университет геодезии и картографии 105064, г. Москва, Гороховский пер., д. 4
Аннотация. В статье рассмотрены семантические аспекты сообщений. Показано, что семантика сообщений не может быть описана математической теорией связи, а также теорией информации, которая построена на математической теории связи как основе. Показано, что семантика сообщений является сложным механизмом, связанным с
необходимостью
введения
и
использования
ряда
понятий,
таких
как:
информационные объекты и информационные единицы, носитель информации, смыслоразличительные и формально различительные критерии, а также целого ряда терминов из лингвистики и философии применительно к специфике сообщения как сложной системы и полисемического объекта.
1
Введение Процессы передачи сообщений в телекоммуникационных системах качественно отличаются от процессов сбора и получения информации. При сборе чаще всего получают «что получится» или «что возможно», при передаче сообщений передают то, «что необходимо». Другими словами, в информационном обмене используют только формализованные информационные единицы. Одной из основных теорий, применявшихся при передаче информации, оставалась математическая теория связи, разработанная К.Э.Шенноном [22]. Недостатком математической теории связи (МТС) Шеннона [22] является отсутствие ряда ключевых понятий и их использования, которое впоследствии при написании на этой основе теории информации (ТИ), привело к стиранию различия между содержательностью сообщений и их объемом. Впоследствии эта теория легла в основу одного из направлений теории информации, что привело к неверной трактовке понятия количество информации [4]. Для
анализа
семантики
сообщения
важно
различать
содержательность
сообщения (СодСоб) и его информационную емкость. Для этого необходимо ввести понятие носителя информации [4, 7], которое отсутствует в МТС и как следствие в ТИ, написанной на этой основе. Следует отметить, что, используя опыт Хартли [21], который безуспешно пытался
отобразить
семантику
сообщения
двоичным
кодом,
Шеннон
четко
разграничил проблему передачи информации и ее содержательности. Это он сформулировал четкой фразой о том, что «семантические проблемы информации не релевантны техническим проблемам связи» [22]. Таким образом, он отнес семантику сообщений за рамки своей теории, что фактически имеет место для всей теории информации, написанной не этой основе. Это означает, что смысловое содержание сообщений или содержательность сообщения как объект исследования и анализа в этих теориях отсутствуют. Однако через 20 и более лет ряд исследователей стали использовать подход Шеннона для измерения количества информации как семантической величины, что является заблуждением и ошибкой [2].
2
Основная модель Шеннона (а также вышедших в это же время работ Р. Фишера и Н. Винера) - вероятностная модель множества состояний в который находится получатель сообщения и характеризует она неопределенность, т.е. «незнание». Это незнание он характеризует, заимствованным у Клаузиса и Болцмана понятием энтропии. Уменьшение незнания при получении сообщения Шеннон называет количество информации. Это количество измеряется как разность энтропий. Так, если получатель находится в состоянии полной неопределенности (неограниченное множество состояний), вероятность отдельного состояния его близка к нулю. Энтропия тоже близка к нулю. Если получено одно достоверное сообщение (вероятность равна 1), то неопределенность полностью исчезает, но энтропия также равна нулю. Важным понятием для семантики сообщений, которое Шеннон не включил в свою теорию, является понятие носителя информации. Кроме того, для анализа семантики необходимо вводить в рассмотрение образующее информационного объекта. Также
понятием понятие
необходимо говорить о смыслоразличительных
критериях анализа сообщений о смысле и значении смысла. При анализе сообщения как информационного объекта необходимо выделять и разграничивать понятия «носителя сообщения» и содержательность сообщения». Необходимо рассматривать смысловые уровни содержательности сообщения. Напомним, что содержательность сообщения может находиться на идеальном уровне (идея), формальном (формализованная запись), и материальном (физический сигнал) [16]. Носитель информации (носитель сообщения) есть информационный объект, основной функцией которого является хранение или передача содержательности сообщения. Передача сообщения приводит как к уменьшению неопределенности (незнания), так и к повышению информированности (увеличению знания). Эти два подхода не противоречат, а дополняют друг друга. Но Шеннон рассмотрел только первый подход.
3
Основной (но не единственной) характеристикой носителя информации является информационная емкость. Именно эту величину определяет Шеннон с помощью разности энтропий. Это отмечается в современных монографиях, например [8]. Таким образом, передача сообщения в теории Шеннона определяет некий информационный объем, который получает пользователь и который может содержать (или не содержать) смысловые значения. Количеством информации называть такую величину некорректно, поскольку этот объем не связан с содержательностью сообщения. Например отсканированное изображение листа формата А4 имеет одинаковый объем, независимо от количества символов и слов на этом листе или при их полном отсутствии. Информационная емкость — максимально возможное количество условных единиц характеризующих данный вид сообщения, которое может вместить данный носитель информации. Этими единицами могут быть биты, символы кода, клетки таблиц, слова в машинных командах или в тексте, пиксели на изображении, перфокарты и т.п. Носитель может находиться на формальном и материальном уровнях. Отсюда вытекает первое различие. Содержательность сообщения может находиться на трех уровнях (идеальном, формальном, материальном), а носитель только на двух (формальном, материальном). Чистая перфокарта, перфолента, чистый магнитный диск представляют собой только носитель информации, имеющий определенную информационную емкость. Перфорация на перфокарте или перфоленте, запись на магнитном диске не изменяет их информационной емкости, но содержит семантику, т.е. содержательную часть или сведения. Содержательная
часть связана с символами, кодом (языком), с правилами
кодирования, декодирования и интерпретации. Кодирование и декодирование присутствуют в МТС и соответствующей ей теории информации, но интерпретация остается вне рамок данной теории. Интерпретация связана с критериями смыслоразличения. Одним из средств смылоразличения в кодовых сообщениях являются флажковые знаки. В обычном
4
тексте это пробелы, знаки препинания, а также порядок слов в предложении. В разговорной речи и звуковых сообщениях роль флажковых знаков исполняют паузы между словами, интонация, сила звука. Семантический анализ сообщений возможен при построении механизма разложения сообщения на части, имеющие семантические характеристики. Таким механизмом может являться система семантических информационных единиц (СИЕ) [4, 7, 17, 18, 19]. Такими единицами в тексте являются символ (знак в узком смысле слова), слово, предложение, фраза (как совокупность связанных предложений). Эти СИЕ характеризуются разными смысловыми характеристиками. Говоря о семантике информационных единиц, необходимо рассмотреть более широкое понятие информационной единицы [7].
5
1. Информационные единицы Информационной единицей IU (Information unit) в широком смысле называют некое подмножество информационного множества IS (Information set), разделенное по заданным критериям или качественным признакам Qa (Qualitative attribute). Разделение возможно в ширину, когда единицы дополняют друг друга
IS = U IUi Где i=1...n, n — число единиц Допустимым является случай n=1, когда само множество и является информационной единицей. Разделение возможно в глубину, когда единицы нижнего уровня вложены в единицы верхнего уровня. Информационная единица, включающая более простые, называется сложной или составной. Например, для трех уровней Единицы IUtl верхнего уровня (top level) связаны с единицами IUal среднего уровня IUtli = ∑ IUalik Где k=1... nali, nali — число единиц среднего уровня, соответствующих i-ой единице верхнего уровня. Единицы IUalik среднего уровня (Average level) связаны с единицами IUbl нижнего уровня (bottom level) IUalk = ∑ IUblkj Где j=1... nblk, nblk — число единиц среднего уровня, соответствующих k-ой единице верхнего уровня Кроме того, возможны комбинации обеих подходов. Таким образом, зависимости от выбора метода разбиения и при множестве критериев
6
в
разбиения
возможны разные построения информационных единиц. Это в целом создает неоднозначность применения информационного подхода. Информационной единицей в узком смысле называют информационный объект или информационную модель, обладающий свойством неделимости по какому-либо критерию. Поскольку информационный объект обладает множеством признаков, значений и критериев делимости, то возможен широкий выбор
различных
информационных единиц. Совокупности связанных информационных единиц (информационных моделей) могут образовывать различные системы. Наиболее известными и часто используемыми являются системы классификации. Выбор для построения информационных единиц процедур стратификации и свойства транзитивности приводит к иерархической системе. Если для построения единиц выбрать свойств самоподобия и транзитивности, то приходим к фрактальным структурам. Выбор для построения единиц описаний проблемной среды (событий, явлений, состояний), приводит к понятиям фреймов и слотов. Если для построения единиц выбрать обобщенные системно-структурные описания, то приходим к понятиям системы, подсистемы и элементов системы. Выбор для
построения единиц коммуникационного
аспекта приводит
к
следующим информационным единицам: сообщение, фраза предложение, слово символ. Сообщение является информационной единицей верхнего уровня, остальные входят в его состав. Можно и далее продолжать подобный ряд построений информационных единиц.
7
2. Семантические информационные единицы Семантические информационные единицы — это единицы, рассматриваемые в аспекте
семантической содержательности. Выделяют
следующие семантические
информационные единицы [4, 7, 17. 18]: символ, слово, предложение, фраза. Символ
—
информационная
единица, обладающая
неделимостью
по
структурному признаку. Символ, это атомарный объект на который может быть поделен фрагмент теста. Как самостоятельный объект символ
– формальное
обозначение, которое выступает либо как представитель другого предмета, явления, действия, либо отражает самого себя. Символ не имеет смыслового значения, а является носителем информации. Слово – информационная единица, обладающая неделимостью по смысловому признаку. В тексте слово – предельная смысловая составляющая сообщения (предложения), способная непосредственно соотноситься с предметом отражения и указывать на него; вследствие этого слово приобретает определенные смысловые свойства. Слово минимальная единица текста, имеющая смысловое значение. Однако слово характеризуется сигнификативным смысловым значением и возможностью изменения, что влечет изменение смысла в определенных пределах. Поэтому смысл слова как независимого информационного объекта и смысл слова в предложении может различаться. Слово – сигнификативно неделимая информационная единица. Предложение –
информационная
единица, обладающая неделимостью по
смысловой совокупности связанных слов и выражающая законченную мысль. Предложение –
представляет собой предикативное словосочетание, поэтому имеет
предикативное смысловое значение. Предложение
– предикативно неделимая
информационная единица. В отличие от слова для ряда предложений представляется возможность проверки их на истинность. Это возможно за счет использования свойства предикации. Предикация –
отношение содержания сообщения к действительности,
осуществляемая в предложении (в отличие от словосочетания).
8
Фраза (фразеологическая единица) – информационная единица, обладающая неделимостью по связанности предложений и выражающая законченную мысль. Фраза – информационная единица сообщения, обладающая максимальной смысловой содержательностью. Для фразы и предложения смысловое содержание дополняется Предложение
в
составе
фразы
может
обладать
свойством
контекстом.
антецедентности
(ассоциативности), т.е. соотносится по смыслу с предыдущим (другим) предложением. Последнее приводит к появлению в предложении ассоциативных связей с другими предложениями или мыслимыми объектами. Это дополнительно наполняет данную информационную единицу ассоциативным смысловым содержанием. Сообщение, содержащее фразы, может нести максимальную смысловую нагрузку В таблице 1 приведены основные информационные единицы с указанием критерия их делимости и основного значения. Термин основное значение обусловлен внутренней неоднозначностью информационных объектов и полисемией понятий, вытекающей из этого [4] . Таблица 1. Делимость информационных единиц Часть сообщения
Критерий делимости
Основное значение
Знак
Структура
Собственное
Слово
Смысл свободная форма
Сигнификативнное
Предложение
Смысл связанное
Предикативное
словосочетание Фраза
Фразеологическая связь
Фразеологически связанное
Обобщенной информационной единицей является знак. Это многозначное понятие, поскольку знаком можно обозначать символ или закодировать слово, предложение, фразу, ситуацию. Поэтому при анализе используют более конкретное понятие - символ, понимая под этим структурную составляющую слова. Важным является распределение информационных единиц и по смысловым характеристикам. Именно они являются одним из главных критериев формального определения информационных единиц. 9
В таблице 2 приведены основные информационные единицы, разделенные по смысловым характеристикам. Таблица 2. Смысловые характеристики информационных единиц Часть
Смысловой
Морфология
Контекст 1
Контекст 2
сообщения
уровень
Знак
0
-
-
-
Слово
1
+
-
-
Предложение
2
+
+
-
Фраза
3
+
+
+
Семантика
Ассоциации
Целесообразно сравнение или сопоставление различных единиц в сообщениях. В таблице 3 приведены основные информационные единицы, выраженные
через
информационную единицу слово Таблица 3. Смысловые характеристики информационных единиц, выраженные через информационную единицу слово Часть сообщения
Выражение
Символ
Словесный знак
Слово
Морфема
Предложение
Словесное выражение
Фраза
Словесное окружение Следует
отметить
различие
между
смыслом
и
значением
смысла
информационных единиц. Смысл является более общим понятием, а значение смысла его реализацией Символ смысла не имеет, а служит строительным материалом для создания более сложных СИЕ. Он является элементарным носителем информации. Совокупность символов образует более сложную СИЕ - слово и приобретает новое качество 10
Слово может иметь множество смысловых значений, что определяется его формой, отношением к различным областям и связью с другими словами в предложении. Слово имеет основное сигнификативное значение и ряд других значений в зависимости от сочетания с другими словами и формой изменения слова. Для слова может иметь место полисемия и неоднозначность смысловых значений. Это создает неопределенность, те есть ситуацию которую рассматривал Шеннон. Эта неопределенность устраняется путем формирования более сложных информационных единиц. Предложение как совокупность СИЕ - слов приобретает новое качество. Эта СИЕ обладает свойством предикативности. Т.е появляется возможность проверки содержательности данной СИЕ с помощью методов логики или других видов анализа. Совокупность СИЕ - предложений образует фразу и приобретает новое смысловое качество контекст. Это создает возможность замены некоторых слов их «заместителями» местоимениями, аббревиатурой, условными символами
и др.
Делается это для уменьшения информационной емкости содержательной части сообщения и для облегчения процесса интерпретации сообщения. Полисемия информационных единиц возникает как результат обозначения информационной единицей, например, словом разных объектов или отнесение слова к разным областям. Так для термина «Информация» словарь Вебстер дает 17 разных определений [20]. Полисемия создает неопределенность, которая устраняется не только как у Шеннона количеством передаваемых символов и слов, но и качественным анализом смысла в сложных СИЕ: предложениях и фразах. Предикативность СИЕ предложения позволяет осуществлять его проверку на истинность Контекст фраз позволяет выявлять объекты и среду, в которой они находятся, осуществлять связь между ними и интерпретировать эту связь (гештальт [4. 7, 12, 13]). Таким образом, содержательность сообщений определяется набором СИЕ и наличием нескольких смысловых уровней.
11
3. Сообщение как сложная информационная единица Характеристика
сложный (англ. compound, complex, фр. compose, нем.
zusammen-gesetzt) в качестве синонимов имеет значения «составной», «аналитический» [1]. Эта характеристика означает, что данный объект состоит более чем из одной части или более чем из одного более простого объекта. Сложная информационная единица — информационная единица, состоящая из нескольких более простых по уровням сложности информационных единиц. Для информационного сообщения такими информационными единицами (по иерархии) являются фраза, предложение, слово, символ. Сообщение, как и информация [4], модель [10, 11] и знак [12, 16], является многозначным понятием. В зависимости от сферы приложения (генетика, живая природа, теория электромагнитной связи, человеческое общение, информационные технологии) оно может существенно изменять смысловое значение. Поэтому необходимо уточнять область, к которой относится сообщение, подлежащее изучению Для теории связи и информатики можно дать следующее определение. Сообщение - формализованное выражение, состоящее из символов (знаков), имеющее синтаксическую и семантическую характеристики. Кроме того, сообщение может иметь прагматическую характеристику. Но эта характеристика
определяется
получателем сообщения. Что ценно для одного получателя может не иметь ценности для другого. Сообщение (как информационная единица) — информационный объект, включающий носитель информации и содержательную часть (содержательность), пригодный для
хранения, обработки, передачи, представления информации.
Сообщение может содержать кодовый знак, кодовое слово, предложение, фразу, совокупность фраз. Семиотическая модель сообщения включает синтаксис (правила кодирования, декодирования и интерпретации), семантику (содержание, сообщения), прагматику (полезность сообщения). Сообщение направлено от отправителя к получателю по некому каналу связи, поэтому необходимо говорить таком свойстве как направленность сообщения при
12
изучении конкретных сообщений. Сообщение — организованная, систематизированная совокупность, поэтому оно может быть рассмотрена как сложная система, имеющая части, элементы, связи. В ряде работ (некоторые области семиотики, теория связи) признается только два уровня знаковых систем: уровень наблюдения (конкретный, материальный или называемый еще как-либо иначе) и уровень конструктов (абстрактный, идеальный и т.п.). В научном познании имеет место выделение не менее двух уровней исследования, отображаемых формальными системами (уровень наблюдения – уровень представления) или (абстрактный уровень - материальный уровень) При этом абстрактных уровней может быть любое количество, а материальный только один. Однако при таком подходе не выделяют формальный уровень. С этой точки зрения знаки и знаковые сообщения относятся к абстрактному уровню: знак есть идеальное. При передаче знак и знаковое сообщение как идеальное лишь воплощается, проявляется в материальном передаваемом сообщении явлении. Знаковое сообщение в этом смысле смешивается с объективно существующим материальным носителем информации и свойства идеального знака «как конструкта» переносятся, экстраполируются на материальное передаваемое сообщение. Наличие неограниченного количества абстрактны уровней приводит к тому, что сообщение может иметь несколько смысловых значений (скрытый смысл). Это дает основание говорит о нескольких уровнях смысла сообщения и его частей. Сообщение описывается с помощью различных моделей. Поэтому необходимо рассматривать модели сообщений. Сообщение связано с кодом в узком смысле слова и языком в широком смысле. Основные
функции сообщения – хранение, передача
и представление
информации. Характеристики сообщения при этом формируются для его оптимального хранения, передачи и представления. В системах передачи сообщений кодовые слова, или кодовые комбинации, преобразуются в сигналы, передаваемые по каналу связи. При этом каждому символу кода должен соответствовать свой, и только свой, элементарный сигнал. В теории связи, теории информации и информатике сообщение может быть
13
рассмотрено как информационная единица или совокупность информационных единиц. В некоторых источника утверждается, что Message is the information materialized (Сообщение есть материализация информации). Так ли это? По нашему мнению это неточность. Сообщение в общем виде полисемическое понятие [16] как и информация [4]. Оно конкретизируется для областей рассмотрения и специальных условий его применения. Поэтому важной характеристикой связанной с сообщением является носитель сообщения. Собственно носитель и материализует сообщение, превращая его из абстрактного объекта (формальная модель) в реальный объект (физическая модель). Только сообщение на материальном носителе и есть материализация информации. 3.1. Основные характеристики сообщения При передаче сообщений необходимо выделить: отправителя, получателя, среду передачи информации и передаваемый объект. Отправитель - объект или субъект, обладающий информацией пригодной для передачи. Информация, пригодная для передачи, - это интерпретируемая
человеком
информации, размещенная на неком информационном носителе. Получатель - объект или субъект, имеющий информационную потребность и располагающий средствами приема информации для передачи. Кроме того, необходимо выделить следующие объекты: источник, оригинал; передаваемый объект; полученный объект. В отдельных случаях это может быть один объект, но в общем случае это разные объекты. Объекты и основные характеристики сообщения образуют его окружение, которое отображено на рис. 1. Сообщение передается на определенном носителе, который всегда имеет информационную емкость. Эта информационная емкость может быть формальной и физической при записи сообщения на материальный носитель. Сообщение содержит определенные элементы и связи между этими элементами. Сообщение образуют информационные единицы сообщения (ИЕС). Это символы
14
(буквы и цифры), слова, предложения, фразы. Каждая из них имеет свои характеристики.
Емкость Носитель
Связи
Сообщение
Смысл
ИЕС
Язык
Форма Код
Рис. 1. Окружение сообщения Сообщение представляет собой формализованную информацию и имеет определенную
форму
представления,
например
текстовую,
передачи
кодируется,
аудиальную
или
визуальную. Как
правило,
сообщение
для
это
приводит
к
необходимости использования определенного кода. Кроме того, исходное сообщение может быть записано на каком-то языке. Информационные единицы могут оцениваться с помощью различных мер. Простейшие из них – меры физического объема и информационной емкости Мера
измерения
или
оценки
сообщения
может
быть
объемной
и
содержательной. Мера измерения объема или информационной емкости сообщения достаточно простая. Она выведена Шенноном. Мера содержательности сообщения закодированного кодами второй и третей категории [4, 16] может быть различной, что 15
определяется неопределенностью
заложенной
этими кодами
и
возможностью
различной интерпретации сообщений. Мера объема сообщения информационная емкость контента. Мера содержательности сообщения закодированного кодами первой категории однозначно определяется возможностью интерпретации совокупности кодовых знаков в сообщении. Она измеряется их смысловыми характеристиками и отношениями между ними. Для условных знаков топографических карт и планов эти отношения определяются пространственными отношениями. Объем носителя сообщения не зависит от содержательности. Это определяется выбором алфавита кода, и методом кодирования. В человеческом общении особую роль играет смысл информации, то есть семантический аспект. Наиболее важным в сообщении является смысловая нагрузка или смысл сообщения. Именно для передачи смысла создается и передается сообщение. Как информационная единица сообщение имеет следующие характеристики: интерпретируемость, структурированность, связность, наличие физического объема, наличие информационная емкость в условных единицах, наличие меры, наличие знаний, семиотические характеристики, отношение релевантности. Интерпретируемость сообщения состоит в возможности восприятия
и
смыслоразличения элементов сообщения человеком непосредственно или с помощью специальных систем декодирования и дешифрирования. По этому признаку различают непосредственно и опосредственно интерпретируемые сообщения [4, 16]. Первые это сообщения, воспринимаемые и интерпретируемые человеком за счет его знаний и интеллекта. Интерпретация (от лат. interpretatio - толкование, объяснение) - совокупность значений, придаваемых тем или иным способом элементам какой либо теории или понятия.
Интерпретируемость
может
быть
характеризована
как
соответствие
представления сообщения оригиналу. По мере возрастания уровня абстракции моделей [15] ее интерпретируемость, становится все менее очевидной. Однако при этом возрастает переносимость применения данной модели сообщения. Примером служит кодовый знак. Кодовый знак
16
кода 3 [16] имеет максимальный уровень абстракции, но не имеет самостоятельной смысловой нагрузки. Структурированность сообщения состоит в возможности вложения в него разных информационных единиц. Для сообщений как информационных единиц возможна рекурсивная вложимость. Каждая информационная единица может быть включена в состав другой. Связанность сообщения определяется свойством
установления связей и
отношений различного типа между элементами сообщениями. Она может быть антецедентной или ассоциативной. Связанность дает возможность установления пространственных и временных отношений, а также отношений, определяющих порядок
выбора
информационных
единиц,
отношения
устанавливающие
совместимость или несовместимость. Отношение
релевантности
характеризовать смысловую отношением
сообщений.
Ассоциативные
связи
могут
близость информационных единиц. Эту связь называют
релевантности
для
информационных
сообщений.
Отношения
релевантности при работе с сообщением позволяет сравнивать разные сообщения безотносительно к способам кодирования, а
по смысловым характеристикам и
содержательности знаний. Сообщение как сложная информационная единица может быть рассмотрено как информационный ряд. Одной из причин неоднозначность в интерпретации
сообщений является
информационная нечеткость или возможность их представления с помощью разных информационных
рядов.
Статистический
информационный
ряд
уменьшает
неопределенность приемника. Семантический информационный ряд увеличивает его знание. 3.2. Три основные качества сообщения Как информационная единица сообщение должно выполнять функции носителя полезной информации и потенциального источника получения знаний. Особенность сообщения как объекта передачи информации состоит в наличии в нем трех качеств:
17
идеального, формального и материального. На рис. 2.приведены три соответствующих качественных уровня, через которые проходит информационное сообщение Исходная идея (знание) формализуется и записывается на формальный носитель информации. При этом у сообщения появляется формальный информационный объем (например, в количестве символов).
Идеальный уровень
Исходная идея
Запись на формальном носителе
Формальный уровень
Закодированное сообщ ение на материальном носителе
Материальный уровень
Декодированная запись на формальном носителе
Формальный уровень
Интерпретированная идея
Идеальный уровень
Рис. 2. Качественные уровни при передаче сообщений Затем для передачи по физическому каналу связи это сообщение записывается на материальный носитель информации. При этом у сообщения появляется физический информационный объем (например, в килобайтах или мегабайтах). Оба эти объема дополняют друг друга как характеристики сообщения. На рис. 3. приведены три качества сообщения, обусловленные прохождением сообщения через три качественных уровня (рис. 2). Таким образом, сообщение содержит знания, формализованные выбранной
системы
(формализованная
формализации.
модель)
преобразуется
18
Это в
формализованное материальный
с помощью сообщение
объект
путем
дополнительного кодирования и записи на материальный носитель.
Сообщение как объект коммуникации Сообщение как объект формализации
Сообщение как идея
Формальный носитель нинформации Материальный носитель информации
Рис. 3. Три качества информационного передаваемого сообщения Три составляющих сообщения требуют всестороннего анализа. Однако теория информации, построенная на работах К.Э Шеннона [27] имеет дело только с одним качеством сообщения — сообщения как объекта коммуникации, записанного на материальный носитель. Рисунок 3 позволяет подчеркнуть различие между понятием информация и данные. Информация содержит элемент идеального и может быть, а может и не быть формализована и материализована. Данные связаны с объектом и
материальным
носителем сведений о нем. То есть данные всегда формализованы и, как правило, материализованы. Рисунок 3 позволяет подчеркнуть различие между понятием сообщение и сообщение для передачи Сообщение служит средством любого общения (непосредственно человеческого, технического). При человеческом общении используется идеальная
и формальная
компоненты сообщения (рис.3). При передачи сообщения возникает необходимость
19
материализации сообщения и использовать материальную компоненту. 3.3. Три основные функции сообщения Сообщение как информационная единица имеет отличительные особенности. При изучении окружающего мира функционирует следующая схема. Окружающий мир → система восприятия → информация (данные). Система восприятия = [прибор] + [технология] + человек. Данные результат фиксации информации о внешнем мире. После получения данных с ними производят различные манипуляции: упорядочение, организацию, анализ. И только после этого формируют сообщение. Таким образом, как информационная единица сообщение содержит упорядоченную организованную информацию. Следует выделить три основные функции сообщения по степени их важности: семантическую, лингвистическую и коммуникационную. Семантическая функция состоит в том, что сообщение содержит смысл, смысловое значение, идею, знание. Лингвистическая функция сообщения заключается в том, что сообщение является элементом одного или нескольких языков. Коммуникационная функция состоит в том, что сообщение переносит информацию и является частью системы Отправитель → система связи → получатель. Подчеркнем, что используем более широкое понятие система связи, а не канал связи [22], как в теории связи. Канал связи является пассивным и односторонним. По существу он подвергается только внешним воздействиям в виде помех или умышленных попыток проникновения.
20
Система
связи
является
многоканальной,
причем
каналы
могут
быть
качественно разными. Кроме того, система связи может иметь обратную связь, что повышает надежность передачи сообщений. Коммуникационная функция сообщения требует наличия материального носителя информации или материального носителя сообщения. В системе
«Отправитель →
система связи
→ получатель» сообщение
реализует следующий процесс Идея → форма →материализация → форма → идея. При коммуникации выполняются разные функции, а не просто передача информации как трактует теория связи. Коммуникационная функция сообщений реализует три качественно разных процесса: передачу информации, копирование, клонирование. Эти процессы связаны с оригиналом и результатом передачи. Копирование соответствует случаю передачи смыслового значения и правил его интерпретации. При этом получатель имеет некую свободу. Это имеет место при обучении, например танцам, игре на музыкальных инструментах, правописанию. Результат передачи играет в основном ту же роль, что и оригинал. Клонирование означает полное соответствие между оригиналом и результатом передачи. Оно возможно в информационном поле и нарушает закон хиральной чистоты [4]. 3.4. Сообщение как коммуникационный объект Существует
связь
между
потребностью
(П1)
деятельностью
(Д),
необходимостью решения новых задач или новых решений (НР) и новой потребностью (П2). П1 → Д → НР → П2 В различных видах деятельности возможность решения новых задач или
21
достижения поставленных задач возможна лишь за счет новой информации и новых знаний.
Это порождает
информационную
потребность, которая
может
быть
удовлетворена разными коммуникационными методами, включая и механизм сообщений. Таким образом, сообщение может быть рассмотрено как коммуникационный объект,
удовлетворяющий
информационную
потребность
и
устраняющий
информационную асимметрию. Особенность этого процесса в том, что "потребность" - это абстракция (идеальный объект), а не материальный объект или действие. Сообщение содержит три уровня: идеальный, формальный и материальный. Идеальная потребность выступает как причинный фактор получения знаний, который порождает коммуникационную потребность как материальный фактор. Коммуникационная
потребность
порождает
движение
информационных
объектов, содержащих смысловую нагрузку. Это движение осуществляется в материальном поле. Сообщение является носителем идеи (знания) и одновременно объектом коммуникации. Это определяет дополнительную функцию сообщения – хранения
функцию
сведения или знаний. Для осуществления этой функции сообщение
передается и хранится на материальных носителях. 3.5. Сообщение как представление Семантическая сущность информации, циркулирующей в человеко-машинных системах, как в любых искусственных системах, проявляется через человека. Сущность информации, заложенной в сообщении, также проявляется через человека. Отсюда вытекает важность представления сообщения. Любое представление формируется на основе понимания функции, значения представляемого предмета или явления. В основе представления лежит чувственнообразная модель сообщения, соединяющая в себе чувственно-непосредственный и абстрактно-всеобщий моменты индивид, знания. Такое свойство сообщения является посредником между непосредственно-
22
индивидуальным
восприятием
объектов
действительности
и
их
понятийной
сущностью. Осуществляемое в научном познании "наглядное" моделирование чувственно не воспринимаемых объектов и процессов также является формой, в которой понятая сущность представляется нам. Таким образом, представление связано с чувственным восприятием субъекта и должно быть ориентировано на него. По аналогии с представлением знаний, которое дает Д.А.Поспелов [3] можно выделить два основных способа представления сообщений:
интенсиональный, в виде схемы связей между признаками объекта, описываемого в сообщении.
экстенсиональный, с помощью конкретных фактов (объекты, примеры)
Интенсиональные представления реализуются посредством операций над значениями атрибутов и не предполагают произведения операций над конкретными информационными фактами (объектами). В свою очередь, экстенсиональные представления связаны с описанием и фиксацией конкретных объектов из предметной области и реализуются в операциях, элементами которых служат объекты как целостные системы Приведенные два подхода представления сообщений имеют прямое приложение в теории распознавания образов. Образ - это визуальная разновидность сообщения. Методы распознавания образов в сообщениях можно классифицировать на:
интенсиональные методы, основанные на операциях с признаками.
экстенсиональные методы, основанные на операциях с объектами.
Итенсиональные методы в качестве разновидности включают лингвистические методы. Если вспомнить основы семиотики Пирса, в частности его подход к онтологии и феноменологии; то их основу составляет его учение о трѐх универсальных категориях качества, отношения и репрезентации. Исходя из этого, представление сообщения определяется как феномен третьей категории по Пирсу. Сообщение связывает три качества (идею, форму и материальною реализацию). В узком смысле, сообщение как представление (репрезентамен) представляет объект, к 23
которому отсылает, и, так называемую интерпретанту; которая связывает в значение сообщения с методом его интерпретации. Рассматривая представление сообщений с позиций человеческого восприятия, необходимо отметить следующее. Человек при восприятии сообщений пользуется двумя механизмами мышления. Один из них — возможность работать с абстрактными цепочками символов, с которыми связаны некоторые семантические и прагматические представления, а именно: умение работать с текстами в самом широком смысле этого слова. Такое мышление можно было бы назвать символическим или алгебраическим. Форму семантической репрезентации сообщений этого вида часто называют вербальной. Другой механизм мышления — способность работать с чувственными образами и представлениями об этих образах. Такие образы обладают куда большей ассоциативностью и интегрированностью, чем символические представления. Но они и значительно более расплывчаты, менее логичны, чем то, что скрывается за элементами, которыми оперирует алгебраическое мышление. Однако без них мы не могли бы отображать в нашем сознании окружающий мир в той полноте, которая для нас необходима. Способность работать с чувственными образами (со зрительными образами) определяет то, что можно назвать геометрическим образным восприятием сообщения. Образная репрезентация сообщения — это форма хранения информации в памяти о наглядных образах в пространстве и времени или форма хранения сенсорных компонентов, сенсорного опыта, приобретенного в прошлом. 3.6. Направленность и виды сообщений Передача
сообщения (message passing)
- последовательность действий,
реализующая направленное распространение информации из одного
источника в
другие. Как правило, в одноканальных системах передача очередного сообщения из некоторого источника может осуществляться каждый раз после завершения передачи предыдущего сообщения. Передача сообщений включает совокупность фаз: первичное кодирование,
24
вторичное кодирование, преобразование (в сигнал), передачу,
прием сигнала,
преобразование (сигнала в код), обработку (декодирование). Действия, осуществляемые приемником в случае получения сообщения, называются обработкой сообщения. Обработка сообщения является отдельной фазой процесса передачи информации. В одноканальных системах связи передатчик и не посылает, а приемник не принимает никакие сообщения до завершения очередной фазы. При передаче сообщений возможны следующие виды сообщений. Прямое сообщение (direct message) - сообщение, поступающее от отправителя к получателю посреднических агентов. Пустое сообщение (empty message) - сообщение, которое не содержит смысловой нагрузки и, вследствие этого, не изменяет информационную асимметрию в системе отправитель - получатель (О-П) или не переводит получатель из одного состояние в другое и не увеличивает знание получателя. Содержательное сообщение - сообщение, которое содержит смысловую нагрузку и, вследствие этого, изменяет информационную асимметрию в системе О-П или переводит получателя сообщения из одного состояние в другое, или увеличивает знания получателя. Избыточное сообщение - сообщение, которое содержит смысловую нагрузку, но, тем не менее, не изменяет информационную асимметрию в системе О-П и не переводит получателя из одного состояние в другое, не увеличивает знания получателя Сообщение минимальной длины
– сообщение, имеющее минимальный
информационный объем среди группы сообщений равного смыслового содержания. 3.7. Уровни формирования и использования сообщения В теории коммуникации сообщение выполняет основную функцию передачи некого физического объема данных, содержащих сведения или идеи. Направление передачи сообщения – от приемника к получателю. Этим передача отличается от распространения, которое может быть и нецеленаправленным. Характеристики сообщения формируются в первую очередь для возможности его передачи по выбранному каналу связи. Уровни
25
формирования и использования
сообщения приведены на рис. 4.
Идеальный уровень 1
Формальный уровень 1
Формальный уровень 2
Формальный уровень 3
Формальный уровень 4
Материальный уровень 1
Материальный уровень 2
Материальный уровень 3
Формальный уровень 5
Формальный уровень 6
Идеальный уровень 2
Рис. 4. Уровни формирования и использования сообщения
26
Сущность передачи сообщения состоит в переходе от «идеального» к «формальному», от «формального» к «материальному» и затем в обратном порядке. В схеме (рис. 4) осуществляется передача знания или идей. На «идеальном уровне 1» осуществляется формирование или возникновение идеи, передаваемой в сообщении. Затем
следуют
формальные
уровни.
На
этих
формальных
уровнях
осуществляется формализация идеи. На формальном уровне 1 осуществляется создание формальной системы, необходимой для описания идеи. На формальном уровне 2 происходит создание формального инфологического описания идеи. Это описание может быть неполным и нецелостным. В нем могут быть не детализированы некоторые фрагменты. По существу это совокупность «черных» и «белых» ящиков. На формальном уровне 3 происходит создание многоуровнего смыслового значения сообщения. На формальном уровне 4 происходит создание формального логического описания. По существу это «белый» ящик. Следующий этап характеризуется материальными уровнями. На материальном уровне 1 происходит кодирование или запись сообщения на материальный носитель информации. На
материальном уровне 2 происходит передача сообщения, в ходе
которого сообщение может меняться вследствие помех. На материальном уровне 3 осуществляется прием сообщения. На формальном уровне 5 интерпретация сообщения. На формальном уровне 6 осуществляется анализ глубины смысловых значений сообщения. На «идеальном
уровне 2»
осуществляется
анализ идеи из принятого
сообщения. Следует отметить, что формализация и наличие формальных уровней служат инструментом форморазличимости для объектов сообщения. Это является основой для последующей интерпретации сообщения и анализа его семантики. При интерпретации используется важная функция формализации – качественное выявление содержания через форму, что требует введения критериев смыслоразличимости.
27
3.8. Носитель сообщения Все информационные сообщения, передаваемые по физическим каналам связи, включают носитель информации и содержательную часть. При этом носители информации и содержательная часть могут быть разными. Носитель информации: бумага,
магнитный
носитель,
оптический
носитель,
ген,
сообщение,
сигнал
радиодиапазона, сигнал оптического диапазона и др. Для передачи сообщения в более широком смысле используют формальный или материальный носитель. Сообщение как сложная информационная единица включает более мелкие информационные единицы сообщения (ИЕС). Это символы (буквы и цифры), слова, предложения, фразы. Каждая из них имеет свои характеристики. Между этими ИЕС в сообщении существует определенная связь, которая может носить явный характер, например, при помощи знаков (препинания) или не явный контекстный. Как следует из предыдущего раздела, передача сообщения осуществляется на материальном уровне. Это происходит с использованием носителя сообщения, схема которого приведена на рис. 5.
Носитель сообщения Сообщение Носитель элемента
Носитель связей между элементами
Носитель элемента
Элемент сообщения
Связи прямые
Элемент сообщения
Связи контекстные
Рис. 5. Носитель сообщения 28
Сообщение имеет информационную емкость также как и носитель сообщения. Поэтому для записи сообщения информационная емкость носителя должна быть не меньше информационной емкости сообщения. Сообщение передается поэлементно, поэтому каждый элемент сообщения имеет свой носитель. Например, отдельная буква или символ являются носителями элемента сообщения. Эти буквы образовывают слова и предложения, которые несут смысл и это составляет
сущность
и
ценность
сообщения. Между элементами
сообщения
существуют связи, которые позволяют объединять и разделять элементы сообщения для передачи смысла. Если
эти связи прямые, то есть выражены
явно, то они увеличивают
информационную емкость и требуют ее на носителе, для их записи также требуется элементарные носители. Если связи скрытые, то они не требуют специального носителя. Таким образом, носитель сообщения представляет собой совокупность материального и формальных носителей. 3.9. Смысловые уровни сообщения Смысловые уровни сообщения задаются его информационными единицами и собственно содержательностью сообщения. Иерархически информационные единицы сообщения образуют следующую связь: текст (имеется в виду полный текст документа или сообщения); фраза (часть текста, например, абзац); предложение; слово; символ (рис. 6). Каждая из вышестоящих единиц включает нижестоящие. Эта иерархия характеризуется типам связей между соседними уровнями. Каждая связь нижнего уровня дополняет связь информационной единицы верхнего уровня. Так, например, в тексте существует контекстная, предикативная, синтаксическая и сигнификативные — связи.
29
ИЕС
Связи
Текст Контекстная
Фраза Антецедентная
Предложение Синтаксическая
Слово Сигнификация
Символ Рис. 6. Информационные единицы сообщения Слово образуется из символов и приобретает сигнификативное значение. В предложении оно согласуется с другими членами предложения и связывается с ними синтаксически. Предложение имеет предикативное значение. Во фразах и в тексте целом могут появляться контекстные связи. Информационные
единицы
сообщения
образуются
на
основе
деления
сообщения на составляющие по разным признакам. Это делимость структуры, делимость по смыслу и по другим критериям. Информационные единицы сообщения являются семантическими единицами и подробно описаны в разделах 1 - 2. Отметим здесь только следующее. Возможны любые комбинации символов, которые можно считать словами. Поэтому в общем случае слово, как совокупность символов, может и не нести смысла. Для таких слов существует понятие «знаковое слово».
Знаковое
слово
(unmotvated
word)
слово,
не
имеющее
выраженной
(эксплицитной) формы, не мотивированной слово. Этим подчеркивается еще раз, что
30
знак не несет смысловой нагрузки. Совокупность слов в предложении
имеют предикативное значение. Это
значение имеет и совокупность предложений составляющих абзац - фразу. Однако, как и слово, предложение само по себе содержит элемент обобщения или абстракции. Можно отметить, что некоторые предложения не содержат полный смысл и требуют для их интерпретации других предложений. Совокупность предложений, не требующая иных предложений, образует фразу. Фраза -
актуализованная информационная единица сообщения, для которой
существует антецедентная связь. Фраза содержит контекст, который связывает отдельные предложения общим смыслом. Этот же контекст и связывает отдельные фразы в общий текст. На практике полное смысловое сообщение может состоять из одной фразы и из предложения. Все рассмотренные информационные единицы за исключением символа можно назвать семантическими, поскольку они содержат смысловую нагрузку. Для информационных единиц существует понятие значения и признака. Значение — актуализованная интерпретация информационной единицы. Признак — формальное выражение значения информационной единицы или информационного объекта, ее смыслоразличительная характеристика. Например, часто предложение выражает предикацию и состоит из нескольких связанных слов. Предикация в данном случае играет роль признака предложения. Предикация - отнесение содержания или предмета к действительности, осуществляемое в предложении (в отличие от словосочетания) Например, Информация (была) будет передана в отличие от переданная информация. Предикативность, синтаксическая категория, формирующая предложение; относит содержание предложения к действительности и тем самым делает его единицей сообщения. Предикат (от лат. praedicatum — сказуемое), в узком смысле — то же, что свойство; в широком смысле — отношение, т. е. свойство нескольких предметов. В логике предикат — пропозициональная функция, т. е. выражение с неопределенными терминами (переменными), при выборе конкретных значений для этих терминов преобразующееся в осмысленное (истинное или ложное) высказывание
31
Информационные единицы могут иметь обобщенное значение, например «стол». Для конкретизации ИЕС применяют актуализацию. Актуализация действительностью
информационной и
ее
единицы
конкретизация
на
этой
-
соотнесение основе.
Это
ИЕС
с
соотнесение
осуществляется включением данной ИЕС в совокупность других, которые уточняют ее значение и смысл. Уточнение осуществляется введением и использованием явных и неявных (контекстных) связей. Но этим не исчерпываются смысловые уровни сообщения. Известны понятия: Эксплицитный - имеющий открытое выражение. Имплицитный - подразумеваемый невыраженный. Эти понятия применимы к сообщению, и поэтому можно говорить о разных смысловых его значениях. Смысл выражения сообщения. Смысл несобственный. Смысл образный. Смысл обычный. Смысла оттенки. Смысл переносный. Смысл прямой. Смысл собственный. Смысл фигуральный. Смысл скрытый. Смысл явный и т.д. Для нас важно иметь в виду стратификацию смыслового значения сообщения на одно явное смысловое значение и совокупность скрытых смысловых значений. Например, считалось, что библия содержит 7 уровней смыслового значения. Первый - явный доступен всем, умеющим читать, остальные только посвященным, соответствующего уровня. Таким образом,
семантика сообщений является сложным механизмом,
связанным с необходимостью введения и использования ряда понятий, таких как: информационные объекты и информационные единицы, носитель информации, смыслоразличительные и формально различительные критерии, а также целого ряда терминов из лингвистики и философии применительно к специфики сообщения как сложной системы и полисемического объекта. В рамках теории связи такой подход не нашел места и требует специального рассмотрения в аспекте новой теории — семантической теории информации.
32
Литература
1.
Ахманова О.С. Словарь лингвистических терминов. – М.: КомКнига,
2007. – 576 с. 2.
Большая Советская Энциклопедия / 3-е издание в 30 томах. – М.: Сов
энциклопедия, 1969 – 1978 гг 3.
Искусственный интеллект. −В 3-х кн. Кн.2. Модели и методы:
Справочник / Под ред. Д.А. Поспелова. −М.: Радио и связь, 1990. −340с. 4.
Иванников А.Д., Тихонов А.Н., Цветков В. Я. Основы теории
информации - М.: МаксПресс, 2007. –356 с. 5.
Кондаков Н.И. Логический словарь – М.: АН СССР, Наука, 1971 – 656с.
6.
Монахов С.В., Савиных В.П., Цветков В.Я. Методология анализа и
проектирования сложных систем. - М.: Просвещение, 2005. - 264 с. 7.
Седякин В.П., Цветков В.Я. Философия информационного подхода. –
М.: МАКС Пресс, 2007. – 220 с. 8.
Хелд Г. Технологии передачи данных. 7-изд. - СПб.: Питер, 2003. -
9.
Цветков В.Я. Семиотический подход к построению моделей данных в
720с. автоматизированных информационных системах // Геодезия и аэрофотосъемка. – 2000. – , №5, – с. 142 –145 10.
Цветков В.Я. Информационные модели и информационные ресурсы //
Геодезия и аэрофотосъемка. – 2005. – №3. – с. 85 –94. 11.
Цветков В.Я. Модели и моделирование. – М.: МИИГАиК,
«Госинформобр», 2006. – 94 с. 12.
Цветков В.Я. Кодирование в информационных технологиях. –. М.:
МИИГАиК, «Госинформобр». 2006. – 88 с. 13.
Цветков В.Я. Информация и теория информации. -. М.: МИИГАиК,.
2006. - 123 с. 14.
Цветков В.Я. Введение в теорию информации. - М.: МаксПресс, 2007. –
115 с.
33
15.
Цветков В.Я. Извлечение знаний для формирования информационных
ресурсов. –. М.: МИИГАиК. 2006. – 158 с. 16.
Цветков В.Я. Модели в информационных технологиях. – М.: Макс Пресс
2006 –104 с. 17.
Цветков В. Я. Анализ сообщений. – М.: МИИГАиК,. 2006. - 140 с
18.
Цветков В. Я. Семантика информационных единиц // Успехи
современного естествознания // 2007. - №10.- с. 103-104. 19.
Цветков В. Я. Информационные единицы сообщений // Фундаментальные
исследования. - 2007, - №12. - с.123 - 124. 20.
Цветков В. Я. Семантика геоинформационных единиц / Материалы 4-й
Международной конференции «Геопространственные технологии и сферы их применения» Москва 12-13 марта - М.: Информационное агентство «Гром», 2008 с.69-71 21.
Merriam-Webster's Collegiate(r) Dictionary. – 2006. Merriam-Webster,
Incorporated 22.
Hartley R.V.L. "Transmission of Information," Bell System Technical Journal,
July 1928, Pg. 535 – 541. 23.
C.E. Shannon, (1948), "A Mathematical Theory of Communication", Bell
System Technical Journal, vol. 27, pp. 379–423 & 623–656, July & October, 1948.
34