第七节、信息语言的最高境界
信息语言的最高境界就是向自然语言学习,向自然语言看齐
随便看看我们身边的信息世界,任何一个信息标的(一本书、一句话、一份文件、一部电影等等)
都能用不到十个单词的标题表达。一种语言的单词也就几万个,全世界的自然语言都是用的单词组配法,
这种组配法只用自身的不变或少变就应付了人类社会几千年的信息增量。现在的信息词条是原始单词的
多少亿亿倍,原始的单词也没见增加几个。如果把自然语言的单词归类演变成有序的分类代码,这些
代码就不但可以表达或组配表达一个信息标的,而且可以排序。这就是信息语言的最高境界。
所以,信息标检工具不需要全列举,只需要半列举,把有组配意义的素项类集排序就可以了。在进行
信息标检的时候,对非素项的标的,用素项的组配来标识就可以了。有组配功能的素项工具书可以以
不变应万变,以少变应多变。本来可以简单做好的事,让显示学问高深的全列举分类法搞得庞大复杂。
对自然语言的借鉴,还表现在对语法的借鉴,语法成分有主语、谓语、宾语、定语、状语、补语。
用信息语言标引一个信息标的和用自然语言说一句话用的实词的单词量几乎是一样的,两者的差
别仅仅是自然语言的主语和谓语不一定在句首,而信息语言要求主语和谓语一定在句首。再把自然语
言的主要句子成分定语按重要性格式化排列在主语谓语之后,用信息语言基本上就可以表达自然语言了。
例如,自然语言:1987年上海永久牌折叠自行车的价格。如果用信息语言表示,
第一步,先给自然语言的实词赋分类号值:⑤1987年是时间定语:1987; ④上海是空间定语:
2100(上海的邮编代码); ③永久牌是品牌定语:YJ; ①折叠自行车是主语,分类号并主题词是:
R732 : ZD;②价格是谓语,分类号是:V12。
第二步,把赋值的分类号按重要性格式化排列:
①主语(分类号) | ②谓语(分类号) | ③品牌 | ④空间定语 | ⑤时间定语 | ⑥实用编码 |
R732 : ZD | V12 | YJ | 2100 | 1987 | 该自行车自身编码 |
如果把信息标检的格式化简易化,可以用斜杠:“/”代表格式:
R732 : ZD / V12 / YJ / 2100 /1987/(……)
结论:可以用信息语言的素项的组配来标识自然语言。