我对《红楼梦》的研究,可以说是始于对作品的捺字点数,事情的起因,是陈炳藻先生1980年6月在威斯康星大学召开的首届国际《红楼梦》研讨会上宣读的论文,那篇《从词汇上的统计论〈红楼梦〉的作者问题》认为,《红楼梦》的后四十回也是由曹雪芹所写。这个结论与大家阅读《红楼梦》的感受相异,而且胡适与鲁迅在二十世纪二十年代就已做过考证,结论都是后四十回并非出自曹雪芹之笔,几十年来人们一般也都接受这两位大家的主张。可是陈炳藻先生的“新论”是借助于计算机的统计,在二十世纪八十年代初,计算机在国内还是一般人接触不到的稀罕物,当时报上又以“计算机闯入大观园”之类的标题做宣传,人们一下子闹不清是怎么回事,对后四十回为何人所作的问题也变得疑疑惑惑,要知道这次出场的是大家当时还感到比较神秘,且又属于高科技的计算机,仿佛是它将后四十回的著作权判给了曹雪芹。
得知这一消息时,我还是复旦大学数学系的学生,也上过与计算机相关的课程,因此知道计算机的运算,其实是依赖于操纵者编制的程序,因此在探讨陈炳藻先生的“新论”是否靠谱时,计算机并不是需要质疑的对象,问题的关键在于研究者的设想及其操作的手段。阅读陈炳藻先生的论文,发现有几个要害处难以令人信服,其中包括母体与样本的设定,以及统计时只从《红楼梦》中抽取了6万字,检验的指标也只有14个,等等。
1982年3月,人民文学出版社出版了以庚辰本为底本且与诸本校勘的《红楼梦》,这对从语言学角度做统计提供了可靠的版本。1983年,我开始了对《红楼梦》的统计工作,统计对象是全书的72万余字,而非6万字,检验指标近80个而非14个,其中包括虚字、句长与作者习惯使用的专用词汇。这项工作历时一年多,其中大部分时间是在对《红楼梦》捺字点数。计算机在国内开始普及是二十世纪九十年代中期的事,我在八十年代初时的统计只能靠手工操作。第一步工作是点清作品各回的字数。第一次点完不放心,又做第二次复校。如果某回二次点数结果不一致,那就得点第三次乃至第四次。准确地掌握了作

最后编辑:2022年04月22日 ©著作权归作者所有

发表评论