“简单举一个例子,比如‘东坡’二字,在历史典籍里随时会出现,只有在作为主语和宾语,而且谓语为人可以施行或者接受的动作的时候,我们才可以大体判定这里的‘东坡’是指人。”
“因此‘与东坡同醉’,这样的语句我们可以粗判为与苏轼有关,而‘醉于东坡’,东坡不是宾语,我们就让程序认为与苏轼无关。”
“当然也有两可之间的,例如‘东坡有田’,这一类语句就还需要扩展判定,这底下涉及到一整套的句法分析逻辑。”
“最后我们会得到这么一批和苏轼有关的子标签,还有一批与其关联较为紧密的关系人,比如这里的‘苏洵’,‘苏辙’,‘王弗’,‘宋仁宗’,‘曹太后’,‘章惇’等。”
“我们暂时先屏蔽掉这类人物标签,仅通过之前的‘轼’,‘子瞻’,‘东坡’三个标签来确定子标签,开始在文库当中检索。”周至熟练地操作和讲解道:“看,最终我们就会得到几千条与苏东坡有关的资料。”
“当然了,我给几位老师展示的是以前的项目,这是运算后的结果,具体的真实运算过程还是需要一些时间的,不可能这么快。”
“在这几千条记录当中,我们可以分作几类。”周至一敲键盘,数千条记录,分出了好几种颜色。
“一类是包含时间的,一类是包含地点的,一类是包含官职的。”周至再一敲键盘,三类数据开始重新排列聚合:“我们根据苏轼的职官、任职地变化,宋史年号,用字用号的变化等等,便能够将这数千条记录排出一个《苏东坡行状》,并在此基础上排出一个《东坡轶事汇编》。”
“这两本书对于研究苏东坡生平履历,职官履历,朋友,亲友,政治盟友与政敌,思想理念等等,都具有非常重要的意义,是非常好用的工具书。”
“现在我们已经完成了这两步工作,正在分析《苏东坡全集》中的诗词,以确定其诗词的创作时期。”
“比如他的《赠刘景文》,我们可以从他的章奏和笔记中看出,他是在哲宗元佑五年,在任杭州时认识的,在元佑五年苏轼曾经向朝廷奏报已经五十八岁的刘景文,称许他为‘慷慨奇士’,结合诗歌环境,应该是作于元佑五年秋末冬初。”
“诸如此类的分析函数有很多,我们甚至有了许多新的发现。他的《和子由黾池怀旧》,诗歌的背景,在检索资料当中就显得一目了然。”
“苏辙十九岁被委任为黾池,不过并未就任就中了进士,随后改任,因此怀旧