已经按照markdown格式重新改写和发布,

    按照这个标题搜进来的各位是不是以为这也是和课本一样的内容呢,其实这是我看了两天课本才理解出来的内容啊,绝对和课本不一样。

    课本上LR(1)项目集族的构造内容如下:

以S′→·S,#属于初始项目集中,把'#'号作为向前搜索符,表示活前缀为γ(若γ是有关S产生式的某一右部)要归约成S时,必须面临输入符为'#'号才行。我们对初始项目S′→·S,# 求闭包后再用转换函数逐步求出整个文法的LR(1)项目集族。具体构造步骤如下:

 (1) 构造LR(1)项目集的闭包函数。

 a)假定I是一个项目集, I 的任何项目都属于CLOSURE(I)。

 b) 若有项目 A→α·Bβ,a 属于CLOSURE(I),B→γ是文法中的产生式,β∈V*,b∈FIRST(βa), 则 B→·γ,b 也属于CLOSURE(I)中。

 c) 重复b)直到CLOSURE(I)不再增大为止。

    大家是不是看的一头雾水呢。课本上还给出了一个例子:

文法G'为:
    (0)S'->S
    (1)S->aAd
    (2)S->bAc
    (3)S->aec
    (4)S->bed
    (5)A->e
    之后直接给出了这个文法的LR(1)项目集规范族:
I0:S'->·S,#
        S->·aAd,#
        S->·bAc,#
        S->·aec,#
        S->·bed,#
    I1:S'->S·,#
    I2:S->a·Ad,#
        S->a·ec,#
        A->·e,d
    I3:S->b·Ac,#
        S->b·ed,#
        A->·e,c
    I4:S->aA·d,#
    I5:S->ae·c,#
        A->e·,d
    I6:S->bA·c,#
    I7:S->be·d,#
        A->e·,c
    I8:S->aAd·,#
    I9:S->aec·,#
    I10:S->bAc·,#
    I11:S->bed·,#

大家是不是在想I5中A->e·,d后的d、I7中A->e·,c后的c是怎么来的呢?

    课本的答案是对的,但是写法很是让我们一头雾水,下面让我们来看看答案是怎么出来的:

less 向前查找 向前搜索符_搜索

1.一开始,绿框处S'是整个句子,所以后面理所当然跟句子结束符#。然后S后面是‘ε’(就是什么都没有)所以β=ε,接着逗号后面是‘#’即a=#,这样FIRST(βa)=FIRST(ε#)={#}。这就是I0中S后面#号的来历。

2.在I2中,如红线所示,在I2:S->a·Ad,#中A的后面是d,所以FIRST(d#)={d}(就是“d#”的第一个终结符d),所以接下来A的后面跟的是d。

3.在确定了A的逗号后面的搜索符后,基本上就可以直接照搬下去了,如图中的紫线所示。(其实#号一直都在照搬来着,大家注意到没?)

 

    下面再讲一点FIRST(β)的计算。

1.如果β的第一个字符是终结符,如:

β=aAbbC
β=eBbbD
那么FIRST(β)=FIRST(aAbbC)+FIRST(eBbbD)={a}+{e}={a,e};   (‘+’代表‘并’,那个符号不好打,用‘+’来代替了。
)

2.如果β的第一个字符是非终结符,如:

β=AEbC
A=DBac
D=ε
B=ea
B=bd
E=ε
那么:
FIRST(β)=FIRST(AEbC)
=FIRST(FIRST(A)EbC)
=FIRST(FIRST(DBac)EbC)
=FIRST(FIRST(FIRST(D)Bac)EbC)
=FIRST(FIRST(εBac)EbC)        (ε表示空,如果不是空,就结束了,但是空还要计算ε后面的Bac)
=FIRST(FIRST(εBac)EbC)+FIRST(FIRST(Bac)EbC)
=FIRST(εEbC)+FIRST(FIRST(Bac)EbC)
=FIRST(FIRST(E)bC)+FIRST(FIRST(Bac)EbC)
={εbC}+FIRST(FIRST(Bac)EbC)
={bC}+FIRST(FIRST(FIRST(ea)ac)EbC)+FIRST(FIRST(FIRST(bd)ac)EbC)        (由于B有两个推导式,所以分开来写并求并集,‘+’代表‘并’)
={b}+FIRST(FIRST(eac)EbC)+FIRST(FIRST(bac)EbC)
={b}+FIRST(eEbC)+FIRST(bEbC)
={b}+{e}+{b}
={e,b}

为了普遍性,我把β搞的复杂了点,多看几遍,你就会了。如果不会,在下面留言。我可是看了两天才看懂的。