关于合体字的拆分原则是5个:书写顺序、取大优先、兼顾直观、能连不交、能散不连。
1、书写顺序,就是按照平常大家的书写顺序,依次拆开汉字。例如“新”字取码的顺序应该是“立,木,斤”,不能取“木,立,斤”,也不能是“立,斤,木”。“和”字只能取“禾,口”,不能取“口,禾”。这个比较好理解。
2、取大优先,也叫做“优先取大的字根”。按“书写顺序”给汉字编码时,要尽可能采用笔画多的字根。要以“再添一个笔画,便不能构成字根”为限度,每次都以那个“尽可能大”的字根,即“尽可能笔画多”的笔画结构作为字根编码。例如“世”字可以取为“一,凵,乙”也可以取“廿,乙”。根据这条规则取“廿,乙”的拆分方法。有时,有的笔画既可以摆在前面的字根,也可以放在后面的字根,就要放在前面。俗称“尽量往前凑”。例如“秦”字,既可取“一,夫,禾”也可取“三,人,禾”,根据此规则,应当用后者。
3、兼顾直观,就是在确认字根时,为了使字根特征明显易辩,有时就要“牺牲”“书写顺序”和“取大优先”的原则,形成个别例外的情况。例如“国”字,按书写顺序,应取“冂,王,丶,一”,但这样编码,不但有悖于该字的字源,也不如使字根“囗”直观易辩。我们只好违背“书写顺序”,按“囗,王”的顺序编码。再如“戋”字,按取大优先,应取“二,匕,丶”,但没有取“一,戈”直观,所以取后者。
4、能连不交,就是当一个字既可以视作“相连”的几个字根,也可视作“相交”的几个字根时,应取“相连”的。因为一般来说,“连”比“交”更为“直观”,更能显现字根的笔画结构特征。例如“天”字,取“一,大”两个五笔字根,而不取“二,人”两个字根。
5、能散不连,就是说,在拆分时,如果汉字能拆分成散结构的字根,就不要拆分成连的字根。例如“主”字按取大优先,应取“亠,土”,但根据此规则,只能取“丶,王”;再例如,“天”字,可拆成“一,大”也可以拆分成“二,人”,按照此规则,要拆分成“一,大”为好。