HDiffPatch
HDiffPatch copied to clipboard
优化流式diff的结果大小
当前用roll hash的匹配方案实现了流式diff,速度ok;但输出大小没有尝试优化,可以选择放弃一些速度。
可能的方向: 1. 选择更多个可能的匹配位置,当前的实现只测试了可能最长的2个hash值位置; 2. 得到的cover线可以尝试向2边延长;3. 优先特殊匹配最前和最后位置优化速度 4. 可能考虑link线的合并是否有效? 5. 现在匹配时用的贪心算法,可以考虑优先处理更长的匹配位置?
用-b来表达需要更好(better)的结果,以更长diff时间为代价; 即 -s[-b][-matchSize] 来设置