序列比对(18)重复匹配问题的补充说明
- 2019 年 10 月 7 日
- 筆記
前文介绍了重复匹配问题的动态规划算法,但是遗留了重复结果输出的问题。本文对该问题进行了补充说明。
前文《序列匹配(五)——重复匹配问题的动态规划算法》介绍了重复匹配问题的动态规划算法。


但是这个公式在回溯时会出现重复结果输出的问题,比如:


校正公式和代码


这样的公式目前还没有出现重复结果输出的问题:



相应的代码放在了文末。
对比对总长度的估计




实现代码
#include <stdio.h> #include <stdlib.h> #include <string.h> #include <math.h> #define MAXSEQ 1000 #define GAP_CHAR '-' #define UNALIGN_CHAR '.' #define max2(a, b) ((a) > (b) ? (a) : (b)) // 对空位的罚分是线性的 struct FUnit { int W0; // X{i-1}不参与联配 int* Wj; // 跳转到A(i - 1, j) int nj; // Wj数组的大小 float M; // F(i,0)的值 }; typedef struct FUnit* pFUnit; // 00000001 F(i, 0) + s(i, j) // 00000010 是否往左回溯一格 // 00000100 是否往左上回溯一格 // 00001000 是否往上回溯一格 struct AUnit { int Wi; // 不同的bit代表不同的回溯方式 float M; }; typedef struct AUnit* pAUnit; float gap = -2.5; // 对空位的罚分 float match = 5; float unmatch = -4; void strUpper(char *s); float maxArray(float *a, int n); float getFScore(char a, char b); void printFAlign(pFUnit* f, pAUnit** a, const int i, char* s, char* r, char* saln, char* raln, int n, int flag); void printAAlign(pFUnit* f, pAUnit** a, const int i, const int j, char* s, char* r, char* saln, char* raln, int n); void align(char *s, char *r, float t); int main() { char s[MAXSEQ]; char r[MAXSEQ]; float t; printf("The 1st seq: "); scanf("%s", s); printf("The 2nd seq: "); scanf("%s", r); printf("T (threshold): "); scanf("%f", &t); align(s, r, t); return 0; } void strUpper(char *s) { while (*s != '