FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA0815, 1229 aa 1>>>pF1KA0815 1229 - 1229 aa - 1229 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.5334+/-0.00147; mu= 19.7508+/- 0.088 mean_var=293.7718+/-53.793, 0's: 0 Z-trim(110.2): 270 B-trim: 0 in 0/51 Lambda= 0.074829 statistics sampled from 11130 (11420) to 11130 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.667), E-opt: 0.2 (0.351), width: 16 Scan time: 5.140 The best scores are: opt bits E(32554) CCDS41237.1 MEGF6 gene_id:1953|Hs108|chr1 (1541) 7722 849.5 0 CCDS10213.2 MEGF11 gene_id:84465|Hs108|chr15 (1044) 2348 269.1 4.2e-71 CCDS4142.1 MEGF10 gene_id:84466|Hs108|chr5 (1140) 2331 267.3 1.6e-70 CCDS30892.1 PEAR1 gene_id:375033|Hs108|chr1 (1037) 2154 248.1 8.4e-65 CCDS78055.1 MEGF10 gene_id:84466|Hs108|chr5 ( 567) 1288 154.2 8.7e-37 CCDS43905.1 NOTCH1 gene_id:4851|Hs108|chr9 (2555) 1077 132.5 1.3e-29 CCDS32232.1 FBN1 gene_id:2200|Hs108|chr15 (2871) 1062 131.0 4.2e-29 CCDS12326.1 NOTCH3 gene_id:4854|Hs108|chr19 (2321) 975 121.4 2.6e-26 CCDS12196.1 FBN3 gene_id:84467|Hs108|chr19 (2809) 948 118.7 2.1e-25 CCDS34222.1 FBN2 gene_id:2201|Hs108|chr5 (2912) 932 117.0 7.2e-25 CCDS55265.1 MATN2 gene_id:4147|Hs108|chr8 ( 937) 894 112.0 7.1e-24 CCDS55264.1 MATN2 gene_id:4147|Hs108|chr8 ( 956) 894 112.0 7.1e-24 CCDS83309.1 MATN2 gene_id:4147|Hs108|chr8 ( 915) 830 105.1 8.4e-22 CCDS74370.1 LTBP4 gene_id:8425|Hs108|chr19 (1557) 804 102.7 7.6e-21 CCDS74368.1 LTBP4 gene_id:8425|Hs108|chr19 (1587) 804 102.7 7.7e-21 CCDS74369.1 LTBP4 gene_id:8425|Hs108|chr19 (1624) 804 102.7 7.8e-21 CCDS45564.1 SCARF1 gene_id:8578|Hs108|chr17 ( 569) 778 99.1 3.3e-20 CCDS11007.1 SCARF1 gene_id:8578|Hs108|chr17 ( 830) 778 99.4 3.9e-20 CCDS46666.1 SCARF2 gene_id:91179|Hs108|chr22 ( 866) 773 98.9 5.8e-20 CCDS13779.2 SCARF2 gene_id:91179|Hs108|chr22 ( 871) 773 98.9 5.8e-20 CCDS14048.1 SCUBE1 gene_id:80274|Hs108|chr22 ( 988) 770 98.7 7.8e-20 CCDS9831.1 LTBP2 gene_id:4053|Hs108|chr14 (1821) 730 94.8 2.1e-18 CCDS5138.1 LAMA2 gene_id:3908|Hs108|chr6 (3122) 712 93.3 1e-17 CCDS6811.1 TNC gene_id:3371|Hs108|chr9 (2201) 667 88.2 2.6e-16 CCDS44647.1 LTBP3 gene_id:4054|Hs108|chr11 (1303) 648 85.7 8.2e-16 CCDS8103.1 LTBP3 gene_id:4054|Hs108|chr11 (1256) 620 82.7 6.5e-15 CCDS53599.1 SCUBE2 gene_id:57758|Hs108|chr11 ( 807) 598 80.0 2.7e-14 CCDS2789.1 LAMB2 gene_id:3913|Hs108|chr3 (1798) 588 79.5 8.5e-14 CCDS46762.1 FBLN2 gene_id:2199|Hs108|chr3 (1184) 571 77.3 2.5e-13 CCDS46761.1 FBLN2 gene_id:2199|Hs108|chr3 (1231) 571 77.4 2.5e-13 CCDS14069.1 FBLN1 gene_id:2192|Hs108|chr22 ( 683) 551 74.8 8.5e-13 CCDS14067.1 FBLN1 gene_id:2192|Hs108|chr22 ( 703) 547 74.4 1.2e-12 CCDS4800.1 SCUBE3 gene_id:222663|Hs108|chr6 ( 993) 542 74.1 2e-12 CCDS81553.1 SCUBE2 gene_id:57758|Hs108|chr11 ( 999) 542 74.1 2e-12 CCDS43028.1 FBLN1 gene_id:2192|Hs108|chr22 ( 566) 538 73.2 2e-12 CCDS9499.1 ITGBL1 gene_id:9358|Hs108|chr13 ( 494) 537 73.0 2.1e-12 CCDS14068.1 FBLN1 gene_id:2192|Hs108|chr22 ( 601) 538 73.3 2.1e-12 CCDS13112.1 JAG1 gene_id:182|Hs108|chr20 (1218) 542 74.2 2.2e-12 CCDS54345.1 LTBP1 gene_id:4052|Hs108|chr2 (1342) 540 74.1 2.7e-12 CCDS33178.2 LTBP1 gene_id:4052|Hs108|chr2 (1395) 540 74.1 2.7e-12 CCDS1857.1 EFEMP1 gene_id:2202|Hs108|chr2 ( 493) 532 72.5 3e-12 CCDS33177.2 LTBP1 gene_id:4052|Hs108|chr2 (1721) 540 74.3 3e-12 CCDS30551.1 AGRN gene_id:375790|Hs108|chr1 (2045) 540 74.4 3.3e-12 CCDS73594.1 ITGBL1 gene_id:9358|Hs108|chr13 ( 445) 517 70.8 8.8e-12 CCDS8116.1 EFEMP2 gene_id:30008|Hs108|chr11 ( 443) 513 70.3 1.2e-11 CCDS54784.1 NPNT gene_id:255743|Hs108|chr4 ( 582) 510 70.2 1.7e-11 CCDS7797.2 SCUBE2 gene_id:57758|Hs108|chr11 ( 971) 512 70.8 1.9e-11 CCDS33502.1 LAMA5 gene_id:3911|Hs108|chr20 (3695) 517 72.3 2.5e-11 CCDS34732.1 LAMB4 gene_id:22798|Hs108|chr7 (1761) 511 71.2 2.7e-11 CCDS482.1 TIE1 gene_id:7075|Hs108|chr1 (1138) 507 70.4 2.9e-11 >>CCDS41237.1 MEGF6 gene_id:1953|Hs108|chr1 (1541 aa) initn: 9206 init1: 7264 opt: 7722 Z-score: 4524.0 bits: 849.5 E(32554): 0 Smith-Waterman score: 8335; 87.9% identity (88.3% similar) in 1225 aa overlap (38-1131:146-1366) 10 20 30 40 50 60 pF1KA0 GLAALWCLGLLGGLARVAGTHYRYLWRGCYPCHLGQAGYPVSAGDQ-RPDVDECRTHNGG ::: : : . . ::::::::::: CCDS41 QQPDEEGCLSAECSASLCFHGGRCVPGSAQPCHCP----PGFQGPRCQYDVDECRTHNGG 120 130 140 150 160 170 70 80 90 100 110 120 pF1KA0 CQHRCVNTPGSYLCECKPGFRLHTDSRTCLAINSCALGNGGCQHHCVQLTITRHRCQCRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 CQHRCVNTPGSYLCECKPGFRLHTDSRTCLAINSCALGNGGCQHHCVQLTITRHRCQCRP 180 190 200 210 220 230 130 140 150 160 170 180 pF1KA0 GFQLQEDGRHCVRRSPCANRNGSCMHRCQVVRGLARCECHVGYQLAADGKACEDVDECAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 GFQLQEDGRHCVRRSPCANRNGSCMHRCQVVRGLARCECHVGYQLAADGKACEDVDECAA 240 250 260 270 280 290 190 200 210 220 230 240 pF1KA0 GLAQCAHGCLNTQGSFKCVCHAGYELGADGRQCYRIEMEIVNSCEANNGGCSHGCSHTSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 GLAQCAHGCLNTQGSFKCVCHAGYELGADGRQCYRIEMEIVNSCEANNGGCSHGCSHTSA 300 310 320 330 340 350 250 260 270 280 290 300 pF1KA0 GPLCTCPRGYELDTDQRTCIDVDDCADSPCCQQVCTNNPGGYECGCYAGYRLSADGCGCE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 GPLCTCPRGYELDTDQRTCIDVDDCADSPCCQQVCTNNPGGYECGCYAGYRLSADGCGCE 360 370 380 390 400 410 310 320 330 340 350 360 pF1KA0 DVDECASSRGGCEHHCTNLAGSFQCSCEAGYRLHEDRRGCSPLEEPMVDLDGELPFVRPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 DVDECASSRGGCEHHCTNLAGSFQCSCEAGYRLHEDRRGCSPLEEPMVDLDGELPFVRPL 420 430 440 450 460 470 370 380 390 400 410 420 pF1KA0 PHIAVLQDELPQLFQDDDVGADEEEAELRGEHTLTEKFVCLDDSFGHDCSLTCDDCRNGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 PHIAVLQDELPQLFQDDDVGADEEEAELRGEHTLTEKFVCLDDSFGHDCSLTCDDCRNGG 480 490 500 510 520 530 430 440 450 460 470 480 pF1KA0 TCLLGLDGCDCPEGWTGLICNETCPPDTFGKNCSFSCSCQNGGTCDSVTGACRCPPGVSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 TCLLGLDGCDCPEGWTGLICNETCPPDTFGKNCSFSCSCQNGGTCDSVTGACRCPPGVSG 540 550 560 570 580 590 490 500 510 520 530 540 pF1KA0 TNCEDGCPKGYYGKHCRKKCNCANRGRCHRLYGACLCDPGLYGRFCHLTCPPWAFGPGCS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 TNCEDGCPKGYYGKHCRKKCNCANRGRCHRLYGACLCDPGLYGRFCHLTCPPWAFGPGCS 600 610 620 630 640 650 550 560 570 580 590 600 pF1KA0 EECQCVQPHTQSCDKRDGSCSCKAGFRGERCQAECELGYFGPGCWQACTCPVGVACDSVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 EECQCVQPHTQSCDKRDGSCSCKAGFRGERCQAECELGYFGPGCWQACTCPVGVACDSVS 660 670 680 690 700 710 610 620 630 640 650 660 pF1KA0 GECGKRCPAGFQGEDCGQECPVGTFGVNCSSSCSCGGAPCHGVTGQCRCPPGRTGEDCEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 GECGKRCPAGFQGEDCGQECPVGTFGVNCSSSCSCGGAPCHGVTGQCRCPPGRTGEDCEA 720 730 740 750 760 770 670 680 690 700 710 720 pF1KA0 DCPEGRWGLGCQEICPACQHAARCDPETGACLCLPGFVGSRCQDVCPAGWYGPSCQTRCS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 DCPEGRWGLGCQEICPACQHAARCDPETGACLCLPGFVGSRCQDVCPAGWYGPSCQTRCS 780 790 800 810 820 830 730 740 750 760 770 780 pF1KA0 CANDGHCHPATGHCSCAPGWTGFSCQRACDTGHWGPDCSHPCNCSAGHGSCDAISGLCLC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 CANDGHCHPATGHCSCAPGWTGFSCQRACDTGHWGPDCSHPCNCSAGHGSCDAISGLCLC 840 850 860 870 880 890 790 800 810 820 830 840 pF1KA0 EAGYVGPRCEQQCPQGHFGPGCEQLCQCQHGAACDHVSGACTCPAGWRGTFCEHACPAGF :::::::::::::::::::::::: ::::::::::::::::::::::::::::::::::: CCDS41 EAGYVGPRCEQQCPQGHFGPGCEQRCQCQHGAACDHVSGACTCPAGWRGTFCEHACPAGF 900 910 920 930 940 950 850 860 870 880 pF1KA0 FGLDCRSACNCTAGAACDAVNGSCLCPAGRRGPRCAE----------------------- ::::::::::::::::::::::::::::::::::::: CCDS41 FGLDCRSACNCTAGAACDAVNGSCLCPAGRRGPRCAETCPAHTYGHNCSQACACFNGASC 960 970 980 990 1000 1010 pF1KA0 ------------------------------------------------------------ CCDS41 DPVHGQCHCAPGWMGPSCLQACPAGLYGDNCRHSCLCQNGGTCDPVSGHCACPEGWAGLA 1020 1030 1040 1050 1060 1070 890 900 910 920 930 940 pF1KA0 ---KCLPRDVRAGCRHSGGCLNGGLCDPHTGRCLCPAGWTGDKCQSPCLRGWFGEACAQR .:::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 CEKECLPRDVRAGCRHSGGCLNGGLCDPHTGRCLCPAGWTGDKCQSPCLRGWFGEACAQR 1080 1090 1100 1110 1120 1130 950 960 970 pF1KA0 CSCPPAAACHHVTGACRCPPGFTGSGCEQGCPPG-------------------------- :::::.:::::::::::::::::::::::.:::: CCDS41 CSCPPGAACHHVTGACRCPPGFTGSGCEQACPPGSFGEDCAQMCQCPGENPACHPATGTC 1140 1150 1160 1170 1180 1190 980 990 1000 1010 pF1KA0 ------------------RYGPGCEQLCGCLNGGSCDAATGACRCPTGFLGTDCNLTCPQ :::::::::::::::::::::::::::::::::::::::::: CCDS41 SCAAGYHGPSCQQRCPPGRYGPGCEQLCGCLNGGSCDAATGACRCPTGFLGTDCNLTCPQ 1200 1210 1220 1230 1240 1250 1020 1030 1040 1050 1060 1070 pF1KA0 GRFGPNCTHVCGCGQGAACDPVTGTCLCPPGRAGVRCERGCPQNRFGVGCEHTCSCRNGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 GRFGPNCTHVCGCGQGAACDPVTGTCLCPPGRAGVRCERGCPQNRFGVGCEHTCSCRNGG 1260 1270 1280 1290 1300 1310 1080 1090 1100 1110 1120 1130 pF1KA0 LCHASNGSCSCGLGWTGRHCELACPPGRYGAACHLECSCHNNSTCEPATGTCRCGPGFYG ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 LCHASNGSCSCGLGWTGRHCELACPPGRYGAACHLECSCHNNSTCEPATGTCRCGPGFYG 1320 1330 1340 1350 1360 1370 1140 1150 1160 1170 1180 1190 pF1KA0 QACEHRRSGATCNLDCRRGQFGPSCTLHCDCGGGADCDPVSGQCHCVDGYMGPTCREGGP CCDS41 QACEHPCPPGFHGAGCQGLCWCQHGAPCDPISGRCLCPAGFHGHFCERGCEPGSFGEGCH 1380 1390 1400 1410 1420 1430 >-- initn: 1507 init1: 663 opt: 969 Z-score: 584.0 bits: 120.5 E(32554): 3.3e-26 Smith-Waterman score: 969; 67.4% identity (78.3% similar) in 184 aa overlap (1046-1229:1367-1541) 1020 1030 1040 1050 1060 1070 pF1KA0 QGRFGPNCTHVCGCGQGAACDPVTGTCLCPPGRAGVRCERGCPQNRFGVGCEHTCSCRNG :: : ::. :: . :.::. : :..: CCDS41 PGRYGAACHLECSCHNNSTCEPATGTCRCGPGFYGQACEHPCPPGFHGAGCQGLCWCQHG 1340 1350 1360 1370 1380 1390 1080 1090 1100 1110 1120 1130 pF1KA0 GLCHASNGSCSCGLGWTGRHCELACPPGRYGAACHLECSCHNNSTCEPATGTCRCGPGFY . : .: : : :. :. :: .: :: .: .:: .:.: ... :.:.:: : : :: CCDS41 APCDPISGRCLCPAGFHGHFCERGCEPGSFGEGCHQRCDCDGGAPCDPVTGLCLCPPG-- 1400 1410 1420 1430 1440 1450 1140 1150 1160 1170 1180 1190 pF1KA0 GQACEHRRSGATCNLDCRRGQFGPSCTLHCDCGGGADCDPVSGQCHCVDGYMGPTCREGG ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 -------RSGATCNLDCRRGQFGPSCTLHCDCGGGADCDPVSGQCHCVDGYMGPTCREGG 1460 1470 1480 1490 1500 1200 1210 1220 pF1KA0 PLRLPENPSLAQGSAGTLPASSRPTSRSGGPARH :::::::::::::::::::::::::::::::::: CCDS41 PLRLPENPSLAQGSAGTLPASSRPTSRSGGPARH 1510 1520 1530 1540 >>CCDS10213.2 MEGF11 gene_id:84465|Hs108|chr15 (1044 aa) initn: 1996 init1: 1040 opt: 2348 Z-score: 1390.1 bits: 269.1 E(32554): 4.2e-71 Smith-Waterman score: 2650; 40.8% identity (60.5% similar) in 812 aa overlap (341-1141:23-824) 320 330 340 350 360 370 pF1KA0 CASSRGGCEHHCTNLAGSFQCSCEAGYRLHEDRRGCSPLEEPMVDLDGELPFVRPLPHIA :: :: : : . . ...:. .: CCDS10 MVLSLTGLIAFSFLQATLALNPEDPNVCSHWESYAVTV--QESYAHPFDQIY 10 20 30 40 50 380 390 400 410 420 pF1KA0 VLQ-DELPQLFQDDDVGADEEEAELRGEHTLTEKFV-CLDDSF--GHDCSLTC-DDCRNG . .. . :. . . : :: .:. .. : . : : : ..: .: CCDS10 YTRCTDILNWFKCTRHRISYKTAYRRGLRTMYRRRSQCCPGYYESGDFCIPLCTEECVHG 60 70 80 90 100 110 430 440 450 460 470 480 pF1KA0 GTCLLGLDGCDCPEGWTGLICNETCPPDTFGKNCSFSCSCQNGGTCDSVTGACRCPPGVS :. . : : : :: : :. : : .: .:: :.::::. :. .:::: : : CCDS10 -RCV-SPDTCHCEPGWGGPDCSSGCDSDHWGPHCSNRCQCQNGALCNPITGACVCAAGFR 120 130 140 150 160 490 500 510 520 530 540 pF1KA0 GTNCEDGCPKGYYGKHCRKKCNCANRGRCHRLYGACLCDPGLYGRFCHLTCPPWAFGPGC : ::. : : .:: :. :.: . . : : ::: :: : .:. ::: . : : CCDS10 GWRCEELCAPGTHGKGCQLPCQCRHGASCDPRAGECLCAPGYTGVYCEELCPPGSHGAHC 170 180 190 200 210 220 550 560 570 580 590 600 pF1KA0 SEECQCVQPHTQSCDKRDGSCSCKAGFRGERCQAECELGYFGPGCWQACTCPVGVACDSV .: : . : : . : :.: :. : : : : :: .: : : : : :: : CCDS10 ELRCPCQNGGT--CHHITGECACPPGWTGAVCAQPCPPGTFGQNCSQDCPCHHGGQCDHV 230 240 250 260 270 280 610 620 630 640 650 660 pF1KA0 SGECGKRCPAGFQGEDCGQECPVGTFGVNCSSSCSC-GGAPCHGVTGQCRCPPGRTGEDC .:.: .: ::..:. : .::: :.:: .::. :.: .:. : .:: :.: :: : : CCDS10 TGQC--HCTAGYMGDRCQEECPFGSFGFQCSQHCDCHNGGQCSPTTGACECEPGYKGPRC 290 300 310 320 330 340 670 680 690 700 710 720 pF1KA0 -EADCPEGRWGLGCQEICPACQ--HAARCDPETGACLCLPGFVGSRCQDVCPAGWYGPSC : :::: : :: :: :. .. : : :::: : ::. : .:.. ::.:.:: .: CCDS10 QERLCPEGLHGPGCTLPCP-CDADNTISCHPVTGACTCQPGWSGHHCNESCPVGYYGDGC 350 360 370 380 390 400 730 740 750 760 770 780 pF1KA0 QTRCSCANDGHCHPATGHCSCAPGWTGFSCQRACDTGHWGPDCSHPCNCSAGHGSCDAIS : :.: : . :: :: :.::::. : : .: .: .::.:: :.:. : :.:. .. CCDS10 QLPCTCQNGADCHSITGGCTCAPGFMGEVCAVSCAAGTYGPNCSSICSCNNG-GTCSPVD 410 420 430 440 450 460 790 800 810 820 830 840 pF1KA0 GLCLCEAGYVGPRCEQQCPQGHFGPGCEQLCQCQHGAACDHVSGACTCPAGWRGTFCEHA : : :. :. : : ::.: .: .:.. : : .::::. ..:.:.: :: : :: CCDS10 GSCTCKEGWQGLDCTLPCPSGTWGLNCNESCTCANGAACSPIDGSCSCTPGWLGDTCELP 470 480 490 500 510 520 850 860 870 880 890 900 pF1KA0 CPAGFFGLDCRSACNCTAGAACDAVNGSCLCPAGRRGPRCAEKCLPRDVRAGCRHSGGCL :: : :::.: :.:. . .:: :.: : : :: : :: : : .: : .: CCDS10 CPDGTFGLNCSEHCDCSHADGCDPVTGHCCCLAGWTGIRCDSTCPPGRWGPNCSVSCSCE 530 540 550 560 570 580 910 920 930 940 950 pF1KA0 NGGLCDPHTGRCLCPAGWTGDKCQSPCLRGWFGEACAQRCS-CPPAA-ACHHVTGACRCP ::: :.:. : : : :. : :: : :..:..::: : : .. :::..: :.: CCDS10 NGGSCSPEDGSCECAPGFRGPLCQRICPPGFYGHGCAQPCPLCVHSSRPCHHISGICECL 590 600 610 620 630 640 960 970 980 990 1000 1010 pF1KA0 PGFTGSGCEQGCPPGRYGPGCEQLCGCLNGGSCDAATGACRCPTGFLGTDCNLTCPQGRF :::.:. :.: : : .: : :::.: :.:.:. :.:.: :..: ::. .:: : . CCDS10 PGFSGALCNQVCAGGYFGQDCAQLCSCANNGTCSPIDGSCQCFPGWIGKDCSQACPPGFW 650 660 670 680 690 700 1020 1030 1040 1050 1060 1070 pF1KA0 GPNCTHVCGCGQGAACDPVTGTCLCPPGRAGVRCERGCPQNRFGVGCEHTCSCRNGGLCH :: : :.:.: .::.:. :.: : :: .:. : . :: :: : ..:.:.::. : CCDS10 GPACFHACSCHNGASCSAEDGACHCTPGWTGLFCTQRCPAAFFGKDCGRVCQCQNGASCD 710 720 730 740 750 760 1080 1090 1100 1110 1120 1130 pF1KA0 ASNGSCSCGLGWTGRHCELACPPGRYGAACHLECSCHNNSTCEPATGTCRCGPGFYGQAC .:.:.: :.::.::: : :: .: .:. : : :::::. .:::: :.::: : : CCDS10 HISGKCTCRTGFTGQHCEQRCAPGTFGYGCQQLCECMNNSTCDHVTGTCYCSPGFKGIRC 770 780 790 800 810 820 1140 1150 1160 1170 1180 1190 pF1KA0 EHRRSGATCNLDCRRGQFGPSCTLHCDCGGGADCDPVSGQCHCVDGYMGPTCREGGPLRL .. CCDS10 DQAALMMEELNPYTKISPALGAERHSVGAVTGIMLLLFLIVVLLGLFAWHRRRQKEKGRD 830 840 850 860 870 880 >>CCDS4142.1 MEGF10 gene_id:84466|Hs108|chr5 (1140 aa) initn: 1701 init1: 1005 opt: 2331 Z-score: 1379.8 bits: 267.3 E(32554): 1.6e-70 Smith-Waterman score: 2600; 39.5% identity (61.0% similar) in 811 aa overlap (341-1141:29-830) 320 330 340 350 360 370 pF1KA0 CASSRGGCEHHCTNLAGSFQCSCEAGYRLHEDRRGCSPLEEPMVDLDGELPFVRPLPHIA :: :: : : .. : .:. .: CCDS41 MVISLNSCLSFICLLLCHWIGTASPLNLEDPNVCSHWESYSVTVQESYP--HPFDQIY 10 20 30 40 50 380 390 400 410 420 pF1KA0 VLQ-DELPQLFQDDDVGADEEEAELRGEHTL-TEKFVCLDDSF--GHDCSLTCDDCRNGG . .. . :. .. . : .::.:. .: : . :. : : : : CCDS41 YTSCTDILNWFKCTRHRVSYRTAYRHGEKTMYRRKSQCCPGFYESGEMCVPHCADKCVHG 60 70 80 90 100 110 430 440 450 460 470 480 pF1KA0 TCLLGLDGCDCPEGWTGLICNETCPPDTFGKNCSFSCSCQNGGTCDSVTGACRCPPGVSG :. . . :.: :: : :. .: : .: .:. :.:.::. :. .::::.: : : CCDS41 RCI-APNTCQCEPGWGGTNCSSACDGDHWGPHCTSRCQCKNGALCNPITGACHCAAGFRG 120 130 140 150 160 170 490 500 510 520 530 540 pF1KA0 TNCEDGCPKGYYGKHCRKKCNCANRGRCHRLYGACLCDPGLYGRFCHLTCPPWAFGPGCS ::: : .: ::. :...:.: : . : .. : : : :: : ::. ::: :: : CCDS41 WRCEDRCEQGTYGNDCHQRCQCQNGATCDHVTGECRCPPGYTGAFCEDLCPPGKHGPQCE 180 190 200 210 220 230 550 560 570 580 590 600 pF1KA0 EECQCVQPHTQSCDKRDGSCSCKAGFRGERCQAECELGYFGPGCWQACTCPVGVACDSVS ..: : . : . : ::: .:. : : : : :: .: : : : : .::... CCDS41 QRCPC--QNGGVCHHVTGECSCPSGWMGTVCGQPCPEGRFGKNCSQECQCHNGGTCDAAT 240 250 260 270 280 290 610 620 630 640 650 660 pF1KA0 GECGKRCPAGFQGEDCGQECPVGTFGVNCSSSCSC-GGAPCHGVTGQCRCPPGRTGEDCE :.: .: :. :: : .::::::.:: :. .:.: .:. :. :.: : : : .:: :: CCDS41 GQC--HCSPGYTGERCQDECPVGTYGVLCAETCQCVNGGKCYHVSGACLCEAGFAGERCE 300 310 320 330 340 350 670 680 690 700 710 720 pF1KA0 AD-CPEGRWGLGCQEICPAC--QHAARCDPETGACLCLPGFVGSRCQDVCPAGWYGPSCQ : :::: .:. :.. :: : ... : : .: : : ::. : :...: :.:: .:: CCDS41 ARLCPEGLYGIKCDKRCP-CHLENTHSCHPMSGECACKPGWSGLYCNETCSPGFYGEACQ 360 370 380 390 400 410 730 740 750 760 770 780 pF1KA0 TRCSCANDGHCHPATGHCSCAPGWTGFSCQRACDTGHWGPDCSHPCNCSAGHGSCDAISG ::: : . : .::.:.::::. :..:. : : .: .:: :.:. . . :. ..: CCDS41 QICSCQNGADCDSVTGKCTCAPGFKGIDCSTPCPLGTYGINCSSRCGCK-NDAVCSPVDG 420 430 440 450 460 790 800 810 820 830 840 pF1KA0 LCLCEAGYVGPRCEQQCPQGHFGPGCEQLCQCQHGAACDHVSGACTCPAGWRGTFCEHAC : :.::. : : .::.: .: ::. ::: .:.::. ..:.::: :::: :: : CCDS41 SCTCKAGWHGVDCSIRCPSGTWGFGCNLTCQCLNGGACNTLDGTCTCAPGWRGEKCELPC 470 480 490 500 510 520 850 860 870 880 890 900 pF1KA0 PAGFFGLDCRSACNCTAGAACDAVNGSCLCPAGRRGPRCAEKCLPRDVRAGCRHSGGCLN : .::.: :.:. . .: ..: : : : : .: : .: : : CCDS41 QDGTYGLNCAERCDCSHADGCHPTTGHCRCLPGWSGVHCDSVCAEGRWGPNCSLPCYCKN 530 540 550 560 570 580 910 920 930 940 950 960 pF1KA0 GGLCDPHTGRCLCPAGWTGDKCQSPCLRGWFGEACAQRC-SCPPAAA-CHHVTGACRCPP :. :.: : : : :. : :: : :..:. :.: : .: ... :::.:: : : : CCDS41 GASCSPDDGICECAPGFRGTTCQRICSPGFYGHRCSQTCPQCVHSSGPCHHITGLCDCLP 590 600 610 620 630 640 970 980 990 1000 1010 1020 pF1KA0 GFTGSGCEQGCPPGRYGPGCEQLCGCLNGGSCDAATGACRCPTGFLGTDCNLTCPQGRFG ::::. :.. :: ::.: .: .: : :.:.:. .:.: :..:.::. :: ...: CCDS41 GFTGALCNEVCPSGRFGKNCAGICTCTNNGTCNPIDRSCQCYPGWIGSDCSQPCPPAHWG 650 660 670 680 690 700 1030 1040 1050 1060 1070 1080 pF1KA0 PNCTHVCGCGQGAACDPVTGTCLCPPGRAGVRCERGCPQNRFGVGCEHTCSCRNGGLCHA ::: :.:.: .:: :. : : : :: .:. : . :: . .: : :.:.::. : CCDS41 PNCIHTCNCHNGAFCSAYDGECKCTPGWTGLYCTQRCPLGFYGKDCALICQCQNGADCDH 710 720 730 740 750 760 1090 1100 1110 1120 1130 1140 pF1KA0 SNGSCSCGLGWTGRHCELACPPGRYGAACHLECSCHNNSTCEPATGTCRCGPGFYGQACE .:.:.: :. ::::: :: : :: .:. :.: :::::. :::: :.::. : :. CCDS41 ISGQCTCRTGFMGRHCEQKCPSGTYGYGCRQICDCLNNSTCDHITGTCYCSPGWKGARCD 770 780 790 800 810 820 1150 1160 1170 1180 1190 1200 pF1KA0 HRRSGATCNLDCRRGQFGPSCTLHCDCGGGADCDPVSGQCHCVDGYMGPTCREGGPLRLP . CCDS41 QAGVIIVGNLNSLSRTSTALPADSYQIGAIAGIIILVLVVLFLLALFIIYRHKQKGKESS 830 840 850 860 870 880 >>CCDS30892.1 PEAR1 gene_id:375033|Hs108|chr1 (1037 aa) initn: 2723 init1: 883 opt: 2154 Z-score: 1276.9 bits: 248.1 E(32554): 8.4e-65 Smith-Waterman score: 2188; 38.7% identity (60.8% similar) in 692 aa overlap (532-1213:91-758) 510 520 530 540 550 pF1KA0 CRKKCNCANRGRCHRLYGACLCDPGLYGRFCHLTCPPWAFG-PGCSEEC---QCVQPHTQ :: .: : :..:: .:: :. CCDS30 GPHTCPQPTVVYRTVYRQVVKTDHRQRLQCCHGFYESRGFCVPLCAQECVHGRCVAPN-- 70 80 90 100 110 560 570 580 590 600 610 pF1KA0 SCDKRDGSCSCKAGFRGERCQAECELGYFGPGCWQACTCPVGVACDSVSGECGKRCPAGF .:.: :.::. :..:: :..:: : . :.: . .:: :: :. ::.:. CCDS30 -------QCQCVPGWRGDDCSSECAPGMWGPQCDKPCSCGNNSSCDPKSGVCS--CPSGL 120 130 140 150 160 620 630 640 650 660 670 pF1KA0 QGEDCGQECPVGTFGVNCSSSCSCGGAPCHGVTGQCRCPPGRTGEDCEADCPEGRWGLGC : .: : : : .: :. :.: :::: :: : :: ::: .:...: .: :. : CCDS30 QPPNCLQPCTPGYYGPACQFRCQCHGAPCDPQTGACFCPAERTGPSCDVSCSQGTSGFFC 170 180 190 200 210 220 680 690 700 710 720 730 pF1KA0 QEICPACQHAARCDPETGACLCLPGFVGSRCQDVCPAGWYGPSCQTRCSCANDGHCHPAT .::... . :.: : ::..:. :. :: :..::.:. .: : : : : : CCDS30 PST-HSCQNGGVFQTPQGSCSCPPGWMGTICSLPCPEGFHGPNCSQECRCHNGGLCDRFT 230 240 250 260 270 280 740 750 760 770 780 790 pF1KA0 GHCSCAPGWTGFSCQRACDTGHWGPDCSHPCNCSAGHGSCDAISGLCLCEAGYVGPRC-E :.: ::::.:: :.. : .:..: ::.. :.: : . : .: :::: :..: :: . CCDS30 GQCRCAPGYTGDRCREECPVGRFGQDCAETCDC-APDARCFPANGACLCEHGFTGDRCTD 290 300 310 320 330 340 800 810 820 830 840 850 pF1KA0 QQCPQGHFGPGCEQLCQC--QHGAACDHVSGACTCPAGWRGTFCEHACPAGFFGLDCRSA . ::.: .: .:. : : .:. .: ..: :.: :: : :...:: : :. CCDS30 RLCPDGFYGLSCQAPCTCDREHSLSCHPMNGECSCLPGWAGLHCNESCPQDTHGPGCQEH 350 360 370 380 390 400 860 870 880 890 900 910 pF1KA0 CNCTAGAACDAVNGSCLCPAGRRGPRCAEKCLPRDVRAGCRHSGGCLNGGLCDPHTGRCL : : :..:.:..: : : : ::.:: : : ..: .: :. :.: :.:. CCDS30 CLCLHGGVCQATSGLCQCAPGYTGPHCASLCPPDTYGVNCSARCSCENAIACSPIDGECV 410 420 430 440 450 460 920 930 940 950 960 970 pF1KA0 CPAGWTGDKCQSPCLRGWFGEACAQRCSCPPAAACHHVTGACRCPPGFTGSGCEQGCPPG : :: .:. :: : .: .: :.: :.: :::: : ::. :. :. :: : CCDS30 CKEGWQRGNCSVPCPPGTWGFSCNASCQCAHEAVCSPQTGACTCTPGWHGAHCQLPCPKG 470 480 490 500 510 520 980 990 1000 1010 1020 1030 pF1KA0 RYGPGCEQLCGCLNGGSCDAATGACRCPTGFLGTDCNLTCPQGRFGPNCTHVCGCGQGAA ..: :: . : : .. .:: . : :.: .:..:. :.:.::.: .: ::...: : .:.. CCDS30 QFGEGCASRCDCDHSDGCDPVHGRCQCQAGWMGARCHLSCPEGLWGVNCSNTCTCKNGGT 530 540 550 560 570 580 1040 1050 1060 1070 1080 1090 pF1KA0 CDPVTGTCLCPPGRAGVRCERGCPQNRFGVGCEHTCSCRNGGLCHASNGSCSCGLGWTGR : : .:.:.: :: : :.:.: .:.: : :.: : ..:: :::.: : :::: CCDS30 CLPENGNCVCAPGFRGPSCQRSCQPGRYGKRCV-PCKCANHSFCHPSNGTCYCLAGWTGP 590 600 610 620 630 640 1100 1110 1120 1130 1140 1150 pF1KA0 HCELACPPGRYGAACHLECSCHNNSTCEPATGTCRCGPGFYGQACEHRRSGATCNLDCRR : ::::..: : :.::...::.: :.: : :. :. : . : CCDS30 DCSQPCPPGHWGENCAQTCQCHHGGTCHPQDGSCICPLGWTGHHCLE---------GCPL 650 660 670 680 690 1160 1170 1180 1190 1200 1210 pF1KA0 GQFGPSCTLHCDCGGGADCDPVSGQCHCVDGYMGPTCREG--GPLR-LPENPSLAQGSAG : :: .:. :.:: : : : .: : : :. : :: : :. .: .: .: .: : CCDS30 GTFGANCSQPCQCGPGEKCHPETGACVCPPGHSGAPCRIGIQEPFTVMPTTP-VAYNSLG 700 710 720 730 740 750 1220 pF1KA0 TLPASSRPTSRSGGPARH .. CCDS30 AVIGIAVLGSLVVALVALFIGYRHWQKGKEHHHLAVAYSSGRLDGSEYVMPDVPPSYSHY 760 770 780 790 800 810 >>CCDS78055.1 MEGF10 gene_id:84466|Hs108|chr5 (567 aa) initn: 1775 init1: 906 opt: 1288 Z-score: 773.9 bits: 154.2 E(32554): 8.7e-37 Smith-Waterman score: 1563; 42.0% identity (63.9% similar) in 441 aa overlap (652-1086:91-515) 630 640 650 660 670 pF1KA0 CGQECPVGTFGVNCSSSCSCGGAPCHGVTGQCRCPPG--RTGEDCEADCPEGRWGLGCQE . .: :: ..:: : : . CCDS78 TDILNWFKCTRHRVSYRTAYRHGEKTMYRRKSQCCPGFYESGEMCVPHCAD--------- 70 80 90 100 110 680 690 700 710 720 730 pF1KA0 ICPACQHAARC-DPETGACLCLPGFVGSRCQDVCPAGWYGPSCQTRCSCANDGHCHPATG : :. :: :.: : : ::. :. :...: . .:: : .::.: : . :.: :: CCDS78 ---KCVHG-RCIAPNT--CQCEPGWGGTNCSSACDGDHWGPHCTSRCQCKNGALCNPITG 120 130 140 150 160 740 750 760 770 780 790 pF1KA0 HCSCAPGWTGFSCQRACDTGHWGPDCSHPCNCSAGHGSCDAISGLCLCEAGYVGPRCEQQ : :: :. :. :. :. : .: :: . :.:. : ..:: ..: : : ::.: ::. CCDS78 ACHCAAGFRGWRCEDRCEQGTYGNDCHQRCQCQNG-ATCDHVTGECRCPPGYTGAFCEDL 170 180 190 200 210 220 800 810 820 830 840 850 pF1KA0 CPQGHFGPGCEQLCQCQHGAACDHVSGACTCPAGWRGTFCEHACPAGFFGLDCRSACNCT :: :. :: ::: : ::.:..: ::.: :.::.:: :: : . :: : :: .: . :.: CCDS78 CPPGKHGPQCEQRCPCQNGGVCHHVTGECSCPSGWMGTVCGQPCPEGRFGKNCSQECQCH 230 240 250 260 270 280 860 870 880 890 900 910 pF1KA0 AGAACDAVNGSCLCPAGRRGPRCAEKCLPRDVRAGCRHSGGCLNGGLCDPHTGRCLCPAG :..:::..:.: : : : :: ..: . : .. :.::: : .: ::: :: CCDS78 NGGTCDAATGQCHCSPGYTGERCQDECPVGTYGVLCAETCQCVNGGKCYHVSGACLCEAG 290 300 310 320 330 340 920 930 940 950 960 970 pF1KA0 WTGDKCQSP-CLRGWFGEACAQRCSC--PPAAACHHVTGACRCPPGFTGSGCEQGCPPGR ..:..:.. : .: .: : .:: : . .:: ..: : : ::..: :.. : :: CCDS78 FAGERCEARLCPEGLYGIKCDKRCPCHLENTHSCHPMSGECACKPGWSGLYCNETCSPGF 350 360 370 380 390 400 980 990 1000 1010 1020 1030 pF1KA0 YGPGCEQLCGCLNGGSCDAATGACRCPTGFLGTDCNLTCPQGRFGPNCTHVCGCGQGAAC :: .:.:.:.: ::..::..:: : : :: : ::. :: : .: ::. ::: . :.: CCDS78 YGEACQQICSCQNGADCDSVTGKCTCAPGFKGIDCSTPCPLGTYGINCSSRCGCKNDAVC 410 420 430 440 450 460 1040 1050 1060 1070 1080 1090 pF1KA0 DPVTGTCLCPPGRAGVRCERGCPQNRFGVGCEHTCSCRNGGLCHASNGSCSCGLGWTGRH .:: :.: : : :: : ::.. .: ::. ::.: ::: :.. .:.:. CCDS78 SPVDGSCTCKAGWHGVDCSIRCPSGTWGFGCNLTCQCLNGGACNTLDGTCTCAPGWRGEK 470 480 490 500 510 520 1100 1110 1120 1130 1140 1150 pF1KA0 CELACPPGRYGAACHLECSCHNNSTCEPATGTCRCGPGFYGQACEHRRSGATCNLDCRRG CCDS78 CELPCQDGTYGLNCAERCDCSHADGCHPTTGHCRCLPGWSGLF 530 540 550 560 >>CCDS43905.1 NOTCH1 gene_id:4851|Hs108|chr9 (2555 aa) initn: 428 init1: 135 opt: 1077 Z-score: 645.1 bits: 132.5 E(32554): 1.3e-29 Smith-Waterman score: 1596; 29.8% identity (47.7% similar) in 1258 aa overlap (67-1228:344-1419) 40 50 60 70 80 90 pF1KA0 YPCHLGQAGYPVSAGDQRPDVDECRTHNGGCQH--RCVNTPGSYLCEC---KPGFRLHTD : : : . .:. ::: . :. : . CCDS43 NTHGGYNCVCVNGWTGEDCSENIDDCASAACFHGATCHDRVASFYCECPHGRTGLLCHLN 320 330 340 350 360 370 100 110 120 130 140 150 pF1KA0 SRTCLAINSCALGNGGCQHHCVQLTITRHRCQCRPGFQLQEDGRHCVRR-SPCANRNGSC . .:.. : : :.. :. . :. . : : :. : : . . :. . : CCDS43 D-ACIS-NPCNEGSN-CDTNPVN---GKAICTCPSGYT----GPACSQDVDECSLGANPC 380 390 400 410 420 160 170 180 190 200 pF1KA0 MH--RCQVVRGLARCECHVGYQLAADGKACE-DVDECAAGLAQCAHGCLNTQGSFKCVCH : .: . : .:.: :: : :: ::.::... : ::. : :.:.: CCDS43 EHAGKCINTLGSFECQCLQGYT----GPRCEIDVNECVSNPCQNDATCLDQIGEFQCICM 430 440 450 460 470 210 220 230 240 250 260 pF1KA0 AGYELGADGRQCYRIEMEIVNSCEANNGGCSHG--CSHTSAGPLCTCPRGYELDTDQRTC ::: : .: ::. : .. : :. : : :: :. : . CCDS43 PGYE----GVHCE------VNTDECASSPCLHNGRCLDKINEFQCECPTGF---TGHLCQ 480 490 500 510 520 270 280 290 300 310 320 pF1KA0 IDVDDCADSPCCQQV-CTNNPGGYECGCYAGYRLSADGCGCE-DVDECASSRGGCEH-HC :::.::..:: . . : ..:. : : : :: : :: :.::: . :.. : CCDS43 YDVDECASTPCKNGAKCLDGPNTYTCVCTEGYT----GTHCEVDIDECDPD--PCHYGSC 530 540 550 560 570 580 330 340 350 360 370 380 pF1KA0 TNLAGSFQCSCEAGYRLHEDRRGCSPLEEPMVDLDGELPFVRPLPHIAVLQDELPQLFQD . ...: : :. :: :. : : . . ... : : .. ::. CCDS43 KDGVATFTCLCRPGYTGHH----C---ETNINECSSQ-----PCRHGGTCQDR------- 590 600 610 620 390 400 410 420 430 pF1KA0 DDVGADEEEAELRGEHTLTEKFVCLDDSFGHDCSLTCDDCR----NGGTCLLGLDG--CD ..: : :: . : .: .. ::: ..:::: .:: : CCDS43 -------DNAYL---------CFCLKGTTGPNCEINLDDCASSPCDSGTCLDKIDGYECA 630 640 650 660 440 450 460 470 480 490 pF1KA0 CPEGWTGLICNETCPPDTFGKNCSFSCSCQNGGTCDSVTGACRCPPGVSGTNCEDGCPKG : :.:: .:: . .:. . :.:::::.. :..: .:. ::.: CCDS43 CEPGYTGSMCNINID------ECA-GNPCHNGGTCED---------GINGFTCR--CPEG 670 680 690 700 500 510 520 530 540 550 pF1KA0 YYGKHCRKKCNCANRGRCHRLYGACLCDPGLYGRFCHLTCPP-WAFGPGC---SEECQ-- :. : .. : : . : ..::: .: : : : : :. : .: ..::. CCDS43 YHDPTCLSEVNECNSNPC--VHGAC--RDSLNGYKC--DCDPGWS-GTNCDINNNECESN 710 720 730 740 750 760 560 570 580 590 600 pF1KA0 -CVQPHTQSC-DKRDGS-CSCKAGFRGERCQAECELGYFGPGCWQACTCPVGVACDSVSG ::. : : : .: :.:. :: : ::.. . .: : . :: :.:.: CCDS43 PCVNGGT--CKDMTSGYVCTCREGFSGPNCQTNINECASNP-CLNQGTC-----IDDVAG 770 780 790 800 810 610 620 630 640 650 660 pF1KA0 -ECGKRCPAGFQGEDCGQECPVGTFGVNCSSS-CSCGGAPCHGVTG----QCRCPPGRTG .:. : . : : : .. :. : : :: :. .: :: : : CCDS43 YKCN--CLLPYTGATC--EVVLAP----CAPSPCRNGGE-CRQSEDYESFSCVCPTGWQG 820 830 840 850 860 670 680 690 700 710 720 pF1KA0 EDCEADCPEGRWGLGCQEICPACQHAARCDPETGACLCLPGFVGSRCQDVCPAGWYGPSC . ::.: : : . :.:.: :. : : ::. : ::. : .: CCDS43 QTCEVDINE------C--VLSPCRHGASCQNTHG---------GYRCH--CQAGYSGRNC 870 880 890 900 730 740 750 760 770 pF1KA0 QTR---CS---CANDGHCHPA--TGHCSCAPGWTGFSCQRACDTGHWGPDC-SHPCNCSA .: : : : : : . :. :.: ::. : :.. . .: : :: .: CCDS43 ETDIDDCRPNPCHNGGSCTDGINTAFCDCLPGFRGTFCEEDIN------ECASDPCRNGA 910 920 930 940 950 780 790 800 810 820 830 pF1KA0 GHGSCDAISGLCLCEAGYVGPRCEQQCPQGHFGPGCEQLCQCQHGAAC-DHVSG-ACTCP . .: . : : : ::. : .::.. :. : . .: .:..: : ... .: :: CCDS43 NCTDC-VDSYTCTCPAGFSGIHCENNTPD------CTE-SSCFNGGTCVDGINSFTCLCP 960 970 980 990 1000 1010 840 850 860 870 880 pF1KA0 AGWRGTFCEHACPAGFFGLDCRSACNCTAGAACDAVNGS--CLCPAGRRGPRCAEKCLPR :. :..:.: .: : : :..:. :: : :: : :: : . CCDS43 PGFTGSYCQHDVN------ECDSQ-PCLHGGTCQDGCGSYRCTCPQGYTGPNC------Q 1020 1030 1040 1050 890 900 910 920 930 940 pF1KA0 DVRAGCRHSGGCLNGGLC-DPHTG-RCLCPAGWTGDKCQSPCLRGWFGEACAQRCSCPPA .. : :. : ::: : . :: :: ::.:::: :. : . :. ::: . : CCDS43 NLVHWC-DSSPCKNGGKCWQTHTQYRCECPSGWTGLYCDVPSVSC---EVAAQRQGVDVA 1060 1070 1080 1090 1100 1110 950 960 970 980 990 pF1KA0 AACHH--------VTGACRCPPGFTGSGCEQ---GCPPGRYGPGCEQLCGCLNGGSCDAA :.: : ::: :.::: ::. : :. : : ::..: CCDS43 RLCQHGGLCVDAGNTHHCRCQAGYTGSYCEDLVDECSPS---P-------CQNGATCTDY 1120 1130 1140 1150 1160 1000 1010 1020 1030 1040 1050 pF1KA0 TG--ACRCPTGFLGTDCNLTCPQGRFGPNC-THVCGCGQGAACD-PVTGTCLCPPGRAGV : .:.: .:. :..:. . : .: : : :. : : : : :: : :: CCDS43 LGGYSCKCVAGYHGVNCSEEIDE------CLSHPCQNG-GTCLDLPNTYKCSCPRGTQGV 1170 1180 1190 1200 1210 1060 1070 1080 1090 1100 pF1KA0 RCERGCPQNRFGVG-CEHTCSCRNGGLCHASNG--SCSCGLGWTGRHCE------LACPP .:: . . : .. .: :.: : . : ::.: :..:..:: :. : CCDS43 HCEINVDDCNPPVDPVSRSPKCFNNGTCVDQVGGYSCTCPPGFVGERCEGDVNECLSNPC 1220 1230 1240 1250 1260 1270 1110 1120 1130 1140 1150 pF1KA0 GRYGAA-C-----HLECSC---HNNSTCEPATGTCRCGPGFYGQACE---HRRSGATCNL :. : ..: : :.. :: . . :. : : .: . : :. CCDS43 DARGTQNCVQRVNDFHCECRAGHTGRRCESVINGCKGKPCKNGGTCAVASNTARGFICK- 1280 1290 1300 1310 1320 1330 1160 1170 1180 1190 1200 pF1KA0 DCRRGQFGPSC--------TLHCDCGGGADCDPVSGQCHCVDGYMGPTCR--EGGPLRLP : : : .: .:.: :: : : : :. . :: :. ..: : CCDS43 -CPAGFEGATCENDARTCGSLRCLNGGTCISGPRSPTCLCLGPFTGPECQFPASSPC-LG 1340 1350 1360 1370 1380 1390 1210 1220 pF1KA0 ENPSLAQGSAGTLPASSRPTSRSGGPARH :: ::. :.: : : ::. CCDS43 GNPCYNQGTCE--PTSESPFYRCLCPAKFNGLLCHILDYSFGGGAGRDIPPPLIEEACEL 1400 1410 1420 1430 1440 1450 >>CCDS32232.1 FBN1 gene_id:2200|Hs108|chr15 (2871 aa) initn: 723 init1: 364 opt: 1062 Z-score: 635.9 bits: 131.0 E(32554): 4.2e-29 Smith-Waterman score: 1359; 26.3% identity (45.9% similar) in 1340 aa overlap (56-1167:1028-2318) 30 40 50 60 70 80 pF1KA0 GTHYRYLWRGCYPCHLGQAGYPVSAGDQRPDVDECRTHNGGCQH-RCVNTPGSYLCECKP :..::. . : : .: :: ::. :.: CCDS32 MRNTPEYEELCPRGPGFATKEITNGKPFFKDINECKMIPSLCTHGKCRNTIGSFKCRCDS 1000 1010 1020 1030 1040 1050 90 100 110 120 130 pF1KA0 GFRLHTDSRTCLAINSCALGNGGC-QHHCVQLTITRHRCQC----RPGFQLQE---DGRH :: : .. :.: :. : .. : . .::. : .:.: . ::.... : . CCDS32 GFALDSEERNCTDIDECRISPDLCGRGQCVN-TPGDFECKCDEGYESGFMMMKNCMDIDE 1060 1070 1080 1090 1100 1110 140 150 160 170 180 190 pF1KA0 CVRRSPCANRNGSCMHRCQVVRGLARCECHVGYQLAADGKACEDVDECAAGLAQCAHG-C : .:.: :.: : : . : :::: :.::. . .:: :..:: . : .: : CCDS32 C-QRDPLLCRGGVC-HNTE---GSYRCECPPGHQLSPNISACIDINECELSAHLCPNGRC 1120 1130 1140 1150 1160 1170 200 210 220 230 240 250 pF1KA0 LNTQGSFKCVCHAGYELGADGRQCYRIEMEIVNSCEANNGGCSHGCSHTSAGPLCTCPRG .: :...:.:. ::. : : :. : :::: :... .. :.: : CCDS32 VNLIGKYQCACNPGYHSTPDRLFCVDID-----ECSIMNGGCETFCTNSEGSYECSCQPG 1180 1190 1200 1210 1220 260 270 280 290 300 310 pF1KA0 YELDTDQRTCIDVDDCADSP--CCQQVCTNNPGGYECGCYAGYRLSADGCGCEDVDECAS . : :::.: :.:.: :.: : ::: :: :.: :: :. : : : ::.:: CCDS32 FALMPDQRSCTDIDECEDNPNICDGGQCTNIPGEYRCLCYDGFMASEDMKTCVDVNECDL 1230 1240 1250 1260 1270 1280 320 330 340 350 360 370 pF1KA0 SRGGC-EHHCTNLAGSFQCSCEAGYRLHEDRRGCSPLEEPMVDLDGELPFVRPLPHIAVL . . : : : ::: : :. :: .. . ::. ..: . . . . . CCDS32 NPNICLSGTCENTKGSFICHCDMGYSGKKGKTGCTDINECEIGAHNCGKHAVCTNTAGSF 1290 1300 1310 1320 1330 1340 380 390 400 410 420 pF1KA0 QDELPQLFQDDDVGADEEEAELRGEHTLTEKFVCLDDSFGHDC---------SLTC---D . . : . . . : : ... : . .. : ..:: : CCDS32 KCSCSPGWIGDGIKCTDLDECSNGTHMCSQHADCKNTMGSYRCLCKEGYTGDGFTCTDLD 1350 1360 1370 1380 1390 1400 430 440 450 460 470 pF1KA0 DC-RNGGTCLLGLDGC-DCPEGWTGLICNETCPPDTFGKNCSFSCSCQNGGTCDSVTGAC .: .: . : : : . : :. :. :.. :: : :. . : : :.: CCDS32 ECSENLNLC--GNGQCLNAPGGYRCE-CDMGFVPSADGKACEDIDECSLPNIC--VFGTC 1410 1420 1430 1440 1450 1460 480 490 500 510 520 530 pF1KA0 RCPPGVSGTNCEDGCPKGYYGKHCRKKCNCANRGRCHRLYGACLCDPGLYGRFCHLTCPP . ::. .:: : : .: .: . : . : :. :: : .: ::: CCDS32 HNLPGLFRCECEIGYELDRSGGNCTDVNECLDPTTC--ISGNCVNTPGSY--ICD--CPP 1470 1480 1490 1500 1510 540 550 560 570 580 590 pF1KA0 -WAFGP---GC--SEECQCVQPHTQSCDKRDGSCSCKAGFRGERCQAECELGY-FGPGCW . ..: :: .. .: :. : .:: . : . . : :: .: : CCDS32 DFELNPTRVGCVDTRSGNCYLDIRPRGDNGDTACSNEIGVGVSKASCCCSLGKAWGTPC- 1520 1530 1540 1550 1560 1570 600 610 620 pF1KA0 QACT----------CPVGVA---------------CDSVSGEC-GKRCPAGFQGEDCGQE . : :: : . :. . : : : .: : . .: . CCDS32 EMCPAVNTSEYKILCPGGEGFRPNPITVILEDIDECQELPGLCQGGKCINTFGSFQC--R 1580 1590 1600 1610 1620 1630 630 640 650 660 pF1KA0 CPVGTF---------GVN-CSSSCSCGGAPCHGVTGQ--CRCPPGRT----GEDCE---- ::.: . :: : . :: . :....:. : ::: :..: CCDS32 CPTGYYLNEDTRVCDDVNECETPGICGPGTCYNTVGNYTCICPPDYMQVNGGNNCMDMRR 1640 1650 1660 1670 1680 1690 670 680 690 pF1KA0 --------AD------------------CPE--GR-WGLGCQEICP---ACQHAARC--- :: : :: :. :.. :: . . :. : CCDS32 SLCYRNYYADNQTCDGELLFNMTKKMCCCSYNIGRAWNKPCEQ-CPIPSTDEFATLCGSQ 1700 1710 1720 1730 1740 1750 700 710 720 pF1KA0 ------DPETG------ACLCLPG---------FVGS-RCQDVCPAGWYGPS-------- : :: : .:: .::: ::. ::.:.. . CCDS32 RPGFVIDIYTGLPVDIDECREIPGVCENGVCINMVGSFRCE--CPVGFFYNDKLLVCEDI 1760 1770 1780 1790 1800 730 740 750 760 770 pF1KA0 --CQTRCSCANDGHCHPATG--HCSCAPGWTGFSCQRACDTGHWGPDCSH-PCNCSAGHG ::. : ...: ..: .:.: ::. :. :. . .:.. : :: :: CCDS32 DECQNGPVCQRNAECINTAGSYRCDCKPGYR-FTSTGQCNDRN---ECQEIPNICS--HG 1810 1820 1830 1840 1850 1860 780 790 800 810 820 pF1KA0 SC-DAISGL-CLCEAGYVG----PRCEQ--QCPQGHFGPG-CEQL-----CQCQHGAACD .: :..... :::..:. : . .: . : : :.. :.:.:: . CCDS32 QCIDTVGSFYCLCHTGFKTNDDQTMCLDINECERDACGNGTCRNTIGSFNCRCNHGFILS 1870 1880 1890 1900 1910 1920 830 840 850 pF1KA0 HVSGACT----CPAGWRGTFCEHA------------CPAGFF----GLDCRSACNCT--- : .. : : .: :..:... : :. : : . .: CCDS32 H-NNDCIDVDECASG-NGNLCRNGQCINTVGSFQCQCNEGYEVAPDGRTCVDINECLLEP 1930 1940 1950 1960 1970 1980 860 870 880 890 900 910 pF1KA0 ---AGAACDAVNGS--CLCPAGRRGPRCAEKCLPRDVRAGCRHSGGCLNGGLCDPHTG-- : ..:. ..:: :.:: : ::: .:. .. : : :. : CCDS32 RKCAPGTCQNLDGSYRCICPPGYSLQN--EKC--EDIDECVEEPEIC-ALGTCSNTEGSF 1990 2000 2010 2020 2030 920 930 940 950 960 pF1KA0 RCLCPAGWT----GDKCQSPCLRGWFGEACAQRCSCPPAAACHHVTGACRCPPGFTGSG- .:::: :.. : .::. . ... . .:: : . .: : : : : CCDS32 KCLCPEGFSLSSSGRRCQDLRMSYCYAKFEGGKCSSPKSR--NHSKQECCCALKGEGWGD 2040 2050 2060 2070 2080 2090 970 980 990 1000 1010 pF1KA0 -CEQGCPPGRYGPGCEQLCGCLNG---GSCDAATGA--CR----CPTG-FLGTDCNLTC- :: :: . . .:.: .: : :.:. :. : : ..:: . : CCDS32 PCEL-CPT-EPDEAFRQICPYGSGIIVGPDDSAVDMDECKEPDVCKHGQCINTDGSYRCE 2100 2110 2120 2130 2140 2150 1020 1030 1040 1050 1060 1070 pF1KA0 -PQGRF--GPNCTHVCGCGQGAACDPVTGTCLCPPGRAGVRCERGCPQNRFGVGCEHTCS : : . : .:. . :. : : .::: : ::.: . . . :: CCDS32 CPFGYILAGNECVDTDECSVGNPCG--NGTCKNVIGGFECTCEEGFEPGPM-MTCEDINE 2160 2170 2180 2190 2200 1080 1090 1100 1110 1120 pF1KA0 CRNGGL-----CHASNGS--CSCGLGWTGRHCELACPPGRYGAACHLECSCHNNSTCEPA : .. : : . :: :.: .:.. :. . : . .:. ... :. CCDS32 CAQNPLLCAFRCVNTYGSYECKCPVGYVLREDRRMCKDEDECEEGKHDCT-EKQMECKNL 2210 2220 2230 2240 2250 2260 1130 1140 1150 1160 1170 pF1KA0 TGT--CRCGPGFY----GQACEHRRSGATCNLDCRRGQ-FGPSCTLHCDCGGGADCDPVS :: : ::::. :..: . : :. :. .. . :.: CCDS32 IGTYMCICGPGYQRRPDGEGCVDENECQTKPGICENGRCLNTRGSYTCECNDGFTASPNQ 2270 2280 2290 2300 2310 2320 1180 1190 1200 1210 1220 pF1KA0 GQCHCVDGYMGPTCREGGPLRLPENPSLAQGSAGTLPASSRPTSRSGGPARH CCDS32 DECLDNREGYCFTEVLQNMCQIGSSNRNPVTKSECCCDGGRGWGPHCEICPFQGTVAFKK 2330 2340 2350 2360 2370 2380 >-- initn: 680 init1: 272 opt: 618 Z-score: 376.9 bits: 83.1 E(32554): 1.1e-14 Smith-Waterman score: 715; 28.4% identity (49.3% similar) in 570 aa overlap (35-537:470-997) 10 20 30 40 50 60 pF1KA0 RDRGLAALWCLGLLGGLARVAGTHYRYLWRGCYPCHLGQAGYPVSAGDQRPDVDECRTHN : : :. .. :. .. . :::::. .: CCDS32 EPPRVLPVNVTDYCQLVRYLCQNGRCIPTPGSYRCECNK-GFQLDLRGECIDVDECE-KN 440 450 460 470 480 490 70 80 90 100 110 120 pF1KA0 GGCQHRCVNTPGSYLCECKPGFRLHTDSRT-CLAINSCALGNGG-CQH-HCVQLTITRHR .:.:. ::: :.:. :.. : .:: : :. : : :: :.. .:.. . : CCDS32 PCAGGECINNQGSYTCQCRAGYQ-STLTRTECRDIDEC-LQNGRICNNGRCINTDGSFH- 500 510 520 530 540 550 130 140 150 160 170 180 pF1KA0 CQCRPGFQLQEDGRHCVRRSPCANRNGSCMH-RCQVVRGLARCECHVGYQLAADGKACED : : ::.. .::..: . :. :: :.. : : .: :. :.:::.::. :.: CCDS32 CVCNAGFHVTRDGKNCEDMDECSIRN-MCLNGMCINEDGSFKCICKPGFQLASDGRYCKD 560 570 580 590 600 610 190 200 210 220 230 pF1KA0 VDECAA-GLAQCAHG-CLNTQGSFKCVCHAGYELGADGRQCYRIEMEIVNSCEAN--NGG ..:: . :. : .: :.::.::..: : : .: ::: : .. .. ..: .. : CCDS32 INECETPGI--CMNGRCVNTDGSYRCECFPGLAVGLDGRVC--VDTHMRSTCYGGYKRGQ 620 630 640 650 660 240 250 260 270 pF1KA0 C----------SHGCSHTSA---GPLCT-CPRGYELDTDQRTCI----------DVDDCA : :. : .. : : :: . : : :...:: CCDS32 CIKPLFGAVTKSECCCASTEYAFGEPCQPCPAQNSAEY-QALCSSGPGMTSAGSDINECA 670 680 690 700 710 720 280 290 300 310 320 pF1KA0 DSP--CCQQVCTNNPGGYECGCYAGYRLSADGCGCEDVDECASSRGGCEH-HCTNLAGSF .: : . .: : : :.: : .::.... : .: :..::. . :.. .: : ::: CCDS32 LDPDICPNGICENLRGTYKCICNSGYEVDSTGKNCVDINECVLNSLLCDNGQCRNTPGSF 730 740 750 760 770 780 330 340 350 360 370 380 pF1KA0 QCSCEAGYRLHEDRRGCSPLEEPMVDLDGELPFVRPLPHIAVLQDELPQLFQDDDVGADE :.: :. . : . : ..: . : : . . : : CCDS32 VCTCPKGFIYKPDLKTCEDIDE-----------CESSPCINGVCKNSPGSFI-------- 790 800 810 820 390 400 410 420 430 440 pF1KA0 EEAELRGEHTLTE-KFVCLDDSFGHDCSLTCDDCRNGGTCLLGLDG------CDCPEG-- : .: :: : .:.. : :: . : : ....: : : CCDS32 --CECSSESTLDPTKTICIETIKG-----TCWQTVIDGRCEININGATLKSQCCSSLGAA 830 840 850 860 870 880 450 460 470 480 pF1KA0 WTGLICNETCPPDTF---------GKNCS-------FSCSCQNGGTCDSVTGA--CRCPP : : :. : : . : .: : :.:: : .. :. :.:: CCDS32 W-GSPCT-LCQVDPICGKGYSRIKGTQCEDIDECEVFPGVCKNG-LCVNTRGSFKCQCPS 890 900 910 920 930 490 500 510 520 530 pF1KA0 GVS----GTNCEDGCPKGYYGKHCRKKCNCANRGRCHRLYGACLCDPGL-YGRFCHLTCP :.. : : : . . .. ..:. :: ::. :: :. : .: :: CCDS32 GMTLDATGRICLDIRLETCFLRYEDEECTLPIAGR-HRM-DACCCSVGAAWGTEECEECP 940 950 960 970 980 990 540 550 560 570 580 590 pF1KA0 PWAFGPGCSEECQCVQPHTQSCDKRDGSCSCKAGFRGERCQAECELGYFGPGCWQACTCP CCDS32 MRNTPEYEELCPRGPGFATKEITNGKPFFKDINECKMIPSLCTHGKCRNTIGSFKCRCDS 1000 1010 1020 1030 1040 1050 >-- initn: 308 init1: 262 opt: 568 Z-score: 347.7 bits: 77.7 E(32554): 4.8e-13 Smith-Waterman score: 711; 34.3% identity (59.8% similar) in 286 aa overlap (56-337:2402-2678) 30 40 50 60 70 80 pF1KA0 GTHYRYLWRGCYPCHLGQAGYPVSAGDQRPDVDECRTHNGGCQH-RCVNTPGSYLCECKP :.:::.. . :.. .::: ::: : :: CCDS32 GPHCEICPFQGTVAFKKLCPHGRGFMTNGADIDECKVIHDVCRNGECVNDRGSYHCICKT 2380 2390 2400 2410 2420 2430 90 100 110 120 130 140 pF1KA0 GFRLHTDSRTCLAINSCALGNGGCQHHCVQLTITRHRCQCRPGFQLQEDGRHCVRRSPCA :. . .:. .: : . :. : . : ..:.: :. :::::: : . :: CCDS32 GYTPDITGTSCVDLNECNQAPKPCNFIC-KNTEGSYQCSCPKGYILQEDGRSCKDLDECA 2440 2450 2460 2470 2480 2490 150 160 170 180 190 200 pF1KA0 NRNGSCMHRCQVVRGLARCECHVGYQLAADGKACEDVDECAAGLAQC-AHG-CLNTQGSF ... .:. : . : :.: :. . .: : .::.. . : ..: : :: ::: CCDS32 TKQHNCQFLCVNTIGGFTCKCPPGF--TQHHTSCIDNNECTSDINLCGSKGICQNTPGSF 2500 2510 2520 2530 2540 210 220 230 240 250 260 pF1KA0 KCVCHAGYELGADGRQCYRIEMEIVNSCEANNGGCSHGCSHTSAGPLCTCPRGYELDTDQ : :. :. : : .: : :. ::.:. :.:::.. .: :.::.:: . CCDS32 TCECQRGFSLDQTGSSC-----EDVDECEGNHR-CQHGCQNIIGGYRCSCPQGYLQHYQW 2550 2560 2570 2580 2590 2600 270 280 290 300 310 320 pF1KA0 RTCIDVDDCADSPCCQQV-CTNNPGGYECGCYAGYRLSADGCGCEDVDECASSRGGCEHH :.: ..: .. : . : :. :.:.: : ::.. . ::.:..::.:... : . CCDS32 NQCVDENECLSAHICGGASCHNTLGSYKCMCPAGFQYEQFSGGCQDINECGSAQAPCSYG 2610 2620 2630 2640 2650 2660 330 340 350 360 370 380 pF1KA0 CTNLAGSFQCSCEAGYRLHEDRRGCSPLEEPMVDLDGELPFVRPLPHIAVLQDELPQLFQ :.: :.. :.: :: CCDS32 CSNTEGGYLCGCPPGYFRIGQGHCVSGMGMGRGNPEPPVSGEMDDNSLSPEACYECKING 2670 2680 2690 2700 2710 2720 >>CCDS12326.1 NOTCH3 gene_id:4854|Hs108|chr19 (2321 aa) initn: 287 init1: 129 opt: 975 Z-score: 586.0 bits: 121.4 E(32554): 2.6e-26 Smith-Waterman score: 1735; 30.6% identity (48.1% similar) in 1312 aa overlap (57-1219:159-1352) 30 40 50 60 70 80 pF1KA0 THYRYLWRGCYPCHLGQAGYPVSAGDQRPDVDECRTHNGGCQH--RCVNTPGSYLCECKP :::::. . :.: :.:::::. :.: CCDS12 AHGARCSVGPDGRFLCSCPPGYQGRSCRSDVDECRVGEP-CRHGGTCLNTPGSFRCQCPA 130 140 150 160 170 180 90 100 110 120 130 140 pF1KA0 GFR--LHTDSRTCLAINSCALGNGGCQHHCVQLTITRHRCQCRPGFQLQEDGRHC-VRRS :. : . . : . : ::: : : . : : ::: .:..: : . CCDS12 GYTGPLCENPAVPCAPSPCR--NGGT---CRQSGDLTYDCACLPGF----EGQNCEVNVD 190 200 210 220 230 150 160 170 180 190 pF1KA0 PCANRNGSCMHRCQVVRGLARCECHVGYQLAADGKAC-EDVDECAAGLAQCAHG--CLNT : .. :.. : :. .:. . . :. : :::::: : .: :.:: CCDS12 DCPGH--RCLNGGTCVDGVNTYNCQCPPEWT--GQFCTEDVDECQLQPNACHNGGTCFNT 240 250 260 270 280 290 200 210 220 230 240 250 pF1KA0 QGSFKCVCHAGYELGADGRQCYRIEMEIVNSCEANNGGCSHG--CSHTSAGPLCTCPRGY :. .::: :. :..: . ...: . : :: : :. :.:: : CCDS12 LGGHSCVCVNGW----TGESC----SQNIDDCATAV--CFHGATCHDRVASFYCACPMG- 300 310 320 330 340 260 270 280 290 300 310 pF1KA0 ELDTDQRTCIDVDDCADSPCCQQ-VCTNNP--GGYECGCYAGYRLSADGCGCE-DVDECA : .: : :...:: .. .: .:: : : : :. : .:. :::::. CCDS12 --KTGLLCHLD-DACVSNPCHEDAICDTNPVNGRAICTCPPGF----TGGACDQDVDECS 350 360 370 380 390 320 330 340 350 360 pF1KA0 SSRGGCEH--HCTNLAGSFQCSCEAGY---RLHEDRRGC--SPLEEPMVDLDGELPFVRP . . ::: .:.: ::: :.: :: : . : : .: .. . :: : CCDS12 IGANPCEHLGRCVNTQGSFLCQCGRGYTGPRCETDVNECLSGPCRNQATCLD------RI 400 410 420 430 440 450 370 380 390 400 410 420 pF1KA0 LPHIAVLQDELPQLFQDDDVGADEEEAELRGE--HTLTEKFVCLDDS-F-GHDCSLTCDD . . . . . :. . . : . .. : : : : : :.: :. CCDS12 GQFTCICMAGFTGTYCEVDIDECQSSPCVNGGVCKDRVNGFSCTCPSGFSGSTCQLDVDE 460 470 480 490 500 510 430 440 450 460 pF1KA0 C-----RNGGTCLLGLDG--CDCPEGWTGLICN---ETCPPDTFGKN-C-----SFSCSC : :::. :. :: : : ::. : .:. . : :: .. : ::::.: CCDS12 CASTPCRNGAKCVDQPDGYECRCAEGFEGTLCDRNVDDCSPDPCHHGRCVDGIASFSCAC 520 530 540 550 560 570 470 480 490 500 510 pF1KA0 QNG--GT-CDSVTGACRCPPGVSGTNCED-------GCPKGYYGKHCRKKCN-CANR--- : :: :.: . :: : : .: : ::.: : .:. . . ::. CCDS12 APGYTGTRCESQVDECRSQPCRHGGKCLDLVDKYLCRCPSGTTGVNCEVNIDDCASNPCT 580 590 600 610 620 630 520 530 540 550 pF1KA0 -GRCHRLYGA--CLCDPGLYGRFCHLT---CP--PWAFGPGCSE-----ECQC------- : :. . :.:.::. : .:.. : : . : .: . .: : CCDS12 FGVCRDGINRYDCVCQPGFTGPLCNVEINECASSPCGEGGSCVDGENGFRCLCPPGSLPP 640 650 660 670 680 690 560 570 580 590 600 pF1KA0 -VQPHTQSCDKRDGSCS---CKAGFRGERCQAECELGYFGPGCWQACTCPVGVACDSVSG : .. : .. :: : . : :: :: :. :: : :. . ::.: CCDS12 LCLPPSHPCAHE--PCSHGICYDAPGGFRC--VCEPGWSGPRCSQSLARD---ACESQPC 700 710 720 730 740 610 620 630 640 650 660 pF1KA0 ECGKRCPAGFQGEDCGQECPVGTFGVNCSSSCSCGGAPC-HGVTGQCRCPPGRTGEDCEA . : : . .: : :: :. : .: : :: :: :.:. ::. : CCDS12 RAGGTCSSDGMGFHC--TCPPGVQGRQCELLSPCTPNPCEHG--GRCESAPGQL-PVC-- 750 760 770 780 790 670 680 690 700 710 720 pF1KA0 DCPEGRWGLGCQEICPACQHAARCDPETGACLCLPGFVGSRCQDVCPAGWYGPSCQ---T .::.: : ::. : : : :. : : : : . : .: .:. ::::. . CCDS12 SCPQGWQGPRCQQDVDECAGPAPCGPH-GICTNLAGSFS--C--TCHGGYTGPSCDQDIN 800 810 820 830 840 850 730 740 750 760 770 pF1KA0 RCS---CANDGHCHPATGH--CSCAPGWTGFSCQRACDTGHWGPDC-SHPCNCSAGHGSC :. : : : :. ..: ::: ::..: : : : .: :.:: : :.: CCDS12 DCDPNPCLNGGSCQDGVGSFSCSCLPGFAGPRCARDVD------ECLSNPC----GPGTC 860 870 880 890 900 780 790 800 810 820 pF1KA0 -DAISGL-CLCEAGYVGPRCEQQ---C-PQGHFGPG-CEQ-----LCQCQHG---AACDH : .... : : :: : .:::. : :.. :. : : . : :. : : :.: CCDS12 TDHVASFTCTCPPGYGGFHCEQDLPDCSPSSCFNGGTCVDGVNSFSCLCRPGYTGAHCQH 910 920 930 940 950 960 830 840 850 860 pF1KA0 VSGACTCPAGWRGTFCEHA-------CPAGFFGLDCRSA---CN---CTAGAACDAVNGS . : .: : : : .: : .:.. :. : :. : ... CCDS12 EADPCLSRPCLHGGVCSAAHPGFRCTCLESFTGPQCQTLVDWCSRQPCQNGGRCVQTGAY 970 980 990 1000 1010 1020 870 880 890 900 910 920 pF1KA0 CLCPAGRRGPRCAEKCLP-RDVRA--GCRHSGGCLNGGLC--DPHTGRCLCPAGWTGDKC :::: : : : . :: :.. : : : : :: : . . :.:: : ::..: CCDS12 CLCPPGWSGRLCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDEDSSHYCVCPEGRTGSHC 1030 1040 1050 1060 1070 1080 930 940 950 960 970 pF1KA0 QS---PCLRGWFGEACAQRCSCPPAAACHHVTGA--CRCPPGFTGSGCEQGCPPGRYGPG .. ::: :: : ...:. :. :.: ::..:..::. : CCDS12 EQEVDPCL--------AQ--PCQHGGTCRGYMGGYMCECLPGYNGDNCEDDVDECASQP- 1090 1100 1110 1120 1130 980 990 1000 1010 1020 1030 pF1KA0 CEQLCGCLNGGSC-D-AATGACRCPTGFLGTDCNLT---CPQG---RFGPNCTHVCGCGQ : .:::: : .: : :: : ::. :... : : :: : : . CCDS12 ------CQHGGSCIDLVARYLCSCPPGTLGVLCEINEDDCGPGPPLDSGPRCLH-----N 1140 1150 1160 1170 1040 1050 1060 1070 1080 pF1KA0 GAACDPVTG-TCLCPPGRAGVRCERGCPQNRFGVGCEHTCSCRNGGLCHASNGS---CSC :. : : : : :::: .:.::: . : :. : :. :. : . :. : : CCDS12 GTCVDLVGGFRCTCPPGYTGLRCEADINECRSGA-C-HAAHTRD---CLQDPGGGFRCLC 1180 1190 1200 1210 1220 1230 1090 1100 1110 1120 1130 1140 pF1KA0 GLGWTGRHCELACPPGRYGAACHLECSCHNNSTCEPATG-------TCRCGPGFYGQACE :..: .:. . : :. . :.... :.:. : ::.:. :.: :: CCDS12 HAGFSGPRCQTVLSP------CESQ-PCQHGGQCRPSPGPGGGLTFTCHCAQPFWGPRCE 1240 1250 1260 1270 1280 1150 1160 1170 1180 1190 pF1KA0 HRRSGATCNLDCRRGQFGPSCTLHCDCGGGADCDPVSGQCHCVDGYMGPTCRE--GGPLR : . .: :.: : . : . .: : : ::.:: :.: CCDS12 --RVARSCR------------ELQCPVGVPCQQTPRGPRCACPPGLSGPSCRSFPGSP-- 1290 1300 1310 1320 1330 1200 1210 1220 pF1KA0 LPENPSLAQGSAGTLPASS-RPTSRSGGPARH : . . ..: : ..: :: CCDS12 -PGASNASCAAAPCLHGGSCRPAPLAPFFRCACAQGWTGPRCEAPAAAPEVSEEPRCPRA 1340 1350 1360 1370 1380 1390 >>CCDS12196.1 FBN3 gene_id:84467|Hs108|chr19 (2809 aa) initn: 677 init1: 406 opt: 948 Z-score: 569.5 bits: 118.7 E(32554): 2.1e-25 Smith-Waterman score: 1374; 28.5% identity (48.0% similar) in 1282 aa overlap (37-1186:431-1594) 10 20 30 40 50 60 pF1KA0 RGLAALWCLGLLGGLARVAGTHYRYLWRGCYPCHLGQAGYPVSAGDQRPDVDECRTHNGG : :. . .:: .. . ::::: . . CCDS12 GTATLNQTIDICRHFTNLCLNGRCLPTPSSYRCECN-VGYTQDVRGECIDVDECTS--SP 410 420 430 440 450 70 80 90 100 110 120 pF1KA0 CQH-RCVNTPGSYLCECKPGFRLHTDSRTCLAINSCALGNGGCQ-HHCVQLTITRHRCQC :.: ::: ::.: :.: :::. ..:. .. : ...: :. .::. : .: : CCDS12 CHHGDCVNIPGTYHCRCYPGFQATPTRQACVDVDECIVSGGLCHLGRCVN-TEGSFQCVC 460 470 480 490 500 510 130 140 150 160 170 180 pF1KA0 RPGFQLQEDGRHCVRRSPCANR----NGSCMHRCQVVRGLARCECHVGYQLAADGKACED ::.:. ::..:: .. ::. :: :... : : :. :. :: :. : : CCDS12 NAGFELSPDGKNCVDHNECATSTMCVNGVCLNE----DGSFSCLCKPGFLLAPGGHYCMD 520 530 540 550 560 570 190 200 210 220 230 pF1KA0 VDECAA-GLAQCAHG-CLNTQGSFKCVCHAGYELGADGRQCYRIEMEIVNSCEA--NNGG .::: . :. :..: : ::.:::.: : .: .:.::: : .. .. ..: . ..:. CCDS12 IDECQTPGI--CVNGHCTNTEGSFRCQCLGGLAVGTDGRVC--VDTHVRSTCYGAIEKGS 580 590 600 610 620 240 250 260 270 pF1KA0 CSHG-----------CSHTSAG---P--LCT----------CPRGYELDTDQRTCIDVDD :.. :.. . : : :: : : . :: : :... CCDS12 CARPFPGTVTKSECCCANPDHGFGEPCQLCPAKDSAEFQALCSSGLGITTDGR---DINE 630 640 650 660 670 680 280 290 300 310 320 pF1KA0 CADSP--CCQQVCTNNPGGYECGCYAGYRLSADGCGCEDVDECASSRGGCEHH-CTNLAG :: .: : . :: : :.:.: : ::. .:.: : :::::: . :.. : : : CCDS12 CALDPEVCANGVCENLRGSYRCVCNLGYEAGASGKDCTDVDECALNSLLCDNGWCQNSPG 690 700 710 720 730 740 330 340 350 360 370 pF1KA0 SFQCSCEAGYRLHEDRRGCSPLEE----PMV-----DLDGEL-----PFVRPLPHIAVLQ :..::: :... .: . :. ..: : : .: : : : : . CCDS12 SYSCSCPPGFHFWQDTEICKDVDECLSSPCVSGVCRNLAGSYTCKCGPGSRLDPSGTFCL 750 760 770 780 790 800 380 390 400 410 420 430 pF1KA0 DELPQLFQDDDVGADEEEAELRGEHTLTEKFVCLDDSFGHDCSLTCDDCRNGGTCLLGLD : . .. :..:.: .: . : ..: :. :. .: :. CCDS12 DSTKGTCWLK-IQESRCEVNLQGASLRSECCATLGAAWGS----PCERCEIDPACARGF- 810 820 830 840 850 440 450 460 470 480 pF1KA0 GCDCPEGWTGLICNETCPPDTFGKNC-SFSCSCQNGGTCDSVTGA--CRCPPGV----SG ::. :... ..: :: : :: : ...:. :.:: :. :: CCDS12 -----ARMTGVTCDDV-------NECESFPGVCPNG-RCVNTAGSFRCECPEGLMLDASG 860 870 880 890 900 490 500 510 520 530 540 pF1KA0 TNCEDGCPKGYYGKHCRKKCNCANRGRCHRLYGACLCDPG-LYGRFCHLTCP-PWA--FG : : . . . . .:. . :. .:. .: :. : ..: :. .:: : . :. CCDS12 RLCVDVRLEPCFLRWDEDECGVTLPGK-YRM-DVCCCSIGAVWGVECE-ACPDPESLEFA 910 920 930 940 950 960 550 560 570 580 pF1KA0 PGC-------SEECQCVQPHTQS---CDKRDGSCS---CKAGFRGERCQAECELGYFGPG : :.. .: .. : : :. :. . .: : :. . CCDS12 SLCPRGLGFASRDFLSGRPFYKDVNECKVFPGLCTHGTCRNTVGSFHC--ACAGGFALDA 970 980 990 1000 1010 1020 590 600 610 620 630 640 pF1KA0 CWQACTCPVGVACDSVSGECGK-RC---PAGFQGEDC--GQECPVGTFGVNCSS--SCS- . :: . : ::. : :..:. : : : : . :: . :. CCDS12 QERNCT-DID-ECRISPDLCGQGTCVNTPGSFECE-CFPGYESGFMLMK-NCMDVDECAR 1030 1040 1050 1060 1070 650 660 670 680 690 pF1KA0 ----CGGAPCHGVTG--QCRCPPGRT----GEDCEADCPEGRWGLGCQEICPACQHAARC : :. : .. : .:.::::. : :: : : . : .:: : : CCDS12 DPLLCRGGTCTNTDGSYKCQCPPGHELTAKGTACE-DIDECSLSDG---LCPHGQ----C 1080 1090 1100 1110 1120 700 710 720 730 740 pF1KA0 DPETGA--CLCLPGFVGSRCQDVCPAGWYGPSCQTRCS-CANDGHCHPATG--HCSCAPG :: : : :: .. .. : :... . : : :: . : .:::. : CCDS12 VNVIGAFQCSCHAGFQSTPDRQGCVDI---NECRVQNGGC--DVHCINTEGSYRCSCGQG 1130 1140 1150 1160 1170 1180 750 760 770 780 790 pF1KA0 WTGFSCQRAC-DTGHWGPDCS-HPCNCSAGHGSCDAISG--LCLCEAGYVGPRCEQQC-- .. . ::: :. .: .: :. :: : . : ::: :... . : CCDS12 YSLMPDGRACADVD----ECEENPRVCDQGH--CTNMPGGHRCLCYDGFMATPDMRTCVD 1190 1200 1210 1220 1230 800 810 820 830 840 850 pF1KA0 -PQGHFGPGCEQLCQCQHGAACDHVSGA--CTCPAGW---RG-TFCEHA--CPAGFFGLD . ..: : :: :....:. : : :. .: : : . : .: CCDS12 VDECDLNPHI-----CLHGD-CENTKGSFVCHCQLGYMVRKGATGCSDVDECEVG----- 1240 1250 1260 1270 1280 860 870 880 890 900 pF1KA0 CRSACNCTAGAACDAVNGS--CLCPAGRRGP--RCAE--KCLPRDVRAGCRHSGGCLNGG . :: . :.: . :: : : : : .: . .:. .. : : : ::: CCDS12 ---GHNCDSHASCLNIPGSFSCRCLPGWVGDGFECHDLDECVSQEHR--CSPRGDCLN-- 1290 1300 1310 1320 1330 1340 910 920 930 940 950 960 pF1KA0 LCDPHTGRCLCPAGWTGDKCQSPCLRGWFGEACAQRCSCPPAAA-CHHVTGACRCPPGFT : . :: : :..:: :.: : .: : . : . : : :: CCDS12 --VPGSYRCTCRQGFAGD--------GFF---CEDRDECAENVDLCDN--GQCLNAPGGY 1350 1360 1370 1380 970 980 990 1000 1010 1020 pF1KA0 GSGCEQGCPPGRYGPGCEQLCGCLNGGSCDAATGACRCPTGFLGTDCNLTCPQGRFGPNC ::.: : . .:... : .:. : : :.:. :.. :: : : :: CCDS12 RCECEMGFDPTEDHRACQDVDECAQGNLC--AFGSCENLPGMFRCICNGGYELDRGGGNC 1390 1400 1410 1420 1430 1440 1030 1040 1050 1060 1070 1080 pF1KA0 THVCGCGQGAACDPVTGTCLCPPGRAGVRCERGCPQNRFGVGCEHT--CSCRNGGLCHAS : . :.. . : ..:.:. :: : . : :::: : .: ... CCDS12 TDINECADPVNC--INGVCINTPGSYLCSCPQDFELNPSGVGCVDTRAGNCFLETHDRGD 1450 1460 1470 1480 1490 1500 1090 1100 1110 1120 1130 pF1KA0 NG-SCSC--GLGWTGRHCELACPPGR-YGAACHLECSCHNNSTCEPATGTCRCGPGFYGQ .: ::: :.: : : : :: .: :.: : .: : : : : :: CCDS12 SGISCSAEIGVGVTRASC--CCSLGRAWGNPCEL---CPMANTTEYRT-LCPGGEGFQ-- 1510 1520 1530 1540 1550 1140 1150 1160 1170 1180 1190 pF1KA0 ACEHRRSGATCNLD-CRRGQFGPSCTLHCDCGGGADCDPVSG--QCHCVDGYMGPTCREG .: . ..: : : :. : :: :: . : ::.: :: CCDS12 --PNRITVILEDIDEC---QELPGL-----CQGG-DCVNTFGSFQCECPPGYHLSEHTRI 1560 1570 1580 1590 1600 1200 1210 1220 pF1KA0 GPLRLPENPSLAQGSAGTLPASSRPTSRSGGPARH CCDS12 CEDIDECSTHSGICGPGTCYNTLGNYTCVCPAEYLQVNGGNNCMDMRKSVCFRHYNGTCQ 1610 1620 1630 1640 1650 1660 >-- initn: 487 init1: 243 opt: 881 Z-score: 530.4 bits: 111.4 E(32554): 3.2e-23 Smith-Waterman score: 1032; 29.0% identity (45.5% similar) in 882 aa overlap (37-807:1828-2644) 10 20 30 40 50 60 pF1KA0 RGLAALWCLGLLGGLARVAGTHYRYLWRGCYPCHLGQAGYPVSAGDQR--PDVDECRTHN : : : . :. .:: :: :.::: . CCDS12 SPGGACVGRNECREIPNVCSHGDCMDTEGSYMC-LCHRGFQASA-DQTLCMDIDECDRQP 1800 1810 1820 1830 1840 1850 70 80 90 100 110 120 pF1KA0 GGCQHRCVNTPGSYLCECKPGFRLHTDSRTCLAINSCALGNGG-CQH-HCVQLTITRHRC : . : : ::: : : ::: . : . :. .. :. : :. ::.. . . : : CCDS12 CG-NGTCKNIIGSYNCLCFPGFVV-THNGDCVDFDECTTLVGQVCRFGHCLNTAGSFH-C 1860 1870 1880 1890 1900 1910 130 140 150 160 170 180 pF1KA0 QCRPGFQLQEDGRHCVRRSPCANRNGSCMH-RCQVVRGLARCECHVGYQLAADGKACEDV :. ::.: ::..:: . : . :.:. :: ..: :: : :.:. .: : :. CCDS12 LCQDGFELTADGKNCVDTNECLSLAGTCLPGTCQNLEGSFRCICPPGFQVQSDH--CIDI 1920 1930 1940 1950 1960 1970 190 200 210 220 pF1KA0 DECAAGLAQCAHG-CLNTQGSFKCVCHAGYELGADGRQCY---------RIEM------- :::. : : : :. :::.:.: :. :. .:..:. :.: CCDS12 DECSEEPNLCLFGTCTNSPGSFQCLCPPGFVLSDNGHRCFDTRQSFCFTRFEAGKCSVPK 1980 1990 2000 2010 2020 2030 230 pF1KA0 ----------------------------------------------------EIVNSCEA : :: : CCDS12 AFNTTKTRCCCSKRPGEGWGDPCELCPQEGSAAFQELCPFGHGAVPGPDDSREDVNECAE 2040 2050 2060 2070 2080 2090 240 250 260 270 280 290 pF1KA0 NNGGCSHG-CSHTSAGPLCTCPRGYELDTDQRTCIDVDDCA-DSPCCQQVCTNNPGGYEC : : :..: : .:... : :: :: :: .:.:.:.:. :: : .::: ::.:: CCDS12 NPGVCTNGVCVNTDGSFRCECPFGYSLDFTGINCVDTDECSVGHPCGQGTCTNVIGGFEC 2100 2110 2120 2130 2140 2150 300 310 320 330 340 350 pF1KA0 GCYAGYRLSADGCGCEDVDECASSRGGCEHHCTNLAGSFQCSCEAGYRLHEDRRGCSPLE .: :.. . :::.:::. . : .: : ::. :.: ::: :.:: : .. CCDS12 ACADGFE-PGLMMTCEDIDECSLNPLLCAFRCHNTEGSYLCTCPAGYTLREDGAMCRDVD 2160 2170 2180 2190 2200 360 370 380 390 400 pF1KA0 EPMVDLDGELPFVRPLPHIAVLQDELPQLFQDDDVGADEEEAELRGEHTLTEKFV-CLDD : ::. :: . .. .. . . : . : . : :: CCDS12 ECA---DGQ-------------QDCHARGMECKNLIGTFACVCPPGMRPLPGSGEGCTDD 2210 2220 2230 2240 2250 410 420 430 440 450 460 pF1KA0 SFGHDCSLTCDDCRNGGTCL--LGLDGCDCPEGW----TGLICNETCPPDTFGKNCSFSC . .: : : :: :. : ::: ::. : :.. :.. . : CCDS12 N---ECHAQPDLCVNG-RCVNTAGSFRCDCDEGFQPSPTLTECHDIRQGPCFAEVLQTMC 2260 2270 2280 2290 2300 470 480 490 500 510 pF1KA0 SCQNGGTCDSVTGA-CRCPPGVS-GTNCEDGCP---KGYYGKHCRKKCNCANRGR----C .... ..:: : : : : . : :: :: . : : : . . . .:: : CCDS12 RSLSSSS-EAVTRAECCCGGGRGWGPRCEL-CPLPGTSAYRKLCPHGSGYTAEGRDVDEC 2310 2320 2330 2340 2350 2360 520 530 540 550 560 pF1KA0 HRL-----YGACLCDPGLYGRFCHLTCPPWAFGPGC--SEEC-QCVQPHTQSCDKRDGS- . : .: :. . : . :. : : . : .:: : .: : : . :: CCDS12 RMLAHLCAHGECINSLGSFRCHCQAGYTPDATATTCLDMDECSQVPKPCTFLCKNTKGSF 2370 2380 2390 2400 2410 2420 570 580 590 600 610 620 pF1KA0 -CSCKAGF----RGERCQAECELGYFGPGCWQACTCPVGVACDSVSGECGKRCPAGFQGE ::: :. :. :. : .: :. ::. : ::: :: . CCDS12 LCSCPRGYLLEEDGRTCKDLDECTSRQHNCQFLCVNTVGAF------TC--RCPPGFTQH 2430 2440 2450 2460 2470 630 640 650 660 670 680 pF1KA0 DCGQECPVGTFGVNCSSSCSCGGAPCHGVTGQCRCPPGRTGEDCEADCPEGRWGLGCQEI : : : .. :: .:: :. :.:. :: .:. : ::... CCDS12 H--QAC----FD---NDECSAQPGPC-GAHGHCHNTPGSFRCECHQGFTLVSSGHGCEDV 2480 2490 2500 2510 2520 690 700 710 720 730 pF1KA0 CPACQHAARCDPETGACLCLPGFVGSRCQDVCPAGWYGPSCQTRCSCANDGHCHPAT-GH :. :: . : : . : ::. :: :. : ..: :. : : : CCDS12 NE-CDGPHRC--QHG---CQNQLGGYRCS--CPQGFTQHSQWAQCVDENECALSPPTCGS 2530 2540 2550 2560 2570 2580 740 750 760 770 780 790 pF1KA0 CSCAPGWTGFSCQRACDTG----HWGPDCSHPCNCSAGHGSCDAISGLCLCEAGYVGPRC :: :: : .: .: . :.. .:.. .: : : : : : : CCDS12 ASCRNTLGGFRC--VCPSGFDFDQALGGCQEVDECAGRRGPC---SYSCANTPG--GFLC 2590 2600 2610 2620 2630 800 810 820 830 840 850 pF1KA0 EQQCPQGHFGPGCEQLCQCQHGAACDHVSGACTCPAGWRGTFCEHACPAGFFGLDCRSAC ::::.: : CCDS12 --GCPQGYFRAGQGHCVSGLGFSPGPQDTPDKEELLSSEACYECKINGLSPRDRPRRSAH 2640 2650 2660 2670 2680 2690 >>CCDS34222.1 FBN2 gene_id:2201|Hs108|chr5 (2912 aa) initn: 1013 init1: 421 opt: 932 Z-score: 560.0 bits: 117.0 E(32554): 7.2e-25 Smith-Waterman score: 1300; 26.9% identity (47.3% similar) in 1314 aa overlap (37-1191:517-1732) 10 20 30 40 50 60 pF1KA0 RGLAALWCLGLLGGLARVAGTHYRYLWRGCYPCHLGQAGYPVSAGDQRPDVDECRTHNGG : :. .. :: .:. . ::::: : : CCDS34 GLTILNQTIDICKHHANLCLNGRCIPTVSSYRCECNM-GYKQDANGDCIDVDEC-TSNPC 490 500 510 520 530 540 70 80 90 100 110 120 pF1KA0 CQHRCVNTPGSYLCECKPGFRLHTDSRTCLAINSCALGNGGCQH-HCVQLTITRHRCQCR . :::::::: :.:. ::. ...:. :. : .. :.. .::. : .: : CCDS34 TNGDCVNTPGSYYCKCHAGFQRTPTKQACIDIDECIQNGVLCKNGRCVN-TDGSFQCICN 550 560 570 580 590 600 130 140 150 160 170 180 pF1KA0 PGFQLQEDGRHCVRRSPCANRNGSCMH-RCQVVRGLARCECHVGYQLAADGKACEDVDEC ::.: ::..:: .. :.. : :.. : : .: :. :. :: .:. : ::::: CCDS34 AGFELTTDGKNCVDHDECTTTN-MCLNGMCINEDGSFKCICKPGFVLAPNGRYCTDVDEC 610 620 630 640 650 660 190 200 210 220 230 240 pF1KA0 AA-GLAQCAHGCLNTQGSFKCVCHAGYELGADGRQCYRIEMEIVNSCEAN--NGGCSHG- . :. . .: :.:..:::.: : : .: ::: : .. .. ..: .. .: : . CCDS34 QTPGICMNGH-CINSEGSFRCDCPPGLAVGMDGRVC--VDTHMRSTCYGGIKKGVCVRPF 670 680 690 700 710 250 260 270 pF1KA0 ----------CSHTSAG---PLCTCP------------RGYELDTDQRTCIDVDDCADSP :.. . : : :: : . .: : :...:: .: CCDS34 PGAVTKSECCCANPDYGFGEPCQPCPAKNSAEFHGLCSSGVGITVDGR---DINECALDP 720 730 740 750 760 770 280 290 300 310 320 330 pF1KA0 --CCQQVCTNNPGGYECGCYAGYRLSADGCGCEDVDECASSRGGCEHH-CTNLAGSFQCS : . .: : :.:.:.: .::. .:.: .: :.::: .: :.. : : ::..:. CCDS34 DICANGICENLRGSYRCNCNSGYEPDASGRNCIDIDECLVNRLLCDNGLCRNTPGSYSCT 780 790 800 810 820 830 340 350 360 370 380 390 pF1KA0 CEAGYRLHEDRRGCSPLEEPMVDLDGELPFVRPLPHIAVLQDELPQLFQDDDVGADEEEA : :: .. . . : ..: . : : . ...:. . : CCDS34 CPPGYVFRTETETCEDINECESN-----PCVNGACR--------------NNLGSFNCEC 840 850 860 870 400 410 420 430 440 pF1KA0 ELRGEHTLTEKFVCLDDSFGHDCSLTCDDCRNGGTCLLGLDG------CDCPEG--WTGL : . . ..:.: :. : :. .: : : ....: : : : : CCDS34 S-PGSKLSSTGLICID-SLKGTCWLNIQDSR----CEVNINGATLKSECCATLGAAW-GS 880 890 900 910 920 930 450 460 470 480 490 pF1KA0 ICNETCPPDTF---GKNCSFSCSCQNGGTCDSVTGAC---RCPPGVSGTNCEDGCPKGYY : : : :: : . .:.. . :. :.: :: . .. .:: ::.: CCDS34 PC-ERCELDTACPRGLARIKGVTCEDVNECEVFPGVCPNGRCVNSKGSFHCE--CPEGLT 940 950 960 970 980 500 510 520 530 540 550 pF1KA0 GKHCRKKCNCANRGRCHRLYGACLCDPGLYGRFCHLTCPPWAFGPGCSEECQ-CVQPHTQ . : .:. . : . :.: .: : : . . ::. : .: :. CCDS34 LDGTGRVCLDIRMEQCYLKWDEDECIHPVPGKFRMDACCC-AVGAAWGTECEECPKPGTK 990 1000 1010 1020 1030 1040 560 570 580 590 pF1KA0 SCDKRDGSCSCKAGF--RGE------------RCQAECELGYFGPGCWQA-----CTCPV . . : ::: ::. .:.: . .: : .. : : CCDS34 ---EYETLCPRGAGFANRGDVLTGRPFYKDINECKAFPGMCTYGK-CRNTIGSFKCRCNS 1050 1060 1070 1080 1090 1100 600 610 620 630 pF1KA0 GVACD------------SVSGE-CGKR-C---PAGFQGEDCGQECPVGTFGV-NCSS--S : : : .: . ::. : :..:. : : . : . . :: . CCDS34 GFALDMEERNCTDIDECRISPDLCGSGICVNTPGSFECE-CFEGYESGFMMMKNCMDIDE 1110 1120 1130 1140 1150 1160 640 650 660 670 680 690 pF1KA0 CS-----CGGAPCHGVTG--QCRCPPGRTGEDCEADCPEGRWGLGCQEICPACQHAARCD : : :. : .. : :: :: :. . :: . :. :... .: CCDS34 CERNPLLCRGGTCVNTEGSFQCDCPLGHELSPSREDCVDINE---CSLSDNLCRNG-KCV 1170 1180 1190 1200 1210 700 710 720 730 740 pF1KA0 PETGA--CLCLPGFVGSR----CQDVCPAGWYGPSCQTRCSCANDGHCHPATGHCSCAPG :. : : ::. .. : :. .. .:.:.:. .. .. .:::. : CCDS34 NMIGTYQCSCNPGYQATPDRQGCTDIDECMIMNGGCDTQCTNSEGSY------ECSCSEG 1220 1230 1240 1250 1260 1270 750 760 770 780 790 800 pF1KA0 WTGFSCQRAC-DTGHWGPDC-SHPCNCSAGHGSCDAISGL--CLCEAGYVGPRCEQQCPQ .. . :.: : .: ..: :..:. : : : ::: :... . : . CCDS34 YALMPDGRSCADI----DECENNPDICDGGQ--CTNIPGEYRCLCYDGFMASMDMKTCID 1280 1290 1300 1310 1320 810 820 830 840 850 pF1KA0 GHFGPGCEQLCQ-CQHGAACDHVSGA--CTCPAGW---RGTFCEHACPAGFFGLD-CR-S . :. . :. : :....:. : : :. .:: .: .: :. . CCDS34 VN---ECDLNSNICMFGE-CENTKGSFICHCQLGYSVKKGT-------TGCTDVDECEIG 1330 1340 1350 1360 1370 860 870 880 890 900 pF1KA0 ACNCTAGAACDAVNGS--CLCPAGRRGPRCAEKCLPRDVRAGCRHSGGCLNGGLC--DPH : :: :.: . :: : : : : . ::. : .. :. : .. : : CCDS34 AHNCDMHASCLNIPGSFKCSCREGWIG--NGIKCIDLDECSNGTHQ--CSINAQCVNTPG 1380 1390 1400 1410 1420 1430 910 920 930 940 950 960 pF1KA0 TGRCLCPAGWTGD--KCQSPCLRGWFGEACAQRCSCPPAAACHHVTGACRCPPGFTGSGC . :: : :.::: :.. . ::. . . : .: :: :: : CCDS34 SYRCACSEGFTGDGFTCSDV-------DECAENINLCENGQCLNVPGAYRCE-------C 1440 1450 1460 1470 970 980 990 1000 1010 1020 pF1KA0 EQGCPPGRYGPGCEQLCGCLNGGSCDAATGACRCPTGFLGTDCNLTCPQGRFGPNCTHVC :.: :. . .:... : . : . :.: :.. :. : : ::: . CCDS34 EMGFTPASDSRSCQDIDECSFQNIC--VFGTCNNLPGMFHCICDDGYELDRTGGNCTDID 1480 1490 1500 1510 1520 1530 1030 1040 1050 1060 1070 pF1KA0 GCGQGAACDPVTGTCLCPPGRAGVRCERGCPQNRFGVGC--EHTCSCR-------NGGL- :.. : :.: :. ::: : : :::: ... .: .:.: CCDS34 ECADPINC--VNGLCVNTPGRYECNCPPDFQLNPTGVGCVDNRVGNCYLKFGPRGDGSLS 1540 1550 1560 1570 1580 1590 1080 1090 1100 1110 pF1KA0 CHASNG------SCSCGLG--WTGRHCELACPP---GRYGAACHLECSCHNN-------- :.. : :: :.:: : : :: .::: .: . : . . : CCDS34 CNTEIGVGVSRSSCCCSLGKAW-GNPCE-TCPPVNSTEYYTLCPGGEGFRPNPITIILED 1600 1610 1620 1630 1640 1650 1120 1130 1140 1150 1160 1170 pF1KA0 -STCEPATGTCR---CGPGFYGQACEHRRSGATCNLDCRRGQFGPSCTLHCD-CGGGADC . :. : :. : : . :: . : . : : . : : :: :. : CCDS34 IDECQELPGLCQGGNCINTFGSFQCECPQ-GYYLSEDTRICEDIDECFAHPGVCGPGT-C 1660 1670 1680 1690 1700 1180 1190 1200 1210 1220 pF1KA0 DPVSGQ--CHCVDGYM----GPTCREGGPLRLPENPSLAQGSAGTLPASSRPTSRSGGPA . :. : : :: : .: CCDS34 YNTLGNYTCICPPEYMQVNGGHNCMDMRKSFCYRSYNGTTCENELPFNVTKRMCCCTYNV 1710 1720 1730 1740 1750 1760 >-- initn: 596 init1: 248 opt: 685 Z-score: 415.9 bits: 90.3 E(32554): 7.6e-17 Smith-Waterman score: 782; 28.2% identity (50.8% similar) in 532 aa overlap (35-528:2233-2726) 10 20 30 40 50 60 pF1KA0 RDRGLAALWCLGLLGGLARVAGTHYRYLWRGCYPCHLGQAGYPVSAGDQRPDVDECRTHN : . :. .. :. . . :..:: . CCDS34 NLDYTGVRCVDTDECSIGNPCGNGTCTNVIGSFECNCNE-GFEPGPMMNCEDINECAQNP 2210 2220 2230 2240 2250 2260 70 80 90 100 110 120 pF1KA0 GGCQHRCVNTPGSYLCECKPGFRLHTDSRTCLAINSCALGNGGCQHH---CVQLTITRHR : ::.:: ::: : : :. :. :.. : .. :: : :. . : .: : CCDS34 LLCAFRCMNTFGSYECTCPIGYALREDQKMCKDLDECAEGLHDCESRGMMCKNL-IGTFM 2270 2280 2290 2300 2310 2320 130 140 150 160 170 180 pF1KA0 CQCRPGFQLQEDGRHCVRRSPCANRNGSCMH-RCQVVRGLARCECHVGYQLAADGKACED : : ::. . ::. :: .. : .. : : . :: . : ::::. :.: ...: : : CCDS34 CICPPGMARRPDGEGCVDENECRTKPGICENGRCVNIIGSYRCECNEGFQSSSSGTECLD 2330 2340 2350 2360 2370 2380 190 200 210 pF1KA0 VDE--CAAGLAQ--C--AHGCLNTQGSFKCVCHAGYELGADGRQC--------------- . : : . : : : . : . .: : .: : . . : CCDS34 NRQGLCFAEVLQTICQMASSSRNLVTKSECCCDGGRGWGHQCELCPLPGTAQYKKICPHG 2390 2400 2410 2420 2430 2440 220 230 240 250 260 270 pF1KA0 --YRIEMEIVNSCEANNGGCSHG-CSHTSAGPLCTCPRGYELDTDQRTCIDVDDCADSPC : . . .. :.. . :..: : .: .. : : :: : . .:::.:.:..:: CCDS34 PGYTTDGRDIDECKVMPNLCTNGQCINTMGSFRCFCKVGYTTDISGTSCIDLDECSQSPK 2450 2460 2470 2480 2490 2500 280 290 300 310 320 330 pF1KA0 -CQQVCTNNPGGYECGCYAGYRLSADGCGCEDVDECASSRGGCEHHCTNLAGSFQCSCEA :. .: :. :.:.:.: :: :. :: :.:.::: ... .:. :.: :.: :.: CCDS34 PCNYICKNTEGSYQCSCPRGYVLQEDGKTCKDLDECQTKQHNCQFLCVNTLGGFTCKCPP 2510 2520 2530 2540 2550 2560 340 350 360 370 380 390 pF1KA0 GYRLHE----DRRGCSPLEEPMVDLDGELPFVRPLPHIAVLQDELPQLFQDDDVGADEEE :. :. : :. .: .: : . . : . .. : . :. : .: . :. CCDS34 GFTQHHTACIDNNECG--SQP--SLCGAKGICQNTP--GSFSCECQRGFSLDATGLNCED 2570 2580 2590 2600 2610 400 410 420 430 440 450 pF1KA0 A-ELRGEHTLTEKFVCLDDSFGHDCSLTCDDCRNGGTCLLGLDGCDCPEGWTGLICNETC . : :.: :..: .:: : ::.:. . : CCDS34 VDECDGNHR----------------------CQHGCQNILGGYRCGCPQGYIQHYQWNQC 2620 2630 2640 2650 460 470 480 490 500 pF1KA0 PPDTFGKNCSFSCSCQNGGTCDSVTGA--CRCPPGVSGTNCEDGCPKGYYGKHCRKKCNC .. .:: .: ....: .. :. : :: : : . ..: . ..: .. : CCDS34 VDEN---ECSNPNAC-GSASCYNTLGSYKCACPSGFSFDQFSSAC---HDVNECSSSKNP 2660 2670 2680 2690 2700 510 520 530 540 550 560 pF1KA0 ANRGRCHRLYGA--CLCDPGLYGRFCHLTCPPWAFGPGCSEECQCVQPHTQSCDKRDGSC : : : :. : : :: : CCDS34 CNYG-CSNTEGGYLCGCPPGYYRVGQGHCVSGMGFNKGQYLSLDTEVDEENALSPEACYE 2710 2720 2730 2740 2750 2760 >-- initn: 417 init1: 184 opt: 569 Z-score: 348.2 bits: 77.8 E(32554): 4.5e-13 Smith-Waterman score: 702; 31.7% identity (53.8% similar) in 439 aa overlap (56-474:1850-2231) 30 40 50 60 70 80 pF1KA0 GTHYRYLWRGCYPCHLGQAGYPVSAGDQRPDVDECRTHNGGCQHR--CVNTPGSYLCECK :.::: . .. ::. :.:.:::: ::: CCDS34 ANGVCINQIGSFRCECPTGFSYNDLLLVCEDIDECSNGDNLCQRNADCINSPGSYRCECA 1820 1830 1840 1850 1860 1870 90 100 110 120 130 pF1KA0 PGFRLHTDSRTCLAINSCALGNGGCQHH-CVQLTITRHRCQCRPGFQLQEDGRHCV---- ::.: .. .:. : : . :.: ::.: . ..: :. ::. ..: :. CCDS34 AGFKLSPNG-ACVDRNECLEIPNVCSHGLCVDLQGS-YQCICHNGFKASQDQTMCMDVDE 1880 1890 1900 1910 1920 1930 140 150 160 170 180 190 pF1KA0 -RRSPCANRNGSCMHRCQVVRGLARCECHVGYQLAADGKACEDVDECAAGLAQ-CAHG-C .: ::. ::.: . : : :. :..:. .. : :.:::.. ..: : .: : CCDS34 CERHPCG--NGTCKNTV----GSYNCLCYPGFELTHNND-CLDIDECSSFFGQVCRNGRC 1940 1950 1960 1970 1980 1990 200 210 220 230 240 250 pF1KA0 LNTQGSFKCVCHAGYELGADGRQCYRIEMEIVNSCEANNGGCSHG-CSHTSAGPLCTCPR .: :::::.:. :::: ::..: .: : : :.:: : :.. .. : :: CCDS34 FNEIGSFKCLCNEGYELTPDGKNCID-----TNECVALPGSCSPGTCQNLEGSFRCICPP 2000 2010 2020 2030 2040 260 270 280 290 300 310 pF1KA0 GYELDTDQRTCIDVDDCADSP--CCQQVCTNNPGGYECGCYAGYRLSADGCGCEDVDECA :::. ... :::...: ..: : :::.:::..: : :. :: .: : : CCDS34 GYEVKSEN--CIDINECDEDPNICLFGSCTNTPGGFQCLCPPGFVLSDNGRRCFD----- 2050 2060 2070 2080 2090 320 330 340 350 360 370 pF1KA0 SSRGGCEHHCTNLAGSFQCSCEAGYRLHEDRRGCSPLEEPMVDLDGELPFVRPLPHIAVL . .. : ::. .. .:: .. . . :: . : :. . : ... CCDS34 TRQSFC---FTNFENG-KCSVPKAFNTTKAKCCCSKM--PGEGW-GDPCELCPKDDEVAF 2100 2110 2120 2130 2140 2150 380 390 400 410 420 430 pF1KA0 QDELPQLFQDDDVGADEEEAELRGEHTLTEKFVCLDDSFGHDCSLTCDDCRNGGTCLLGL :: : :. :. .: ..: . : :: :. . CCDS34 QDLCPY-----------------GHGTVPSLHDTREDV--NECLESPGICSNG-QCI-NT 2160 2170 2180 2190 440 450 460 470 480 pF1KA0 DG---CDCPEGW----TGLICNETCPPDTFGKNCSFSCSCQNGGTCDSVTGACRCPPGVS :: :.:: :. ::. : .: .::.. : :: :: .: CCDS34 DGSFRCECPMGYNLDYTGVRCVDT-------DECSIGNPCGNG-TCTNVIGSFECNCNEG 2200 2210 2220 2230 2240 490 500 510 520 530 540 pF1KA0 GTNCEDGCPKGYYGKHCRKKCNCANRGRCHRLYGACLCDPGLYGRFCHLTCPPWAFGPGC CCDS34 FEPGPMMNCEDINECAQNPLLCAFRCMNTFGSYECTCPIGYALREDQKMCKDLDECAEGL 2250 2260 2270 2280 2290 2300 1229 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 10:21:18 2016 done: Thu Nov 3 10:21:19 2016 Total Scan time: 5.140 Total Display time: 0.700 Function used was FASTA [36.3.4 Apr, 2011]