FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7022, 972 aa 1>>>pF1KB7022 972 - 972 aa - 972 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 11.1116+/-0.00131; mu= -7.6051+/- 0.074 mean_var=495.5579+/-117.628, 0's: 0 Z-trim(108.1): 309 B-trim: 0 in 0/54 Lambda= 0.057614 statistics sampled from 9725 (10013) to 9725 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.652), E-opt: 0.2 (0.308), width: 16 Scan time: 3.390 The best scores are: opt bits E(32554) CCDS4302.1 CSF1R gene_id:1436|Hs108|chr5 ( 972) 6601 565.3 2e-160 CCDS47058.1 KIT gene_id:3815|Hs108|chr4 ( 972) 2267 205.1 5.6e-52 CCDS3496.1 KIT gene_id:3815|Hs108|chr4 ( 976) 2259 204.4 8.9e-52 CCDS31953.1 FLT3 gene_id:2322|Hs108|chr13 ( 993) 1465 138.4 6.6e-32 CCDS3497.1 KDR gene_id:3791|Hs108|chr4 (1356) 1184 115.2 8.7e-25 CCDS9330.1 FLT1 gene_id:2321|Hs108|chr13 (1338) 1176 114.6 1.4e-24 CCDS43412.1 FLT4 gene_id:2324|Hs108|chr5 (1298) 1163 113.5 2.8e-24 CCDS4457.1 FLT4 gene_id:2324|Hs108|chr5 (1363) 1163 113.5 2.9e-24 CCDS3495.1 PDGFRA gene_id:5156|Hs108|chr4 (1089) 756 79.6 3.9e-14 CCDS4303.1 PDGFRB gene_id:5159|Hs108|chr5 (1106) 697 74.7 1.2e-12 CCDS3354.1 FGFR3 gene_id:2261|Hs108|chr4 ( 694) 639 69.6 2.5e-11 CCDS3353.1 FGFR3 gene_id:2261|Hs108|chr4 ( 806) 639 69.7 2.7e-11 CCDS54706.1 FGFR3 gene_id:2261|Hs108|chr4 ( 808) 639 69.7 2.7e-11 CCDS81514.1 FGFR2 gene_id:2263|Hs108|chr10 ( 593) 626 68.4 4.7e-11 CCDS44488.1 FGFR2 gene_id:2263|Hs108|chr10 ( 680) 626 68.5 5.1e-11 CCDS44485.1 FGFR2 gene_id:2263|Hs108|chr10 ( 704) 626 68.5 5.2e-11 CCDS44487.1 FGFR2 gene_id:2263|Hs108|chr10 ( 705) 626 68.5 5.2e-11 CCDS53584.1 FGFR2 gene_id:2263|Hs108|chr10 ( 707) 626 68.5 5.3e-11 CCDS44486.1 FGFR2 gene_id:2263|Hs108|chr10 ( 709) 626 68.5 5.3e-11 CCDS73210.1 FGFR2 gene_id:2263|Hs108|chr10 ( 732) 626 68.5 5.4e-11 CCDS44489.1 FGFR2 gene_id:2263|Hs108|chr10 ( 769) 626 68.6 5.5e-11 CCDS81515.1 FGFR2 gene_id:2263|Hs108|chr10 ( 819) 626 68.6 5.8e-11 CCDS31298.1 FGFR2 gene_id:2263|Hs108|chr10 ( 821) 626 68.6 5.8e-11 CCDS7620.2 FGFR2 gene_id:2263|Hs108|chr10 ( 822) 626 68.6 5.8e-11 CCDS53525.1 RET gene_id:5979|Hs108|chr10 (1072) 627 68.8 6.5e-11 CCDS7200.1 RET gene_id:5979|Hs108|chr10 (1114) 627 68.8 6.6e-11 CCDS78096.1 FGFR4 gene_id:2264|Hs108|chr5 ( 734) 616 67.7 9.6e-11 CCDS4411.1 FGFR4 gene_id:2264|Hs108|chr5 ( 762) 616 67.7 9.8e-11 >>CCDS4302.1 CSF1R gene_id:1436|Hs108|chr5 (972 aa) initn: 6601 init1: 6601 opt: 6601 Z-score: 2993.5 bits: 565.3 E(32554): 2e-160 Smith-Waterman score: 6601; 100.0% identity (100.0% similar) in 972 aa overlap (1-972:1-972) 10 20 30 40 50 60 pF1KB7 MGPGVLLLLLVATAWHGQGIPVIEPSVPELVVKPGATVTLRCVGNGSVEWDGPPSPHWTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MGPGVLLLLLVATAWHGQGIPVIEPSVPELVVKPGATVTLRCVGNGSVEWDGPPSPHWTL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 YSDGSSSILSTNNATFQNTGTYRCTEPGDPLGGSAAIHLYVKDPARPWNVLAQEVVVFED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 YSDGSSSILSTNNATFQNTGTYRCTEPGDPLGGSAAIHLYVKDPARPWNVLAQEVVVFED 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 QDALLPCLLTDPVLEAGVSLVRVRGRPLMRHTNYSFSPWHGFTIHRAKFIQSQDYQCSAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 QDALLPCLLTDPVLEAGVSLVRVRGRPLMRHTNYSFSPWHGFTIHRAKFIQSQDYQCSAL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 MGGRKVMSISIRLKVQKVIPGPPALTLVPAELVRIRGEAAQIVCSASSVDVNFDVFLQHN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MGGRKVMSISIRLKVQKVIPGPPALTLVPAELVRIRGEAAQIVCSASSVDVNFDVFLQHN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 NTKLAIPQQSDFHNNRYQKVLTLNLDQVDFQHAGNYSCVASNVQGKHSTSMFFRVVESAY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 NTKLAIPQQSDFHNNRYQKVLTLNLDQVDFQHAGNYSCVASNVQGKHSTSMFFRVVESAY 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 LNLSSEQNLIQEVTVGEGLNLKVMVEAYPGLQGFNWTYLGPFSDHQPEPKLANATTKDTY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LNLSSEQNLIQEVTVGEGLNLKVMVEAYPGLQGFNWTYLGPFSDHQPEPKLANATTKDTY 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 RHTFTLSLPRLKPSEAGRYSFLARNPGGWRALTFELTLRYPPEVSVIWTFINGSGTLLCA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 RHTFTLSLPRLKPSEAGRYSFLARNPGGWRALTFELTLRYPPEVSVIWTFINGSGTLLCA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB7 ASGYPQPNVTWLQCSGHTDRCDEAQVLQVWDDPYPEVLSQEPFHKVTVQSLLTVETLEHN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ASGYPQPNVTWLQCSGHTDRCDEAQVLQVWDDPYPEVLSQEPFHKVTVQSLLTVETLEHN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB7 QTYECRAHNSVGSGSWAFIPISAGAHTHPPDEFLFTPVVVACMSIMALLLLLLLLLLYKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 QTYECRAHNSVGSGSWAFIPISAGAHTHPPDEFLFTPVVVACMSIMALLLLLLLLLLYKY 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB7 KQKPKYQVRWKIIESYEGNSYTFIDPTQLPYNEKWEFPRNNLQFGKTLGAGAFGKVVEAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KQKPKYQVRWKIIESYEGNSYTFIDPTQLPYNEKWEFPRNNLQFGKTLGAGAFGKVVEAT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB7 AFGLGKEDAVLKVAVKMLKSTAHADEKEALMSELKIMSHLGQHENIVNLLGACTHGGPVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 AFGLGKEDAVLKVAVKMLKSTAHADEKEALMSELKIMSHLGQHENIVNLLGACTHGGPVL 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB7 VITEYCCYGDLLNFLRRKAEAMLGPSLSPGQDPEGGVDYKNIHLEKKYVRRDSGFSSQGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VITEYCCYGDLLNFLRRKAEAMLGPSLSPGQDPEGGVDYKNIHLEKKYVRRDSGFSSQGV 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB7 DTYVEMRPVSTSSNDSFSEQDLDKEDGRPLELRDLLHFSSQVAQGMAFLASKNCIHRDVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 DTYVEMRPVSTSSNDSFSEQDLDKEDGRPLELRDLLHFSSQVAQGMAFLASKNCIHRDVA 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB7 ARNVLLTNGHVAKIGDFGLARDIMNDSNYIVKGNARLPVKWMAPESIFDCVYTVQSDVWS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ARNVLLTNGHVAKIGDFGLARDIMNDSNYIVKGNARLPVKWMAPESIFDCVYTVQSDVWS 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB7 YGILLWEIFSLGLNPYPGILVNSKFYKLVKDGYQMAQPAFAPKNIYSIMQACWALEPTHR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 YGILLWEIFSLGLNPYPGILVNSKFYKLVKDGYQMAQPAFAPKNIYSIMQACWALEPTHR 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB7 PTFQQICSFLQEQAQEDRRERDYTNLPSSSRSGGSGSSSSELEEESSSEHLTCCEQGDIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PTFQQICSFLQEQAQEDRRERDYTNLPSSSRSGGSGSSSSELEEESSSEHLTCCEQGDIA 910 920 930 940 950 960 970 pF1KB7 QPLLQPNNYQFC :::::::::::: CCDS43 QPLLQPNNYQFC 970 >>CCDS47058.1 KIT gene_id:3815|Hs108|chr4 (972 aa) initn: 1838 init1: 822 opt: 2267 Z-score: 1046.6 bits: 205.1 E(32554): 5.6e-52 Smith-Waterman score: 2301; 42.1% identity (69.5% similar) in 932 aa overlap (21-930:37-939) 10 20 30 40 50 pF1KB7 MGPGVLLLLLVATAWHGQGIPVIEPSVPELVVKPGATVTLRCVGNGSVEW : :.:. .:.:. : . : :. : :.: CCDS47 AWDFLCVLLLLLRVQTGSSQPSVSPGEPSPPSIHPGKSDLIVRVGDEIRLLCTDPGFVKW 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 DGPPSPHWTLYSDGSSSILSTNNATFQNTGTYRCTEPGDPLGGSAAIHLYVKDPARPWNV . ...... :..: ::: : :: . : : .:...:.:::. . . CCDS47 TFEILDE---TNENKQNEWITEKAEATNTGKYTCT---NKHGLSNSIYVFVRDPAKLF-L 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 LAQEVVVFEDQDALLPCLLTDPVLEAGVSLVRVRGRPLMRHTNYSFSPWHGFTIHRAKFI . . . ::.:.:. : :::: . .. :: .:.:: . . .: :. :. .: CCDS47 VDRSLYGKEDNDTLVRCPLTDPEV-TNYSLKGCQGKPLPKDLRFIPDPKAGIMIKSVKRA 120 130 140 150 160 170 180 190 200 210 220 pF1KB7 QSQD-YQCSALMGGRKVMSISIRLKVQKVIPGPPALTLVPAELVRIRGEAAQIVCSASSV . .::. . :..:.: .. :::. .. . :.... : . .:: ..:. ..: CCDS47 YHRLCLHCSVDQEGKSVLSEKFILKVRPAFKAVPVVSVSKASYLLREGEEFTVTCTIKDV 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB7 DVN-FDVFLQHNN-TKLAIPQQSDFHNN-RYQKVLTLNLDQVDFQHAGNYSCVASNVQGK . . .... ..:. ::: .: :.. :.. ::..... . .: . : :.:. :. CCDS47 SSSVYSTWKRENSQTKLQEKYNSWHHGDFNYERQATLTISSARVNDSGVFMCYANNTFGS 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB7 HSTSMFFRVVESAYLNLSSEQNLIQEVTVGEGLNLKVMVEAYPGLQGFNWTYLG-PFSDH ... ..::.....:. : :. ::...: : ::.: . .: :.. :.:. CCDS47 ANVTTTLEVVDKGFINIFPMINTTVFVNDGENVDLIVEYEAFPKPEHQQWIYMNRTFTDK 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB7 QPE-PKLANATTKDTYRHTFTLSLPRLKPSEAGRYSFLARNPGGWRALTFELTLRYPPEV . :: : ... :.. : : ::: .:.: :.::. : :..:.. . ::. CCDS47 WEDYPKSEN---ESNIRYVSELHLTRLKGTEGGTYTFLVSNSDVNAAIAFNVYVNTKPEI 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB7 SVIWTFINGSGTLLCAASGYPQPNVTWLQCSGHTDRCDEAQVLQVWDDPYPEVLSQEPFH . ..: : : :.:.:.:.:.. : : : .::. :.:: : : : :: CCDS47 LTYDRLVN--GMLQCVAAGFPEPTIDWYFCPGTEQRCS-ASVLPV--DVQTLNSSGPPFG 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB7 KVTVQSLLTVETLEHNQTYECRAHNSVGSGSWAFIPISAGAHTHPPDEFLFTPVVVACMS :..::: . ...:: : ::.:.:.::. : :.. .. . :: . ::::.... . CCDS47 KLVVQSSIDSSAFKHNGTVECKAYNDVGKTS-AYFNFAFKEQIHP--HTLFTPLLIGFVI 480 490 500 510 520 530 540 550 560 570 580 pF1KB7 IMALLLLLLLLLLYKYKQKPKYQVRWKIIESYEGNSYTFIDPTQLPYNEKWEFPRNNLQF . ... .....: ::: ::: :.:.::..: .::.:..::::::::..::::::: :.: CCDS47 VAGMMCIIVMILTYKYLQKPMYEVQWKVVEEINGNNYVYIDPTQLPYDHKWEFPRNRLSF 530 540 550 560 570 580 590 600 610 620 630 640 pF1KB7 GKTLGAGAFGKVVEATAFGLGKEDAVLKVAVKMLKSTAHADEKEALMSELKIMSHLGQHE :::::::::::::::::.:: : ::.. ::::::: .:: :.::::::::..:.::.: CCDS47 GKTLGAGAFGKVVEATAYGLIKSDAAMTVAVKMLKPSAHLTEREALMSELKVLSYLGNHM 590 600 610 620 630 640 650 660 670 680 690 700 pF1KB7 NIVNLLGACTHGGPVLVITEYCCYGDLLNFLRRKAEAMLGPSLSPGQDPEGGVDYKNIHL :::::::::: :::.::::::::::::::::::: .... : .: .. :::. CCDS47 NIVNLLGACTIGGPTLVITEYCCYGDLLNFLRRKRDSFI---CSKQEDHAEAALYKNLLH 650 660 670 680 690 700 710 720 730 740 pF1KB7 EKKYVRRDSGFSSQGVDTYVEMRP----VSTSSND--------SFSEQDLD----KEDGR :. :: .. :..:.: : .. : :. :.:. ..: CCDS47 SKESSCSDS------TNEYMDMKPGVSYVVPTKADKRRSVRIGSYIERDVTPAIMEDDEL 710 720 730 740 750 750 760 770 780 790 800 pF1KB7 PLELRDLLHFSSQVAQGMAFLASKNCIHRDVAARNVLLTNGHVAKIGDFGLARDIMNDSN :.:.::: :: :::.::::::::::::::.::::.:::.:...:: :::::::: :::: CCDS47 ALDLEDLLSFSYQVAKGMAFLASKNCIHRDLAARNILLTHGRITKICDFGLARDIKNDSN 760 770 780 790 800 810 810 820 830 840 850 860 pF1KB7 YIVKGNARLPVKWMAPESIFDCVYTVQSDVWSYGILLWEIFSLGLNPYPGILVNSKFYKL :.::::::::::::::::::.:::: .::::::::.:::.:::: .::::. :.:::::. CCDS47 YVVKGNARLPVKWMAPESIFNCVYTFESDVWSYGIFLWELFSLGSSPYPGMPVDSKFYKM 820 830 840 850 860 870 870 880 890 900 910 920 pF1KB7 VKDGYQMAQPAFAPKNIYSIMQACWALEPTHRPTFQQICSFLQEQAQEDRRERDYTNLPS .:.:..: .: :: ..:.::..:: .: .::::.:: .....: .:. .. :.:: . CCDS47 IKEGFRMLSPEHAPAEMYDIMKTCWDADPLKRPTFKQIVQLIEKQISEST-NHIYSNLAN 880 890 900 910 920 930 930 940 950 960 970 pF1KB7 SSRSGGSGSSSSELEEESSSEHLTCCEQGDIAQPLLQPNNYQFC : CCDS47 CSPNRQKPVVDHSVRINSVGSTASSSQPLLVHDDV 940 950 960 970 >>CCDS3496.1 KIT gene_id:3815|Hs108|chr4 (976 aa) initn: 1838 init1: 822 opt: 2259 Z-score: 1043.0 bits: 204.4 E(32554): 8.9e-52 Smith-Waterman score: 2293; 42.0% identity (69.0% similar) in 935 aa overlap (21-930:37-943) 10 20 30 40 50 pF1KB7 MGPGVLLLLLVATAWHGQGIPVIEPSVPELVVKPGATVTLRCVGNGSVEW : :.:. .:.:. : . : :. : :.: CCDS34 AWDFLCVLLLLLRVQTGSSQPSVSPGEPSPPSIHPGKSDLIVRVGDEIRLLCTDPGFVKW 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 DGPPSPHWTLYSDGSSSILSTNNATFQNTGTYRCTEPGDPLGGSAAIHLYVKDPARPWNV . ...... :..: ::: : :: . : : .:...:.:::. . . CCDS34 TFEILDE---TNENKQNEWITEKAEATNTGKYTCT---NKHGLSNSIYVFVRDPAKLF-L 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 LAQEVVVFEDQDALLPCLLTDPVLEAGVSLVRVRGRPLMRHTNYSFSPWHGFTIHRAKFI . . . ::.:.:. : :::: . .. :: .:.:: . . .: :. :. .: CCDS34 VDRSLYGKEDNDTLVRCPLTDPEV-TNYSLKGCQGKPLPKDLRFIPDPKAGIMIKSVKRA 120 130 140 150 160 170 180 190 200 210 220 pF1KB7 QSQD-YQCSALMGGRKVMSISIRLKVQKVIPGPPALTLVPAELVRIRGEAAQIVCSASSV . .::. . :..:.: .. :::. .. . :.... : . .:: ..:. ..: CCDS34 YHRLCLHCSVDQEGKSVLSEKFILKVRPAFKAVPVVSVSKASYLLREGEEFTVTCTIKDV 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB7 DVN-FDVFLQHNN-TKLAIPQQSDFHNN-RYQKVLTLNLDQVDFQHAGNYSCVASNVQGK . . .... ..:. ::: .: :.. :.. ::..... . .: . : :.:. :. CCDS34 SSSVYSTWKRENSQTKLQEKYNSWHHGDFNYERQATLTISSARVNDSGVFMCYANNTFGS 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB7 HSTSMFFRVVESAYLNLSSEQNLIQEVTVGEGLNLKVMVEAYPGLQGFNWTYLG-PFSDH ... ..::.....:. : :. ::...: : ::.: . .: :.. :.:. CCDS34 ANVTTTLEVVDKGFINIFPMINTTVFVNDGENVDLIVEYEAFPKPEHQQWIYMNRTFTDK 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB7 QPE-PKLANATTKDTYRHTFTLSLPRLKPSEAGRYSFLARNPGGWRALTFELTLRYPPEV . :: : ... :.. : : ::: .:.: :.::. : :..:.. . ::. CCDS34 WEDYPKSEN---ESNIRYVSELHLTRLKGTEGGTYTFLVSNSDVNAAIAFNVYVNTKPEI 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB7 SVIWTFINGSGTLLCAASGYPQPNVTWLQCSGHTDRCDEAQVLQVWDDPYPEVLSQEPFH . ..: : : :.:.:.:.:.. : : : .::. :.:: : : : :: CCDS34 LTYDRLVN--GMLQCVAAGFPEPTIDWYFCPGTEQRCS-ASVLPV--DVQTLNSSGPPFG 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB7 KVTVQSLLTVETLEHNQTYECRAHNSVGSGSWAFIPISAGAHT---HPPDEFLFTPVVVA :..::: . ...:: : ::.:.:.::. : : : . :: . ::::.... CCDS34 KLVVQSSIDSSAFKHNGTVECKAYNDVGKTSAYFNFAFKGNNKEQIHP--HTLFTPLLIG 480 490 500 510 520 530 540 550 560 570 580 pF1KB7 CMSIMALLLLLLLLLLYKYKQKPKYQVRWKIIESYEGNSYTFIDPTQLPYNEKWEFPRNN . . ... .....: ::: ::: :.:.::..: .::.:..::::::::..::::::: CCDS34 FVIVAGMMCIIVMILTYKYLQKPMYEVQWKVVEEINGNNYVYIDPTQLPYDHKWEFPRNR 530 540 550 560 570 580 590 600 610 620 630 640 pF1KB7 LQFGKTLGAGAFGKVVEATAFGLGKEDAVLKVAVKMLKSTAHADEKEALMSELKIMSHLG :.::::::::::::::::::.:: : ::.. ::::::: .:: :.::::::::..:.:: CCDS34 LSFGKTLGAGAFGKVVEATAYGLIKSDAAMTVAVKMLKPSAHLTEREALMSELKVLSYLG 590 600 610 620 630 640 650 660 670 680 690 700 pF1KB7 QHENIVNLLGACTHGGPVLVITEYCCYGDLLNFLRRKAEAMLGPSLSPGQDPEGGVDYKN .: :::::::::: :::.::::::::::::::::::: .... : .: .. ::: CCDS34 NHMNIVNLLGACTIGGPTLVITEYCCYGDLLNFLRRKRDSFI---CSKQEDHAEAALYKN 650 660 670 680 690 700 710 720 730 740 pF1KB7 IHLEKKYVRRDSGFSSQGVDTYVEMRP----VSTSSND--------SFSEQDLD----KE . :. :: .. :..:.: : .. : :. :.:. .. CCDS34 LLHSKESSCSDS------TNEYMDMKPGVSYVVPTKADKRRSVRIGSYIERDVTPAIMED 710 720 730 740 750 750 760 770 780 790 800 pF1KB7 DGRPLELRDLLHFSSQVAQGMAFLASKNCIHRDVAARNVLLTNGHVAKIGDFGLARDIMN : :.:.::: :: :::.::::::::::::::.::::.:::.:...:: :::::::: : CCDS34 DELALDLEDLLSFSYQVAKGMAFLASKNCIHRDLAARNILLTHGRITKICDFGLARDIKN 760 770 780 790 800 810 810 820 830 840 850 860 pF1KB7 DSNYIVKGNARLPVKWMAPESIFDCVYTVQSDVWSYGILLWEIFSLGLNPYPGILVNSKF ::::.::::::::::::::::::.:::: .::::::::.:::.:::: .::::. :.::: CCDS34 DSNYVVKGNARLPVKWMAPESIFNCVYTFESDVWSYGIFLWELFSLGSSPYPGMPVDSKF 820 830 840 850 860 870 870 880 890 900 910 920 pF1KB7 YKLVKDGYQMAQPAFAPKNIYSIMQACWALEPTHRPTFQQICSFLQEQAQEDRRERDYTN ::..:.:..: .: :: ..:.::..:: .: .::::.:: .....: .:. .. :.: CCDS34 YKMIKEGFRMLSPEHAPAEMYDIMKTCWDADPLKRPTFKQIVQLIEKQISEST-NHIYSN 880 890 900 910 920 930 930 940 950 960 970 pF1KB7 LPSSSRSGGSGSSSSELEEESSSEHLTCCEQGDIAQPLLQPNNYQFC : . : CCDS34 LANCSPNRQKPVVDHSVRINSVGSTASSSQPLLVHDDV 940 950 960 970 >>CCDS31953.1 FLT3 gene_id:2322|Hs108|chr13 (993 aa) initn: 1426 init1: 785 opt: 1465 Z-score: 686.3 bits: 138.4 E(32554): 6.6e-32 Smith-Waterman score: 1562; 38.1% identity (65.9% similar) in 741 aa overlap (203-926:253-958) 180 190 200 210 220 230 pF1KB7 QDYQCSALMGGRKVMSISIRLKVQKVIPGPPALTLVPAELVRIRGEAAQIVCSASSVDVN : :: : .... :: : :.: :. . CCDS31 ELFGTDIRCCARNELGRECTRLFTIDLNQTPQTTL-PQLFLKV-GEPLWIRCKAVHVNHG 230 240 250 260 270 280 240 250 260 270 280 pF1KB7 FDVFLQHNNTKLA---IPQQSDFHNNRYQ-KVLTLNLDQVDFQHAGNYSCVASNVQGKH- : . . .: : ..: . .:: . ..: ...: . .: :.: .: :: CCDS31 FGLTWELENKALEEGNYFEMSTYSTNRTMIRILFAFVSSVARNDTGYYTCSSS----KHP 290 300 310 320 330 290 300 310 320 330 340 pF1KB7 STSMFFRVVESAYLNLSSEQNLIQEVTVGEGLNLKVMVEAYPGLQGFNWTYLGPFSDHQP : : . .::....: ..... :. : . ..: .::: .. .::. ... CCDS31 SQSALVTIVEKGFIN-ATNSSEDYEIDQYEEFCFSVRFKAYPQIR-CTWTF-----SRKS 340 350 360 370 380 350 360 370 380 390 400 pF1KB7 EPKLANATTKDTYRHTFTLSLPRLKPSEAGRYSFLARNPGGWRALTFELTLRYPPEVSVI : . . ...: . . :.: : :.: . . : :..: :.: . CCDS31 FP-----CEQKGLDNGYSISKFCNHKHQPGEYIFHAENDDAQFTKMFTLNIRRKPQVLAE 390 400 410 420 430 440 410 420 430 440 450 460 pF1KB7 WTFINGSGTLLCAASGYPQPNVTWLQCSGHTDRCDEAQVLQVWDDPYPEVLSQEPFHKVT . ..: : ..::: :. :: .:: .. : : . ::. . ... : . . CCDS31 ASASQAS----CFSDGYPLPSWTWKKCSDKSPNCTEEITEGVWN----RKANRKVFGQWV 450 460 470 480 490 470 480 490 500 510 520 pF1KB7 VQSLLTVETLEHNQTYECRAHNSVGSGSWAFIPISAGAHTHPPDEFLFTPVVVACMSIMA .: :.. .. .: :.::.:.. ... : : :.. : .. .:. CCDS31 SSSTLNMSEAIKGFLVKCCAYNSLGTSCETILLNSPGPFPFIQDNISFYATIGVCL---L 500 510 520 530 540 550 530 540 550 560 570 580 pF1KB7 LLLLLLLLLLYKYKQKPKYQVRWKIIE--SYEGNSYTFIDPTQLPYNEKWEFPRNNLQFG ....: ::. .:::.. .:. . .... . : : ..: . :. ::::::.::.:: CCDS31 FIVVLTLLICHKYKKQFRYESQLQMVQVTGSSDNEYFYVDFREYEYDLKWEFPRENLEFG 560 570 580 590 600 610 590 600 610 620 630 640 pF1KB7 KTLGAGAFGKVVEATAFGLGKEDAVLKVAVKMLKSTAHADEKEALMSELKIMSHLGQHEN :.::.::::::..:::.:..: . ..::::::: : ..:.::::::::.:..::.::: CCDS31 KVLGSGAFGKVMNATAYGISKTGVSIQVAVKMLKEKADSSEREALMSELKMMTQLGSHEN 620 630 640 650 660 670 650 660 670 680 690 700 pF1KB7 IVNLLGACTHGGPVLVITEYCCYGDLLNFLRRKAEAMLGPSLSPGQDPEGGVDYKNIHLE ::::::::: .::. .: ::::::::::.:: : : . .. . . : ... . CCDS31 IVNLLGACTLSGPIYLIFEYCCYGDLLNYLRSKREKFHRTWTEIFKEHNFSF-YPTFQSH 680 690 700 710 720 730 710 720 730 740 750 pF1KB7 KKYVRRDSGFSSQGVDTYVEMRPVSTSSNDSF-SEQDLDKEDGRPLE---------LRDL . .: .:. :. . . .: ..:: ::.... :. . :: ..:: CCDS31 PN----SSMPGSREVQIHPDSDQISGLHGNSFHSEDEIEYENQKRLEEEEDLNVLTFEDL 740 750 760 770 780 760 770 780 790 800 810 pF1KB7 LHFSSQVAQGMAFLASKNCIHRDVAARNVLLTNGHVAKIGDFGLARDIMNDSNYIVKGNA : :. :::.:: :: :.:.:::.::::::.:.:.:.:: :::::::::.::::.:.::: CCDS31 LCFAYQVAKGMEFLEFKSCVHRDLAARNVLVTHGKVVKICDFGLARDIMSDSNYVVRGNA 790 800 810 820 830 840 820 830 840 850 860 870 pF1KB7 RLPVKWMAPESIFDCVYTVQSDVWSYGILLWEIFSLGLNPYPGILVNSKFYKLVKDGYQM :::::::::::.:. .::..:::::::::::::::::.:::::: :...::::...:..: CCDS31 RLPVKWMAPESLFEGIYTIKSDVWSYGILLWEIFSLGVNPYPGIPVDANFYKLIQNGFKM 850 860 870 880 890 900 880 890 900 910 920 930 pF1KB7 AQPAFAPKNIYSIMQACWALEPTHRPTFQQICSFLQEQAQEDRRERDYTNLPSSSRSGGS :: .: ..:: :::.:::.. .::.: .. ::: : : .: : :. CCDS31 DQPFYATEEIYIIMQSCWAFDSRKRPSFPNLTSFLGCQLA-DAEEAMYQNVDGRVSECPH 910 920 930 940 950 960 940 950 960 970 pF1KB7 GSSSSELEEESSSEHLTCCEQGDIAQPLLQPNNYQFC CCDS31 TYQNRRPFSREMDLGLLSPQAQVEDS 970 980 990 >>CCDS3497.1 KDR gene_id:3791|Hs108|chr4 (1356 aa) initn: 1134 init1: 650 opt: 1184 Z-score: 558.5 bits: 115.2 E(32554): 8.7e-25 Smith-Waterman score: 1226; 35.1% identity (60.2% similar) in 733 aa overlap (276-968:528-1216) 250 260 270 280 290 300 pF1KB7 IPQQSDFHNNRYQKVLTLNLDQVDFQHAGNYSCVASNVQGKHSTSMFFRVVESAYLNLSS :.: : : :. . :.:... ..:. CCDS34 EVNKNQFALIEGKNKTVSTLVIQAANVSALYKCEAVNKVGRGERVISFHVTRGPEITLQP 500 510 520 530 540 550 310 320 330 340 350 pF1KB7 EQNLIQEVTVGEGLNLKVMVEAYPGLQGFNWTYLGP--FSDH---QPEP---------KL ... .. :...: .. .....: ::: . : : : :: CCDS34 DMQPTEQ----ESVSLWCTAD-RSTFENLTWYKLGPQPLPIHVGELPTPVCKNLDTLWKL 560 570 580 590 600 610 360 370 380 390 400 pF1KB7 ANATTKDTYRHTFTLSLPRLKPSEAGRYSFLA--RNPGGWRALTFELTL--RYPPEVSVI . ... . . : . .. : : :: :. . .. .::. : : .. CCDS34 NATMFSNSTNDILIMELKNASLQDQGDYVCLAQDRKTKKRHCVVRQLTVLERVAPTITGN 620 630 640 650 660 670 410 420 430 440 450 460 pF1KB7 W----TFINGSGTLLCAASGYPQPNVTWLQCSGHTDRCDEAQVLQVWDDPYPEVLSQEPF : :. : . :.::: : :.. :.. ...: : . ::. . CCDS34 LENQTTSIGESIEVSCTASGNPPPQIMWFK-DNETLVEDSGIVLK------------DGN 680 690 700 710 470 480 490 500 510 520 pF1KB7 HKVTVQSLLTVETLEHNQTYECRAHNSVGSGSWAFIPISAGAHTHPPDEFLFTPVVVACM ...:.. . : . : :.: . .: .. . : ::. . :.. ..:. CCDS34 RNLTIRRVRK----EDEGLYTCQACSVLGCAKVEAFFIIEGAQEKTNLEII---ILVGTA 720 730 740 750 760 770 530 540 550 560 570 pF1KB7 SIMALLLLLLLLLLYKYKQKPKYQVRWKIIESYEGNSYTFIDPTQLPYNE---------- : .. :::...: :. ... : .:: .:: .: CCDS34 VIAMFFWLLLVIILRTVKRANGGELK-------TGYLSIVMDPDELPLDEHCERLPYDAS 780 790 800 810 820 580 590 600 610 620 630 pF1KB7 KWEFPRNNLQFGKTLGAGAFGKVVEATAFGLGKEDAVLKVAVKMLKSTAHADEKEALMSE ::::::. :..:: :: ::::.:.:: :::. : . ::::::: : .:..::::: CCDS34 KWEFPRDRLKLGKPLGRGAFGQVIEADAFGIDKTATCRTVAVKMLKEGATHSEHRALMSE 830 840 850 860 870 880 640 650 660 670 680 690 pF1KB7 LKIMSHLGQHENIVNLLGACTH-GGPVLVITEYCCYGDLLNFLRRKAEAMLGPSLSPGQD :::. :.:.: :.::::::::. :::..::.:.: .:.: ..:: : . .. : . : CCDS34 LKILIHIGHHLNVVNLLGACTKPGGPLMVIVEFCKFGNLSTYLRSKRNEFV-PYKTKGAR 890 900 910 920 930 940 700 710 720 730 740 pF1KB7 PEGGVDYKN-IHLEKKYVRRDSGFSSQGVDT--YVEMRPVSTSSNDSFSEQDLDKEDGRP . : :: . : .. : : :: :::. . .:: . .: .. : :: :. CCDS34 FRQGKDYVGAIPVDLKR-RLDSITSSQSSASSGFVEEKSLSDVEEEEAPE-DLYKD---F 950 960 970 980 990 750 760 770 780 790 800 pF1KB7 LELRDLLHFSSQVAQGMAFLASKNCIHRDVAARNVLLTNGHVAKIGDFGLARDIMNDSNY : :. :. .: :::.:: ::::..:::::.::::.::.. .:.:: ::::::::..: .: CCDS34 LTLEHLICYSFQVAKGMEFLASRKCIHRDLAARNILLSEKNVVKICDFGLARDIYKDPDY 1000 1010 1020 1030 1040 1050 810 820 830 840 850 860 pF1KB7 IVKGNARLPVKWMAPESIFDCVYTVQSDVWSYGILLWEIFSLGLNPYPGILVNSKFYKLV . ::.::::.::::::.::: :::.::::::.:.::::::::: .::::. .. .: . . CCDS34 VRKGDARLPLKWMAPETIFDRVYTIQSDVWSFGVLLWEIFSLGASPYPGVKIDEEFCRRL 1060 1070 1080 1090 1100 1110 870 880 890 900 910 920 pF1KB7 KDGYQMAQPAFAPKNIYSIMQACWALEPTHRPTFQQIC----SFLQEQAQEDRRERDYTN :.: .: : .. ..:. : :: ::..::::... ..:: .::.: . :: CCDS34 KEGTRMRAPDYTTPEMYQTMLDCWHGEPSQRPTFSELVEHLGNLLQANAQQDGK--DYIV 1120 1130 1140 1150 1160 1170 930 940 950 960 970 pF1KB7 LPSSSRSGGSGSSSSELEEESSSEHLTCCEQGDIAQPLLQPNNYQFC :: : : .: : .: ..: :. .. .: .. .: CCDS34 LPISETL--SMEEDSGLSLPTSP--VSCMEEEEVCDPKFHYDNTAGISQYLQNSKRKSRP 1180 1190 1200 1210 1220 1230 CCDS34 VSVKTFEDIPLEEPEVKVIPDDNQTDSGMVLASEELKTLEDRTKLSPSFGGMVPSKSRES 1240 1250 1260 1270 1280 1290 >>CCDS9330.1 FLT1 gene_id:2321|Hs108|chr13 (1338 aa) initn: 973 init1: 636 opt: 1176 Z-score: 555.0 bits: 114.6 E(32554): 1.4e-24 Smith-Waterman score: 1282; 34.9% identity (63.0% similar) in 744 aa overlap (218-940:477-1185) 190 200 210 220 230 240 pF1KB7 SISIRLKVQKVIPGPPALTLVPAELVRIRGEAAQIVCSASSVDVNFDVFLQHNNTKLAIP :: :: . . .:. . .: .: CCDS93 GSRQILTCTAYGIPQPTIKWFWHPCNHNHSEARCDFCSNNEESFILDADSNMGNRIESIT 450 460 470 480 490 500 250 260 270 280 290 300 pF1KB7 QQSDFHNNRYQKVLTLNLDQVDFQHAGNYSCVASNVQGKHSTSMFFRVVESAYLNLSSEQ :. . ... . . :: . .: . .: : :.::: : . .. : ... . . . CCDS93 QRMAIIEGKNKMASTLVV--ADSRISGIYICIASNKVGTVGRNISFYITD---VPNGFHV 510 520 530 540 550 560 310 320 330 340 350 360 pF1KB7 NLIQEVTVGEGLNLKVMVEAYPGLQGFNWTYLGPFSDHQPEPKLANATTKDTYRHTFTLS :: . : :: :.:. :. . . .: : ... . .... : .:..::. CCDS93 NLEKMPTEGEDLKLSCTVNKFL-YRDVTWILLRTVNNRTMHYSISKQKMAITKEHSITLN 570 580 590 600 610 620 370 380 390 400 410 pF1KB7 LPRLKPS--EAGRYSFLARNP-GGWRALTF-ELTLRYPPEVSVIWTF------INGSGTL : .. : ..: :. ::: : . : :.:.: .. .. :..: :: CCDS93 LTIMNVSLQDSGTYACRARNVYTGEEILQKKEITIRDQEAPYLLRNLSDHTVAISSSTTL 630 640 650 660 670 680 420 430 440 450 460 470 pF1KB7 LCAASGYPQPNVTWLQCSGHTDRCDEAQVLQVWDDPYPEVLSQEPFHKVTVQSLLTVETL : :.: :.:..::.. ..: . . . .: : .: : .: : CCDS93 DCHANGVPEPQITWFK-NNHKIQQEPGIIL----GPGSSTLFIE---RV---------TE 690 700 710 720 480 490 500 510 520 530 pF1KB7 EHNQTYECRAHNSVGS-GSWAFIPISAGAHTHPPDEFLFTPVVVACMSIMALLLLLLLLL : . .:.:.: :. :: : :.. ... . :. . ....: . : :. ::: : CCDS93 EDEGVYHCKATNQKGSVESSAYLTVQGTS-----DKSNLELITLTCTCVAATLFWLLLTL 730 740 750 760 770 540 550 560 570 580 590 pF1KB7 LYKYKQKPKYQVRWKIIESYEGNSYTFIDPT--QLPYNE-KWEFPRNNLQFGKTLGAGAF . . .. . ... . . . .: .:::. :::: :. :..::.:: ::: CCDS93 FIRKMKRSSSEIKTDYLSIIMDPDEVPLDEQCERLPYDASKWEFARERLKLGKSLGRGAF 780 790 800 810 820 830 600 610 620 630 640 650 pF1KB7 GKVVEATAFGLGKEDAVLKVAVKMLKSTAHADEKEALMSELKIMSHLGQHENIVNLLGAC ::::.:.:::. : . ::::::: : :.: .:::.::::..:.:.: :.::::::: CCDS93 GKVVQASAFGIKKSPTCRTVAVKMLKEGATASEYKALMTELKILTHIGHHLNVVNLLGAC 840 850 860 870 880 890 660 670 680 690 700 710 pF1KB7 T-HGGPVLVITEYCCYGDLLNFLRRKAEAM-LGPSLSPGQDPEGGVDYKNIHLEK-KYVR : .:::..::.::: ::.: :.:. : . . :. . . ..:. . . ::. : : CCDS93 TKQGGPLMVIVEYCKYGNLSNYLKSKRDLFFLNKDAALHMEPKK--EKMEPGLEQGKKPR 900 910 920 930 940 950 720 730 740 750 760 770 pF1KB7 RDSGFSSQGVDTYVEMRPVSTSSNDSFSEQDLDKEDGRPLELRDLLHFSSQVAQGMAFLA :: ::.. . .. : : : :.: : .:. ..::. .: :::.:: ::. CCDS93 LDSVTSSESFASSGFQEDKSLS--DVEEEEDSDGFYKEPITMEDLISYSFQVARGMEFLS 960 970 980 990 1000 1010 780 790 800 810 820 830 pF1KB7 SKNCIHRDVAARNVLLTNGHVAKIGDFGLARDIMNDSNYIVKGNARLPVKWMAPESIFDC :..:::::.::::.::....:.:: ::::::::... .:. ::..:::.:::::::::: CCDS93 SRKCIHRDLAARNILLSENNVVKICDFGLARDIYKNPDYVRKGDTRLPLKWMAPESIFDK 1020 1030 1040 1050 1060 1070 840 850 860 870 880 890 pF1KB7 VYTVQSDVWSYGILLWEIFSLGLNPYPGILVNSKFYKLVKDGYQMAQPAFAPKNIYSIMQ .:...:::::::.::::::::: .::::. .. : . ...:..: : .. .::.:: CCDS93 IYSTKSDVWSYGVLLWEIFSLGGSPYPGVQMDEDFCSRLREGMRMRAPEYSTPEIYQIML 1080 1090 1100 1110 1120 1130 900 910 920 930 940 pF1KB7 ACWALEPTHRPTF----QQICSFLQEQAQEDRRERDYTNLPSSSRSGGSGSSSSELEEES :: .: .:: : ... ..:: ..:.: . :: . .. .:.:: . : CCDS93 DCWHRDPKERPRFAELVEKLGDLLQANVQQDGK--DYIPI-NAILTGNSGFTYSTPAFSE 1140 1150 1160 1170 1180 1190 950 960 970 pF1KB7 SSEHLTCCEQGDIAQPLLQPNNYQFC CCDS93 DFFKESISAPKFNSGSSDDVRYVNAFKFMSLERIKTFEELLPNATSMFDDYQGDSSTLLA 1200 1210 1220 1230 1240 1250 >>CCDS43412.1 FLT4 gene_id:2324|Hs108|chr5 (1298 aa) initn: 1061 init1: 684 opt: 1163 Z-score: 549.3 bits: 113.5 E(32554): 2.8e-24 Smith-Waterman score: 1209; 33.8% identity (59.8% similar) in 758 aa overlap (250-965:508-1222) 220 230 240 250 260 270 pF1KB7 AQIVCSASSVDVNFDVFLQHNNTKLAIPQQSDFHNNRYQKVLTLNLDQVDFQHAGNYSCV ..: ... . : : ..... .. :.:: CCDS43 QQQDLMPQCRDWRAVTTQDAVNPIESLDTWTEFVEGKNKTVSKLVIQNANV--SAMYKCV 480 490 500 510 520 530 280 290 300 310 320 330 pF1KB7 ASNVQGKHSTSMFFRVVESAYLNLSSEQNLIQEVTVGEGLNLKVMVEAYPGLQGFNWTYL .:: :. ..: :. . ... :.. .:. :. . :. ....: . . : : CCDS43 VSNKVGQDERLIYFYVT-TIPDGFTIESKPSEELLEGQPVLLSCQADSYK-YEHLRWYRL 540 550 560 570 580 590 340 350 360 370 pF1KB7 G--PFSDHQPEPKLANATTKDTY---------------RH-TFTLSLPRLKPSEAGRY-- . . : . .: : . . . :: :..::.::. : . :.: CCDS43 NLSTLHDAHGNPLLLDCKNVHLFATPLAASLEEVAPGARHATLSLSIPRVAPEHEGHYVC 600 610 620 630 640 650 380 390 400 410 420 430 pF1KB7 SFLARNPGGWRALTFELTLRY--PPEVSVIWT--FINGSGTL--LCAASGYPQPNVTWLQ : . :... :... : ..: : .: : ..: :...: . CCDS43 EVQDRRSHDKHCHKKYLSVQALEAPRLTQNLTDLLVNVSDSLEMQCLVAGAHAPSIVWYK 660 670 680 690 700 710 440 450 460 470 480 490 pF1KB7 CSGHTDRCDEAQVLQVWDDPYPEVLSQEPFHKVTVQSLLTVETLEHNQTYECRAHNSVGS :: ..:. . : . .:...: . : : : . :. : CCDS43 --------DE-RLLEEKSG----VDLADSNQKLSIQRVRE----EDAGRYLCSVCNAKGC 720 730 740 750 500 510 520 530 540 550 pF1KB7 -GSWAFIPISAGAHTHPPDEFLFTPVVVACMSIMALLLLLLLLLLYKYKQKPKYQVRWKI .: : . . .. :. . :... ...:... .::::.. ..: . CCDS43 VNSSASVAVEGSE-----DKGSMEIVILVGTGVIAVFFWVLLLLIFCNMRRPAHA----- 760 770 780 790 800 560 570 580 590 600 pF1KB7 IESYEGNSYTFIDPTQLPYNEK----------WEFPRNNLQFGKTLGAGAFGKVVEATAF . : ..:: ..: .:. :::::. :..:..:: :::::::::.:: CCDS43 -DIKTGYLSIIMDPGEVPLEEQCEYLSYDASQWEFPRERLHLGRVLGYGAFGKVVEASAF 810 820 830 840 850 860 610 620 630 640 650 660 pF1KB7 GLGKEDAVLKVAVKMLKSTAHADEKEALMSELKIMSHLGQHENIVNLLGACTHG-GPVLV :. : .. ::::::: : :.:..::::::::. :.:.: :.::::::::. ::..: CCDS43 GIHKGSSCDTVAVKMLKEGATASEHRALMSELKILIHIGNHLNVVNLLGACTKPQGPLMV 870 880 890 900 910 920 670 680 690 700 710 720 pF1KB7 ITEYCCYGDLLNFLRRKAEAMLGPSLSPGQDPEGGVDYKNIHLEKKYVRRDSGFSSQGVD :.:.: ::.: :::: : .: ..: ..:: .. . . :: : : : CCDS43 IVEFCKYGNLSNFLRAKRDA-FSPCAE--KSPEQRGRFRAMVELARLDRRRPGSS----D 930 940 950 960 970 730 740 750 760 770 pF1KB7 TYVEMRPVSTSSNDSFSEQDLDKEDG--RPLELRDLLHFSSQVAQGMAFLASKNCIHRDV . : .: .. . : . :: :: ..::. .: :::.:: ::::..:::::. CCDS43 RVLFARFSKTEGGARRASPDQEAEDLWLSPLTMEDLVCYSFQVARGMEFLASRKCIHRDL 980 990 1000 1010 1020 1030 780 790 800 810 820 830 pF1KB7 AARNVLLTNGHVAKIGDFGLARDIMNDSNYIVKGNARLPVKWMAPESIFDCVYTVQSDVW ::::.::... :.:: ::::::::..: .:. ::.::::.:::::::::: :::.::::: CCDS43 AARNILLSESDVVKICDFGLARDIYKDPDYVRKGSARLPLKWMAPESIFDKVYTTQSDVW 1040 1050 1060 1070 1080 1090 840 850 860 870 880 890 pF1KB7 SYGILLWEIFSLGLNPYPGILVNSKFYKLVKDGYQMAQPAFAPKNIYSIMQACWALEPTH :.:.::::::::: .::::. .: .: . ..:: .: : .: : :: ::. .: CCDS43 SFGVLLWEIFSLGASPYPGVQINEEFCQRLRDGTRMRAPELATPAIRRIMLNCWSGDPKA 1100 1110 1120 1130 1140 1150 900 910 920 930 940 950 pF1KB7 RPTFQQICSFLQE--QAQEDRRERDYTNLPSSSRSGGSGSSSSELEEESSSEHLTCCEQG ::.:... .: . :.. ..:.. : ::.:. :: : . . . :.. . CCDS43 RPAFSELVEILGDLLQGRGLQEEEEVCMAPRSSQSSEEGSFS---QVSTMALHIAQADAE 1160 1170 1180 1190 1200 1210 960 970 pF1KB7 DIAQPLLQPNNYQFC : . : :: CCDS43 D-SPPSLQRHSLAARYYNWVSFPGCLARGAETRGSSRMKTFEEFPMTPTTYKGSVDNQTD 1220 1230 1240 1250 1260 1270 >>CCDS4457.1 FLT4 gene_id:2324|Hs108|chr5 (1363 aa) initn: 1061 init1: 684 opt: 1163 Z-score: 549.0 bits: 113.5 E(32554): 2.9e-24 Smith-Waterman score: 1209; 33.8% identity (59.8% similar) in 758 aa overlap (250-965:508-1222) 220 230 240 250 260 270 pF1KB7 AQIVCSASSVDVNFDVFLQHNNTKLAIPQQSDFHNNRYQKVLTLNLDQVDFQHAGNYSCV ..: ... . : : ..... .. :.:: CCDS44 QQQDLMPQCRDWRAVTTQDAVNPIESLDTWTEFVEGKNKTVSKLVIQNANV--SAMYKCV 480 490 500 510 520 530 280 290 300 310 320 330 pF1KB7 ASNVQGKHSTSMFFRVVESAYLNLSSEQNLIQEVTVGEGLNLKVMVEAYPGLQGFNWTYL .:: :. ..: :. . ... :.. .:. :. . :. ....: . . : : CCDS44 VSNKVGQDERLIYFYVT-TIPDGFTIESKPSEELLEGQPVLLSCQADSYK-YEHLRWYRL 540 550 560 570 580 590 340 350 360 370 pF1KB7 G--PFSDHQPEPKLANATTKDTY---------------RH-TFTLSLPRLKPSEAGRY-- . . : . .: : . . . :: :..::.::. : . :.: CCDS44 NLSTLHDAHGNPLLLDCKNVHLFATPLAASLEEVAPGARHATLSLSIPRVAPEHEGHYVC 600 610 620 630 640 650 380 390 400 410 420 430 pF1KB7 SFLARNPGGWRALTFELTLRY--PPEVSVIWT--FINGSGTL--LCAASGYPQPNVTWLQ : . :... :... : ..: : .: : ..: :...: . CCDS44 EVQDRRSHDKHCHKKYLSVQALEAPRLTQNLTDLLVNVSDSLEMQCLVAGAHAPSIVWYK 660 670 680 690 700 710 440 450 460 470 480 490 pF1KB7 CSGHTDRCDEAQVLQVWDDPYPEVLSQEPFHKVTVQSLLTVETLEHNQTYECRAHNSVGS :: ..:. . : . .:...: . : : : . :. : CCDS44 --------DE-RLLEEKSG----VDLADSNQKLSIQRVRE----EDAGRYLCSVCNAKGC 720 730 740 750 500 510 520 530 540 550 pF1KB7 -GSWAFIPISAGAHTHPPDEFLFTPVVVACMSIMALLLLLLLLLLYKYKQKPKYQVRWKI .: : . . .. :. . :... ...:... .::::.. ..: . CCDS44 VNSSASVAVEGSE-----DKGSMEIVILVGTGVIAVFFWVLLLLIFCNMRRPAHA----- 760 770 780 790 800 560 570 580 590 600 pF1KB7 IESYEGNSYTFIDPTQLPYNEK----------WEFPRNNLQFGKTLGAGAFGKVVEATAF . : ..:: ..: .:. :::::. :..:..:: :::::::::.:: CCDS44 -DIKTGYLSIIMDPGEVPLEEQCEYLSYDASQWEFPRERLHLGRVLGYGAFGKVVEASAF 810 820 830 840 850 860 610 620 630 640 650 660 pF1KB7 GLGKEDAVLKVAVKMLKSTAHADEKEALMSELKIMSHLGQHENIVNLLGACTHG-GPVLV :. : .. ::::::: : :.:..::::::::. :.:.: :.::::::::. ::..: CCDS44 GIHKGSSCDTVAVKMLKEGATASEHRALMSELKILIHIGNHLNVVNLLGACTKPQGPLMV 870 880 890 900 910 920 670 680 690 700 710 720 pF1KB7 ITEYCCYGDLLNFLRRKAEAMLGPSLSPGQDPEGGVDYKNIHLEKKYVRRDSGFSSQGVD :.:.: ::.: :::: : .: ..: ..:: .. . . :: : : : CCDS44 IVEFCKYGNLSNFLRAKRDA-FSPCAE--KSPEQRGRFRAMVELARLDRRRPGSS----D 930 940 950 960 970 730 740 750 760 770 pF1KB7 TYVEMRPVSTSSNDSFSEQDLDKEDG--RPLELRDLLHFSSQVAQGMAFLASKNCIHRDV . : .: .. . : . :: :: ..::. .: :::.:: ::::..:::::. CCDS44 RVLFARFSKTEGGARRASPDQEAEDLWLSPLTMEDLVCYSFQVARGMEFLASRKCIHRDL 980 990 1000 1010 1020 1030 780 790 800 810 820 830 pF1KB7 AARNVLLTNGHVAKIGDFGLARDIMNDSNYIVKGNARLPVKWMAPESIFDCVYTVQSDVW ::::.::... :.:: ::::::::..: .:. ::.::::.:::::::::: :::.::::: CCDS44 AARNILLSESDVVKICDFGLARDIYKDPDYVRKGSARLPLKWMAPESIFDKVYTTQSDVW 1040 1050 1060 1070 1080 1090 840 850 860 870 880 890 pF1KB7 SYGILLWEIFSLGLNPYPGILVNSKFYKLVKDGYQMAQPAFAPKNIYSIMQACWALEPTH :.:.::::::::: .::::. .: .: . ..:: .: : .: : :: ::. .: CCDS44 SFGVLLWEIFSLGASPYPGVQINEEFCQRLRDGTRMRAPELATPAIRRIMLNCWSGDPKA 1100 1110 1120 1130 1140 1150 900 910 920 930 940 950 pF1KB7 RPTFQQICSFLQE--QAQEDRRERDYTNLPSSSRSGGSGSSSSELEEESSSEHLTCCEQG ::.:... .: . :.. ..:.. : ::.:. :: : . . . :.. . CCDS44 RPAFSELVEILGDLLQGRGLQEEEEVCMAPRSSQSSEEGSFS---QVSTMALHIAQADAE 1160 1170 1180 1190 1200 1210 960 970 pF1KB7 DIAQPLLQPNNYQFC : . : :: CCDS44 D-SPPSLQRHSLAARYYNWVSFPGCLARGAETRGSSRMKTFEEFPMTPTTYKGSVDNQTD 1220 1230 1240 1250 1260 1270 >>CCDS3495.1 PDGFRA gene_id:5156|Hs108|chr4 (1089 aa) initn: 1359 init1: 743 opt: 756 Z-score: 367.3 bits: 79.6 E(32554): 3.9e-14 Smith-Waterman score: 1726; 34.3% identity (63.7% similar) in 969 aa overlap (20-926:27-965) 10 20 30 40 50 pF1KB7 MGPGVLLLLLVATAWHGQGIPVIEPSVPELVVKPGATVTLRCVGNGSVEWDGP .: : :. : ::. ... .::: :.. : :. : CCDS34 MGTSHPAFLVLGCLLTGLSLILCQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYP 10 20 30 40 50 60 60 70 80 90 pF1KB7 PSPHWT----LYSDGSSS-----ILSTNNATFQNTGTYRC------TEPGDPLGGSAAIH : . . . .. ..: .: ...:. .:: : : :: .. : :. CCDS34 MSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRH--IY 70 80 90 100 110 100 110 120 130 140 150 pF1KB7 LYVKDPAR---PWNVLAQEVVVFEDQDALLPCLLTDPVLEAGVSLVRVRGRPLMRHTNYS .:: :: : .. :.: .:..:..:: ::: :. :.: .: . : CCDS34 IYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDP--ETPVTLHNSEGV-----VPAS 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB7 FSPWHGFTIHRAKFIQSQDYQCSALMGGRKVMSISIRLKVQKVIPGPPALTLVPAELVRI .. .::. . : . : : : . :.: ..: . . . :. . : . . : CCDS34 YDSRQGFN---GTFTVGP-YICEATVKGKKFQTIPFNVYALKAT-SELDLEMEALKTVYK 180 190 200 210 220 220 230 240 250 260 270 pF1KB7 RGEAAQIVCSASSVDVNFDVFLQHNNTK-LAIPQQSDFHNNRYQKVLTLNLDQVDFQHAG ::. ..:.. . .: . ...: .: . ... . : ::.. .. . .: CCDS34 SGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSG 230 240 250 260 270 280 280 290 300 310 320 330 pF1KB7 NYSCVASNV--QGKHSTSMFFRVVESAYLNLSSEQNLIQEVTVGEGLNLKVMVEAYPGLQ .: :.: .. . :. .. . : :....... . .. :.. : .. : :.::: . CCDS34 DYECAARQATREVKEMKKVTISVHEKGFIEIKPTFSQLEAVNLHEVKHFVVEVRAYPPPR 290 300 310 320 330 340 340 350 360 370 380 390 pF1KB7 GFNWTYLGPFSDHQPEPKLANATTK-DTYRHTFTLSLPRLKPSEAGRYSFLARNPGGWRA ..: . .. . .... . : . :. :.: : : ..:.:...:.: . .. CCDS34 -ISWLK-NNLTLIENLTEITTDVEKIQEIRYRSKLKLIRAKEEDSGHYTIVAQNEDAVKS 350 360 370 380 390 400 400 410 420 430 440 pF1KB7 LTFELTLRYPPEVSVIWTFINGSG---TLLCAASGYPQPNVTWLQCSGHTDRCDEAQVLQ :::: . : . . .:: :. :.: : : :.. :. :. .:.. CCDS34 YTFELLTQVPSSILDLVDDHHGSTGGQTVRCTAEGTPLPDIEWMICKD-IKKCNNETSWT 410 420 430 440 450 460 450 460 470 480 490 500 pF1KB7 VWDDPYPEVLSQ-EPFHKVTVQSLLTVETLEHNQTYECRAHNSVGSGSWAFIPISAGAHT . . ..... . . ::.. .: .:.. . .: :.: .:. . . .. CCDS34 ILANNVSNIITEIHSRDRSTVEGRVTFAKVEETIAVRCLAKNLLGAENRELKLVA----- 470 480 490 500 510 510 520 530 540 550 560 pF1KB7 HPPDEFLFTPVVVACMSIMALLLLLLLLLLYKYKQKPKYQVRWKIIESY--EGNSYTFID : :..: . ....... :..:. .::::.:..::..::: .:. : ..: CCDS34 --PTLRSELTVAAAVLVLLVIVIISLIVLVVIWKQKPRYEIRWRVIESISPDGHEYIYVD 520 530 540 550 560 570 570 580 590 600 610 620 pF1KB7 PTQLPYNEKWEFPRNNLQFGKTLGAGAFGKVVEATAFGLGKEDAVLKVAVKMLKSTAHAD : ::::. .:::::..: .:..::.::::::::.::.::.. . :.:::::::: ::... CCDS34 PMQLPYDSRWEFPRDGLVLGRVLGSGAFGKVVEGTAYGLSRSQPVMKVAVKMLKPTARSS 580 590 600 610 620 630 630 640 650 660 670 680 pF1KB7 EKEALMSELKIMSHLGQHENIVNLLGACTHGGPVLVITEYCCYGDLLNFLRRKAEAMLG- ::.:::::::::.::: : ::::::::::..::. .::::: ::::.:.:... ...:. CCDS34 EKQALMSELKIMTHLGPHLNIVNLLGACTKSGPIYIITEYCFYGDLVNYLHKNRDSFLSH 640 650 660 670 680 690 690 700 710 pF1KB7 -P----------SLSPGQDP---------EGGVDYKNIH----------LEKKYVRRDSG : .:.:... :.. :: ... ::.: : . : CCDS34 HPEKPKKELDIFGLNPADESTRSYVILSFENNGDYMDMKQADTTQYVPMLERKEVSKYSD 700 710 720 730 740 750 720 730 740 750 760 770 pF1KB7 FSSQGVDTYVEMRPVSTSSN---DSFSEQDLDKEDGRPLELRDLLHFSSQVAQGMAFLAS .. . : ::.: ... :: .. :. .... : : ::: :. :::.:: :::: CCDS34 IQRSLYD-----RPASYKKKSMLDSEVKNLLSDDNSEGLTLLDLLSFTYQVARGMEFLAS 760 770 780 790 800 810 780 790 800 810 820 830 pF1KB7 KNCIHRDVAARNVLLTNGHVAKIGDFGLARDIMNDSNYIVKGNARLPVKWMAPESIFDCV :::.:::.:::::::..:...:: :::::::::.::::. ::.. ::::::::::::: . CCDS34 KNCVHRDLAARNVLLAQGKIVKICDFGLARDIMHDSNYVSKGSTFLPVKWMAPESIFDNL 820 830 840 850 860 870 840 850 860 870 880 890 pF1KB7 YTVQSDVWSYGILLWEIFSLGLNPYPGILVNSKFYKLVKDGYQMAQPAFAPKNIYSIMQA ::. ::::::::::::::::: .::::..:.: ::. .:.::.::.: : ...: :: CCDS34 YTTLSDVWSYGILLWEIFSLGGTPYPGMMVDSTFYNKIKSGYRMAKPDHATSEVYEIMVK 880 890 900 910 920 930 900 910 920 930 940 950 pF1KB7 CWALEPTHRPTFQQICSFLQEQAQEDRRERDYTNLPSSSRSGGSGSSSSELEEESSSEHL :: :: .::.: .. : . :. . ...: .. CCDS34 CWNSEPEKRPSFYHL-SEIVENLLPGQYKKSYEKIHLDFLKSDHPAVARMRVDSDNAYIG 940 950 960 970 980 990 960 970 pF1KB7 TCCEQGDIAQPLLQPNNYQFC CCDS34 VTYKNEEDKLKDWEGGLDEQRLSADSGYIIPLPDIDPVPEEEDLGKRNRHSSQTSEESAI 1000 1010 1020 1030 1040 1050 >>CCDS4303.1 PDGFRB gene_id:5159|Hs108|chr5 (1106 aa) initn: 1332 init1: 690 opt: 697 Z-score: 340.7 bits: 74.7 E(32554): 1.2e-12 Smith-Waterman score: 1736; 35.8% identity (62.8% similar) in 978 aa overlap (5-921:18-969) 10 20 30 40 pF1KB7 MGPGVLLLLLVATAWHGQGIPVIEPSVPELVVKPGATVTLRCVGNGS .: :::. .::. :. : ::::.. ..: .: : :.. CCDS43 MRLPGAMPALALKGELLLLSLLLLLEPQISQGL-VVTPPGPELVLNVSSTFVLTCSGSAP 10 20 30 40 50 50 60 70 80 90 100 pF1KB7 VEWD---GPPSPHWTLYSDGS-SSILSTNNATFQNTGTYRCTEP---GDPLGGSAAIHLY : :. : . . .::. ::.:. .: : .:: : ::. : .... CCDS43 VVWERMSQEPPQEMAKAQDGTFSSVLTLTNLTGLDTGEYFCTHNDSRGLETDERKRLYIF 60 70 80 90 100 110 110 120 130 140 150 pF1KB7 VKDPARPW-NVLAQEVVVF--EDQDALLPCLLTDPVLEAGVSLVRVRGRPLMRHTNYSFS : ::. . :.:. .: : . .:: .::: : :.: . .: . .. CCDS43 VPDPTVGFLPNDAEELFIFLTEITEITIPCRVTDPQLV--VTLHEKKGDVAL---PVPYD 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB7 PWHGFTIHRAKFIQSQDYQCSALMGGRKVMSISI---RLKVQKVIPGPPALTLVPAELVR .::. ......: :.. .: :.: : . ::.:... . :. : :: CCDS43 HQRGFS----GIFEDRSYICKTTIGDREVDSDAYYVYRLQVSSINVSVNAVQTV----VR 180 190 200 210 220 220 230 240 250 260 270 pF1KB7 IRGEAAQIVCSASSVDV-NFD-VFLQHNNTKLAIPQQSDFHNNRYQKVLTLNLDQVDFQH .:: ..: . . .: ::. .. .... .:. : . . . :. :.. ..... CCDS43 -QGENITLMCIVIGNEVVNFEWTYPRKESGRLVEPVTDFLLDMPYHIRSILHIPSAELED 230 240 250 260 270 280 280 290 300 310 320 330 pF1KB7 AGNYSCVASNVQGKHST--SMFFRVVESAYLNLSSEQNLIQEVTVGEGLNLKVMVEAYPG .:.:.: ... . :. .. . ::::.:. : .: . .: . . .. .:.:. :::: CCDS43 SGTYTCNVTESVNDHQDEKAINITVVESGYVRLLGEVGTLQFAELHRSRTLQVVFEAYPP 290 300 310 320 330 340 340 350 360 370 380 pF1KB7 LQGFNWTYLGPFSDHQP-EPKLANATTKDTYRHTFTLSLPRLKPSEAGRYSFLARNPGGW . . ..: . : :.. ....: :.. :.: :.: .:::.:.. : . . CCDS43 PTVLWFKDNRTLGDSSAGEIALSTRNVSET-RYVSELTLVRVKVAEAGHYTMRAFHEDAE 350 360 370 380 390 400 390 400 410 420 430 440 pF1KB7 RALTFELTLRYPPEVSVIWTFINGSG--TLLCAASGYPQPNVTWLQCSGHTDRCDEAQVL :.:.: . : .: . :: :. : . :.::::. : : :: . CCDS43 VQLSFQLQINVPVRVLELSESHPDSGEQTVRCRGRGMPQPNIIWSACRD-LKRCPRELPP 410 420 430 440 450 460 450 460 470 480 490 500 pF1KB7 QVWDDPYPE-------VLSQEPFHKVTVQSLLTVETLEHNQTYECRAHNSVGSGSWAFIP . . : : : .. : : : .. ... . .: .:.::. . : CCDS43 TLLGNSSEEESQLETNVTYWEEEQEFEVVSTLRLQHVDRPLSVRCTLRNAVGQDTQEVIV 470 480 490 500 510 520 510 520 530 540 550 pF1KB7 ISAGAHTHPPDEFLFTPVVV-ACMSIMALLLLLLLLLLYKYKQKPKYQVRWKIIESY--E . :. : : ::. : .....: .. :..:.. ...::.:..:::.::: . CCDS43 V---PHSLP-----FKVVVISAILALVVLTIISLIILIMLWQKKPRYEIRWKVIESVSSD 530 540 550 560 570 560 570 580 590 600 610 pF1KB7 GNSYTFIDPTQLPYNEKWEFPRNNLQFGKTLGAGAFGKVVEATAFGLGKEDAVLKVAVKM :. : ..:: ::::. ::.::..: .:.:::.::::.:::::: ::.. .:..:::::: CCDS43 GHEYIYVDPMQLPYDSTWELPRDQLVLGRTLGSGAFGQVVEATAHGLSHSQATMKVAVKM 580 590 600 610 620 630 620 630 640 650 660 670 pF1KB7 LKSTAHADEKEALMSELKIMSHLGQHENIVNLLGACTHGGPVLVITEYCCYGDLLNFLRR :::::...::.::::::::::::: : :.::::::::.:::. .::::: ::::...:.: CCDS43 LKSTARSSEKQALMSELKIMSHLGPHLNVVNLLGACTKGGPIYIITEYCRYGDLVDYLHR 640 650 660 670 680 690 680 690 700 710 720 pF1KB7 KAEAMLGPSLSPGQDPEGGVDYKN---IHLE-KKYV----RRDSGFSSQGVDTYVEMRPV . ...: : . : .. :.: . : ..: . :.:. ... : :.. :. CCDS43 NKHTFL-QHHSDKRRPPSAELYSNALPVGLPLPSHVSLTGESDGGYMDMSKDESVDYVPM 700 710 720 730 740 750 730 740 750 760 pF1KB7 ST-----------SSN-----DSFSEQDLDKE------DGRP-LELRDLLHFSSQVAQGM ::: :.. . .. . : : ::. :: :::.:: CCDS43 LDMKGDVKYADIESSNYMAPYDNYVPSAPERTCRATLINESPVLSYMDLVGFSYQVANGM 760 770 780 790 800 810 770 780 790 800 810 820 pF1KB7 AFLASKNCIHRDVAARNVLLTNGHVAKIGDFGLARDIMNDSNYIVKGNARLPVKWMAPES :::::::.:::.::::::. .:...:: ::::::::: ::::: ::.. ::.::::::: CCDS43 EFLASKNCVHRDLAARNVLICEGKLVKICDFGLARDIMRDSNYISKGSTFLPLKWMAPES 820 830 840 850 860 870 830 840 850 860 870 880 pF1KB7 IFDCVYTVQSDVWSYGILLWEIFSLGLNPYPGILVNSKFYKLVKDGYQMAQPAFAPKNIY ::. .::. :::::.::::::::.:: .::: . .: .::. .: ::.::::: : .:: CCDS43 IFNSLYTTLSDVWSFGILLWEIFTLGGTPYPELPMNEQFYNAIKRGYRMAQPAHASDEIY 880 890 900 910 920 930 890 900 910 920 930 940 pF1KB7 SIMQACWALEPTHRPTFQQICSFLQEQAQEDRRERDYTNLPSSSRSGGSGSSSSELEEES ::: :: . :: :.:. .:.. : ... CCDS43 EIMQKCWEEKFEIRPPFSQLVLLLERLLGEGYKKKYQQVDEEFLRSDHPAILRSQARLPG 940 950 960 970 980 990 950 960 970 pF1KB7 SSEHLTCCEQGDIAQPLLQPNNYQFC CCDS43 FHGLRSPLDTSSVLYTAVQPNEGDNDYIIPLPDPKPEVADEGPLEGSPSLASSTLNEVNT 1000 1010 1020 1030 1040 1050 972 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 23:55:16 2016 done: Fri Nov 4 23:55:17 2016 Total Scan time: 3.390 Total Display time: 0.290 Function used was FASTA [36.3.4 Apr, 2011]