FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1026, 979 aa 1>>>pF1KE1026 979 - 979 aa - 979 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 15.4231+/-0.0013; mu= -21.0930+/- 0.079 mean_var=721.3926+/-146.360, 0's: 0 Z-trim(116.1): 34 B-trim: 0 in 0/55 Lambda= 0.047752 statistics sampled from 16646 (16670) to 16646 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.761), E-opt: 0.2 (0.512), width: 16 Scan time: 5.330 The best scores are: opt bits E(32554) CCDS12301.1 RFX1 gene_id:5989|Hs108|chr19 ( 979) 6473 461.7 3.1e-129 CCDS6449.1 RFX3 gene_id:5991|Hs108|chr9 ( 749) 2439 183.7 1.2e-45 CCDS6450.1 RFX3 gene_id:5991|Hs108|chr9 ( 707) 2378 179.5 2.1e-44 CCDS12158.1 RFX2 gene_id:5990|Hs108|chr19 ( 698) 2297 173.9 9.8e-43 CCDS12157.1 RFX2 gene_id:5990|Hs108|chr19 ( 723) 2263 171.6 5.1e-42 CCDS75809.1 RFX3 gene_id:5991|Hs108|chr9 ( 413) 1037 86.9 9e-17 >>CCDS12301.1 RFX1 gene_id:5989|Hs108|chr19 (979 aa) initn: 6473 init1: 6473 opt: 6473 Z-score: 2433.5 bits: 461.7 E(32554): 3.1e-129 Smith-Waterman score: 6473; 99.9% identity (100.0% similar) in 979 aa overlap (1-979:1-979) 10 20 30 40 50 60 pF1KE1 MATQAYTELQAAPPPSQPPQAPPQAQPQPPPPPPPAAPQPPQPPTAAATPQPQYVTELQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MATQAYTELQAAPPPSQPPQAPPQAQPQPPPPPPPAAPQPPQPPTAAATPQPQYVTELQS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 PQPQAQPPGGQKQYVTELPAVPAPSQPTGAPTPSPAPQQYIVVTVSEGAMRASETVSEAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PQPQAQPPGGQKQYVTELPAVPAPSQPTGAPTPSPAPQQYIVVTVSEGAMRASETVSEAS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 PGSTASQTGVPTQVVQQVQGTQQRLLVQTSVQAKPGHVSPLQLTNIQVPQQALPTQRLVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PGSTASQTGVPTQVVQQVQGTQQRLLVQTSVQAKPGHVSPLQLTNIQVPQQALPTQRLVV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 QSAAPGSKGGQVSLTVHGTQQVHSPPEQSPVQANSSSSKTAGAPTGTVPQQLQVHGVQQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 QSAAPGSKGGQVSLTVHGTQQVHSPPEQSPVQANSSSSKTAGAPTGTVPQQLQVHGVQQS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 VPVTQERSVVQATPQAPKPGPVQPLTVQGLQPVHVAQEVQQLQQVPVPHVYSSQVQYVEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VPVTQERSVVQATPQAPKPGPVQPLTVQGLQPVHVAQEVQQLQQVPVPHVYSSQVQYVEG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 GDASYTASAIRSSTYSYPETPLYTQTASTSYYEAAGTATQVSTPATSQAVASSGSMPMYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GDASYTASAIRSSTYSYPETPLYTQTASTSYYEAAGTATQVSTPATSQAVASSGSMPMYV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 SGSQVVASSASTGAGASNSSGGGGSGGGGGGGGGGGGGGSGSTGGGGSGAGTYVIQGGYM :::::::::.:::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SGSQVVASSTSTGAGASNSSGGGGSGGGGGGGGGGGGGGSGSTGGGGSGAGTYVIQGGYM 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE1 LGSASQSYSHTTRASPATVQWLLDNYETAEGVSLPRSTLYCHYLLHCQEQKLEPVNAASF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LGSASQSYSHTTRASPATVQWLLDNYETAEGVSLPRSTLYCHYLLHCQEQKLEPVNAASF 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE1 GKLIRSVFMGLRTRRLGTRGNSKYHYYGLRIKASSPLLRLMEDQQHMAMRGQPFSQKQRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GKLIRSVFMGLRTRRLGTRGNSKYHYYGLRIKASSPLLRLMEDQQHMAMRGQPFSQKQRL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE1 KPIQKMEGMTNGVAVGQQPSTGLSDISAQVQQYQQFLDASRSLPDFTELDLQGKVLPEGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KPIQKMEGMTNGVAVGQQPSTGLSDISAQVQQYQQFLDASRSLPDFTELDLQGKVLPEGV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE1 GPGDIKAFQVLYREHCEAIVDVMVNLQFTLVETLWKTFWRYNLSQPSEAPPLAVHDEAEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GPGDIKAFQVLYREHCEAIVDVMVNLQFTLVETLWKTFWRYNLSQPSEAPPLAVHDEAEK 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE1 RLPKAILVLLSKFEPVLQWTKHCDNVLYQGLVEILIPDVLRPIPSALTQAIRNFAKSLES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 RLPKAILVLLSKFEPVLQWTKHCDNVLYQGLVEILIPDVLRPIPSALTQAIRNFAKSLES 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE1 WLTHAMVNIPEEMLRVKVAAAGAFAQTLRRYTSLNHLAQAARAVLQNTAQINQMLSDLNR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 WLTHAMVNIPEEMLRVKVAAAGAFAQTLRRYTSLNHLAQAARAVLQNTAQINQMLSDLNR 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE1 VDFANVQEQASWVCRCEDRVVQRLEQDFKVTLQQQNSLEQWAAWLDGVVSQVLKPYQGSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VDFANVQEQASWVCRCEDRVVQRLEQDFKVTLQQQNSLEQWAAWLDGVVSQVLKPYQGSA 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE1 GFPKAAKLFLLKWSFYSSMVIRDLTLRSAASFGSFHLIRLLYDEYMYYLIEHRVAQAKGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GFPKAAKLFLLKWSFYSSMVIRDLTLRSAASFGSFHLIRLLYDEYMYYLIEHRVAQAKGE 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE1 TPIAVMGEFANLATSLNPLDPDKDEEEEEEEESEDELPQDISLAAGGESPALGPETLEPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 TPIAVMGEFANLATSLNPLDPDKDEEEEEEEESEDELPQDISLAAGGESPALGPETLEPP 910 920 930 940 950 960 970 pF1KE1 AKLARTDARGLFVQALPSS ::::::::::::::::::: CCDS12 AKLARTDARGLFVQALPSS 970 >>CCDS6449.1 RFX3 gene_id:5991|Hs108|chr9 (749 aa) initn: 2571 init1: 1360 opt: 2439 Z-score: 933.1 bits: 183.7 E(32554): 1.2e-45 Smith-Waterman score: 2636; 61.2% identity (82.3% similar) in 677 aa overlap (268-937:29-684) 240 250 260 270 280 290 pF1KE1 QQSVPVTQERSVVQATPQAPKPGPVQPLTVQGLQPVHVAQEVQQLQQVP-VPHVYSSQVQ : .: : : :.:::.: : : ::: .::: CCDS64 MQTSETGSDTGSTVTLQTSVASQAAVPTQVVQQVPVQQQVQQVQTVQQVQHVYPAQVQ 10 20 30 40 50 300 310 320 330 340 350 pF1KE1 YVEGGDASYTASAIRSSTYSYPETPLYTQTASTSYYEAAGTATQVSTPATSQAVASSGSM ::::.:. :: .:::..:: : :: .:.:... .:... :...::.: ..:......:.. CCDS64 YVEGSDTVYTNGAIRTTTYPYTETQMYSQNTGGNYFDTQGSSAQVTTVVSSHSMVGTGGI 60 70 80 90 100 110 360 370 380 390 400 410 pF1KE1 PMYVSGSQVVASSASTGAGASNSSGGGGSGGGGGGGGGGGGGGSGSTGGGGSGAGTYVIQ : :.:.:...:: :: :.. .:: . . :. .:. CCDS64 QMGVTGGQLISSS------------------GGTYLIGNSMENSGHSVTHTTRASPATIE 120 130 140 150 160 420 430 440 450 460 470 pF1KE1 GGYMLGSASQSYS-HTTRASPATVQWLLDNYETAEGVSLPRSTLYCHYLLHCQEQKLEPV . . :.. : : . . .::::::::::::::::::::: ::: ::::.::.:: CCDS64 MAIETLQKSDGLSTHRSSLLNSHLQWLLDNYETAEGVSLPRSTLYNHYLRHCQEHKLDPV 170 180 190 200 210 220 480 490 500 510 520 530 pF1KE1 NAASFGKLIRSVFMGLRTRRLGTRGNSKYHYYGLRIKASSPLLRLMEDQQHMAMRGQPFS :::::::::::.:::::::::::::::::::::.:.: .::: ::.::.:.:::: ::.. CCDS64 NAASFGKLIRSIFMGLRTRRLGTRGNSKYHYYGIRVKPDSPLNRLQEDMQYMAMRQQPMQ 230 240 250 260 270 280 540 550 560 570 580 590 pF1KE1 QKQRLKPIQKMEGMTNG-VAVGQQPSTGLSD-ISAQVQQYQQFLDASRSLPDFTELDLQG :::: ::.::..:...: .. ::: .:.. . . :: :..::::::::.::.: :..... CCDS64 QKQRYKPMQKVDGVADGFTGSGQQTGTSVEQTVIAQSQHHQQFLDASRALPEFGEVEISS 290 300 310 320 330 340 600 610 620 630 640 650 pF1KE1 KVLPEGVGPGDIKAFQVLYREHCEAIVDVMVNLQFTLVETLWKTFWRYNLSQPSEAPPLA ::.:. :::..: :::::::::.::.:::::.:.: ::.:::::. : :... .. CCDS64 --LPDGTTFEDIKSLQSLYREHCEAILDVVVNLQFSLIEKLWQTFWRYSPSTPTDGTTIT 350 360 370 380 390 660 670 680 690 700 710 pF1KE1 VHD---EAEKRLPKAILVLLSKFEPVLQWTKHCDNVLYQGLVEILIPDVLRPIPSALTQA . : :.::::: :. : : : .:.: .::. .::.:::::::::::::::::::: CCDS64 ESSNLSEIESRLPKAKLITLCKHESILKWMCNCDHGMYQALVEILIPDVLRPIPSALTQA 400 410 420 430 440 450 720 730 740 750 760 770 pF1KE1 IRNFAKSLESWLTHAMVNIPEEMLRVKVAAAGAFAQTLRRYTSLNHLAQAARAVLQNTAQ :::::::::.::..:: :::..:...::::..::::::::::::::::::::::::::.: CCDS64 IRNFAKSLEGWLSNAMNNIPQRMIQTKVAAVSAFAQTLRRYTSLNHLAQAARAVLQNTSQ 460 470 480 490 500 510 780 790 800 810 820 830 pF1KE1 INQMLSDLNRVDFANVQEQASWVCRCEDRVVQRLEQDFKVTLQQQNSLEQWAAWLDGVVS ::::::::::::::::::::::::.:.: .::::: :::.:::::..:::::::::.:. CCDS64 INQMLSDLNRVDFANVQEQASWVCQCDDNMVQRLETDFKMTLQQQSTLEQWAAWLDNVMM 520 530 540 550 560 570 840 850 860 870 880 890 pF1KE1 QVLKPYQGSAGFPKAAKLFLLKWSFYSSMVIRDLTLRSAASFGSFHLIRLLYDEYMYYLI :.::::.: .:::::. ::::::::::::::::::::::::::::::::::::::.::. CCDS64 QALKPYEGRPSFPKAARQFLLKWSFYSSMVIRDLTLRSAASFGSFHLIRLLYDEYMFYLV 580 590 600 610 620 630 900 910 920 930 940 950 pF1KE1 EHRVAQAKGETPIAVMGEFANLATSLNPLDPDKDEEEEEEEESEDELPQDISLAAGGESP ::::::: :::::::::::..: ....: . :::: : : : ..:: CCDS64 EHRVAQATGETPIAVMGEFGDL-NAVSPGNLDKDEGSEVESEMDEELDDSSEPQAKREKT 640 650 660 670 680 690 960 970 pF1KE1 ALGPETLEPPAKLARTDARGLFVQALPSS CCDS64 ELSQAFPVGCMQPVLETGVQPSLLNPIHSEHIVTSTQTIRQCSATGNTYTAV 700 710 720 730 740 >>CCDS6450.1 RFX3 gene_id:5991|Hs108|chr9 (707 aa) initn: 2526 init1: 1356 opt: 2378 Z-score: 910.8 bits: 179.5 E(32554): 2.1e-44 Smith-Waterman score: 2575; 62.0% identity (82.7% similar) in 648 aa overlap (268-908:29-656) 240 250 260 270 280 290 pF1KE1 QQSVPVTQERSVVQATPQAPKPGPVQPLTVQGLQPVHVAQEVQQLQQVP-VPHVYSSQVQ : .: : : :.:::.: : : ::: .::: CCDS64 MQTSETGSDTGSTVTLQTSVASQAAVPTQVVQQVPVQQQVQQVQTVQQVQHVYPAQVQ 10 20 30 40 50 300 310 320 330 340 350 pF1KE1 YVEGGDASYTASAIRSSTYSYPETPLYTQTASTSYYEAAGTATQVSTPATSQAVASSGSM ::::.:. :: .:::..:: : :: .:.:... .:... :...::.: ..:......:.. CCDS64 YVEGSDTVYTNGAIRTTTYPYTETQMYSQNTGGNYFDTQGSSAQVTTVVSSHSMVGTGGI 60 70 80 90 100 110 360 370 380 390 400 410 pF1KE1 PMYVSGSQVVASSASTGAGASNSSGGGGSGGGGGGGGGGGGGGSGSTGGGGSGAGTYVIQ : :.:.:...:: :: :.. .:: . . :. .:. CCDS64 QMGVTGGQLISSS------------------GGTYLIGNSMENSGHSVTHTTRASPATIE 120 130 140 150 160 420 430 440 450 460 470 pF1KE1 GGYMLGSASQSYS-HTTRASPATVQWLLDNYETAEGVSLPRSTLYCHYLLHCQEQKLEPV . . :.. : : . . .::::::::::::::::::::: ::: ::::.::.:: CCDS64 MAIETLQKSDGLSTHRSSLLNSHLQWLLDNYETAEGVSLPRSTLYNHYLRHCQEHKLDPV 170 180 190 200 210 220 480 490 500 510 520 530 pF1KE1 NAASFGKLIRSVFMGLRTRRLGTRGNSKYHYYGLRIKASSPLLRLMEDQQHMAMRGQPFS :::::::::::.:::::::::::::::::::::.:.: .::: ::.::.:.:::: ::.. CCDS64 NAASFGKLIRSIFMGLRTRRLGTRGNSKYHYYGIRVKPDSPLNRLQEDMQYMAMRQQPMQ 230 240 250 260 270 280 540 550 560 570 580 590 pF1KE1 QKQRLKPIQKMEGMTNG-VAVGQQPSTGLSD-ISAQVQQYQQFLDASRSLPDFTELDLQG :::: ::.::..:...: .. ::: .:.. . . :: :..::::::::.::.: :..... CCDS64 QKQRYKPMQKVDGVADGFTGSGQQTGTSVEQTVIAQSQHHQQFLDASRALPEFGEVEISS 290 300 310 320 330 340 600 610 620 630 640 650 pF1KE1 KVLPEGVGPGDIKAFQVLYREHCEAIVDVMVNLQFTLVETLWKTFWRYNLSQPSEAPPLA ::.:. :::..: :::::::::.::.:::::.:.: ::.:::::. : :... .. CCDS64 --LPDGTTFEDIKSLQSLYREHCEAILDVVVNLQFSLIEKLWQTFWRYSPSTPTDGTTIT 350 360 370 380 390 660 670 680 690 700 710 pF1KE1 VHD---EAEKRLPKAILVLLSKFEPVLQWTKHCDNVLYQGLVEILIPDVLRPIPSALTQA . : :.::::: :. : : : .:.: .::. .::.:::::::::::::::::::: CCDS64 ESSNLSEIESRLPKAKLITLCKHESILKWMCNCDHGMYQALVEILIPDVLRPIPSALTQA 400 410 420 430 440 450 720 730 740 750 760 770 pF1KE1 IRNFAKSLESWLTHAMVNIPEEMLRVKVAAAGAFAQTLRRYTSLNHLAQAARAVLQNTAQ :::::::::.::..:: :::..:...::::..::::::::::::::::::::::::::.: CCDS64 IRNFAKSLEGWLSNAMNNIPQRMIQTKVAAVSAFAQTLRRYTSLNHLAQAARAVLQNTSQ 460 470 480 490 500 510 780 790 800 810 820 830 pF1KE1 INQMLSDLNRVDFANVQEQASWVCRCEDRVVQRLEQDFKVTLQQQNSLEQWAAWLDGVVS ::::::::::::::::::::::::.:.: .::::: :::.:::::..:::::::::.:. CCDS64 INQMLSDLNRVDFANVQEQASWVCQCDDNMVQRLETDFKMTLQQQSTLEQWAAWLDNVMM 520 530 540 550 560 570 840 850 860 870 880 890 pF1KE1 QVLKPYQGSAGFPKAAKLFLLKWSFYSSMVIRDLTLRSAASFGSFHLIRLLYDEYMYYLI :.::::.: .:::::. ::::::::::::::::::::::::::::::::::::::.::. CCDS64 QALKPYEGRPSFPKAARQFLLKWSFYSSMVIRDLTLRSAASFGSFHLIRLLYDEYMFYLV 580 590 600 610 620 630 900 910 920 930 940 950 pF1KE1 EHRVAQAKGETPIAVMGEFANLATSLNPLDPDKDEEEEEEEESEDELPQDISLAAGGESP ::::::: :::::::::: CCDS64 EHRVAQATGETPIAVMGEVREAERAVTHWVIKNKPELHFSLNTLLIKTMVPNQVSLRARR 640 650 660 670 680 690 >>CCDS12158.1 RFX2 gene_id:5990|Hs108|chr19 (698 aa) initn: 2538 init1: 1338 opt: 2297 Z-score: 880.7 bits: 173.9 E(32554): 9.8e-43 Smith-Waterman score: 2513; 56.6% identity (76.1% similar) in 735 aa overlap (241-967:25-690) 220 230 240 250 260 270 pF1KE1 VQANSSSSKTAGAPTGTVPQQLQVHGVQQSVPVTQERSVVQATPQAPKPGPVQPLTVQGL ::.. .: .:::. . :: . .::... . CCDS12 MQNSEGGADSPASVALRPSAAAPPVPASPQRVLVQAASSNPKGAQMQPISLPRV 10 20 30 40 50 280 290 300 310 320 pF1KE1 QPVHVAQEVQQLQQVPVPHVYSSQVQYVEGGDASYTASAIRSSTYSY-PETPLYTQTAST : .: :.:: :: ::: .:::::::::: :: .:::.. :.: :: .:. .... CCDS12 Q--QVPQQVQ-----PVQHVYPAQVQYVEGGDAVYTNGAIRTA-YTYNPEPQMYAPSSTA 60 70 80 90 100 330 340 350 360 370 380 pF1KE1 SYYEAAGTATQVSTPATSQAVASSGSM---PMYVSGSQVVASSASTGAGASNSSGGGGSG ::.:: : : ::.. :.: .. : :: : :.:: .:.: CCDS12 SYFEAPGGA-QVTVAASSPPAVPSHSMVGITMDVGGSPIVSS------------------ 110 120 130 140 390 400 410 420 430 440 pF1KE1 GGGGGGGGGGGGGSGSTGGGGSGAGTYVIQGGYMLGSASQSYSHTTRASPATVQWLLDNY ::.:.:.:: . :. .: .::.:.::::.::::::: CCDS12 -----------------------AGAYLIHGG--MDSTRHSLAHTSRSSPATLQWLLDNY 150 160 170 180 450 460 470 480 490 500 pF1KE1 ETAEGVSLPRSTLYCHYLLHCQEQKLEPVNAASFGKLIRSVFMGLRTRRLGTRGNSKYHY :::::::::::.:: ::: ::::.::.::::::::::::::::::::::::::::::::: CCDS12 ETAEGVSLPRSSLYNHYLRHCQEHKLDPVNAASFGKLIRSVFMGLRTRRLGTRGNSKYHY 190 200 210 220 230 240 510 520 530 540 550 560 pF1KE1 YGLRIKASSPLLRLMEDQQHMAMRGQPFSQKQRLKPIQKMEGMTNGVAVGQQPSTGLSDI ::.:.: .::: ::.:: :.:::: ::. :: : .: :: ... .. . . :: . . CCDS12 YGIRLKPDSPLNRLQEDTQYMAMRQQPMHQKPRYRPAQKTDSLGDSGSHSGLHSTPEQTM 250 260 270 280 290 300 570 580 590 600 610 620 pF1KE1 SAQVQQYQQFLDASRSLPDFTELDLQGKVLPEGVGPGDIKAFQVLYREHCEAIVDVMVNL ..: :..::..:.:. .:.: :: . .: .:: :.::.:..::.:::: :::..:: CCDS12 AVQSQHHQQYIDVSHVFPEFPAPDLGSFLLQDGVTLHDVKALQLVYRRHCEATVDVVMNL 310 320 330 340 350 360 630 640 650 660 670 680 pF1KE1 QFTLVETLWKTFWRYNLSQPSEAP---PLAVHDEAEKRLPKAILVLLSKFEPVLQWTKHC :: .: :: .:: . :. :..: : . .: ::: :. : . .:.:.: . : CCDS12 QFHYIEKLWLSFWNSKASS-SDGPTSLPASDEDPEGAVLPKDKLISLCQCDPILRWMRSC 370 380 390 400 410 420 690 700 710 720 730 740 pF1KE1 DNVLYQGLVEILIPDVLRPIPSALTQAIRNFAKSLESWLTHAMVNIPEEMLRVKVAAAGA :..:::.::::::::::::.::.:::::::::::::.:::.:: ..:......::....: CCDS12 DHILYQALVEILIPDVLRPVPSTLTQAIRNFAKSLEGWLTNAMSDFPQQVIQTKVGVVSA 430 440 450 460 470 480 750 760 770 780 790 800 pF1KE1 FAQTLRRYTSLNHLAQAARAVLQNTAQINQMLSDLNRVDFANVQEQASWVCRCEDRVVQR :::::::::::::::::::::::::.:::::::::::::::::::::::::.::. :::: CCDS12 FAQTLRRYTSLNHLAQAARAVLQNTSQINQMLSDLNRVDFANVQEQASWVCQCEESVVQR 490 500 510 520 530 540 810 820 830 840 850 860 pF1KE1 LEQDFKVTLQQQNSLEQWAAWLDGVVSQVLKPYQGSAGFPKAAKLFLLKWSFYSSMVIRD ::::::.:::::.::.:::.:::.::.:::: . :: .:::::. ::::::::::::::: CCDS12 LEQDFKLTLQQQSSLDQWASWLDSVVTQVLKQHAGSPSFPKAARQFLLKWSFYSSMVIRD 550 560 570 580 590 600 870 880 890 900 910 920 pF1KE1 LTLRSAASFGSFHLIRLLYDEYMYYLIEHRVAQAKGETPIAVMGEFANLAT-SLNPLDPD :::::::::::::::::::::::.::.:::::.: ::::::::::: .::. ::. : : CCDS12 LTLRSAASFGSFHLIRLLYDEYMFYLVEHRVAEATGETPIAVMGEFNDLASLSLTLL--D 610 620 630 640 650 930 940 950 960 970 pF1KE1 KDEEEEEEEESEDELPQDISLAAGGESPALGPETLEPPAKLARTDARGLFVQALPSS ::. .:.. :: :: .. .:: :: .: :.: CCDS12 KDDMGDEQRGSE----------AGPDARSLG----EPLVKRERSDPNHSLQGI 660 670 680 690 >>CCDS12157.1 RFX2 gene_id:5990|Hs108|chr19 (723 aa) initn: 2481 init1: 1338 opt: 2263 Z-score: 867.8 bits: 171.6 E(32554): 5.1e-42 Smith-Waterman score: 2465; 56.1% identity (76.3% similar) in 735 aa overlap (241-967:25-715) 220 230 240 250 260 270 pF1KE1 VQANSSSSKTAGAPTGTVPQQLQVHGVQQSVPVTQERSVVQATPQAPKPGPVQPLTVQGL ::.. .: .:::. . :: . .::... . CCDS12 MQNSEGGADSPASVALRPSAAAPPVPASPQRVLVQAASSNPKGAQMQPISLPRV 10 20 30 40 50 280 290 300 310 320 pF1KE1 QPVHVAQEVQQLQQVPVPHVYSSQVQYVEGGDASYTASAIRSSTYSY-PETPLYTQTAST : .: :.:: :: ::: .:::::::::: :: .:::.. :.: :: .:. .... CCDS12 Q--QVPQQVQ-----PVQHVYPAQVQYVEGGDAVYTNGAIRTA-YTYNPEPQMYAPSSTA 60 70 80 90 100 330 340 350 360 370 380 pF1KE1 SYYEAAGTATQVSTPATSQAVASSGSM---PMYVSGSQVVASSASTGAGASNSSGGGGSG ::.:: : : ::.. :.: .. : :: : :.:: .:.: ::: :: : CCDS12 SYFEAPGGA-QVTVAASSPPAVPSHSMVGITMDVGGSPIVSS-----AGAYLIHGGMDST 110 120 130 140 150 160 390 400 410 420 430 440 pF1KE1 GGGGGGGGGGGGGSGSTGGGGSGAGTYVIQGGYMLGSASQSYSHTTRASPATVQWLLDNY . . :. .. .. ..:.. : .. :: . . .::::::: CCDS12 RH----------SLAHTSRSSPATLEMAIEN---LQKSEGITSHKSGLLNSHLQWLLDNY 170 180 190 200 450 460 470 480 490 500 pF1KE1 ETAEGVSLPRSTLYCHYLLHCQEQKLEPVNAASFGKLIRSVFMGLRTRRLGTRGNSKYHY :::::::::::.:: ::: ::::.::.::::::::::::::::::::::::::::::::: CCDS12 ETAEGVSLPRSSLYNHYLRHCQEHKLDPVNAASFGKLIRSVFMGLRTRRLGTRGNSKYHY 210 220 230 240 250 260 510 520 530 540 550 560 pF1KE1 YGLRIKASSPLLRLMEDQQHMAMRGQPFSQKQRLKPIQKMEGMTNGVAVGQQPSTGLSDI ::.:.: .::: ::.:: :.:::: ::. :: : .: :: ... .. . . :: . . CCDS12 YGIRLKPDSPLNRLQEDTQYMAMRQQPMHQKPRYRPAQKTDSLGDSGSHSGLHSTPEQTM 270 280 290 300 310 320 570 580 590 600 610 620 pF1KE1 SAQVQQYQQFLDASRSLPDFTELDLQGKVLPEGVGPGDIKAFQVLYREHCEAIVDVMVNL ..: :..::..:.:. .:.: :: . .: .:: :.::.:..::.:::: :::..:: CCDS12 AVQSQHHQQYIDVSHVFPEFPAPDLGSFLLQDGVTLHDVKALQLVYRRHCEATVDVVMNL 330 340 350 360 370 380 630 640 650 660 670 680 pF1KE1 QFTLVETLWKTFWRYNLSQPSEAP---PLAVHDEAEKRLPKAILVLLSKFEPVLQWTKHC :: .: :: .:: . :. :..: : . .: ::: :. : . .:.:.: . : CCDS12 QFHYIEKLWLSFWNSKASS-SDGPTSLPASDEDPEGAVLPKDKLISLCQCDPILRWMRSC 390 400 410 420 430 440 690 700 710 720 730 740 pF1KE1 DNVLYQGLVEILIPDVLRPIPSALTQAIRNFAKSLESWLTHAMVNIPEEMLRVKVAAAGA :..:::.::::::::::::.::.:::::::::::::.:::.:: ..:......::....: CCDS12 DHILYQALVEILIPDVLRPVPSTLTQAIRNFAKSLEGWLTNAMSDFPQQVIQTKVGVVSA 450 460 470 480 490 500 750 760 770 780 790 800 pF1KE1 FAQTLRRYTSLNHLAQAARAVLQNTAQINQMLSDLNRVDFANVQEQASWVCRCEDRVVQR :::::::::::::::::::::::::.:::::::::::::::::::::::::.::. :::: CCDS12 FAQTLRRYTSLNHLAQAARAVLQNTSQINQMLSDLNRVDFANVQEQASWVCQCEESVVQR 510 520 530 540 550 560 810 820 830 840 850 860 pF1KE1 LEQDFKVTLQQQNSLEQWAAWLDGVVSQVLKPYQGSAGFPKAAKLFLLKWSFYSSMVIRD ::::::.:::::.::.:::.:::.::.:::: . :: .:::::. ::::::::::::::: CCDS12 LEQDFKLTLQQQSSLDQWASWLDSVVTQVLKQHAGSPSFPKAARQFLLKWSFYSSMVIRD 570 580 590 600 610 620 870 880 890 900 910 920 pF1KE1 LTLRSAASFGSFHLIRLLYDEYMYYLIEHRVAQAKGETPIAVMGEFANLAT-SLNPLDPD :::::::::::::::::::::::.::.:::::.: ::::::::::: .::. ::. : : CCDS12 LTLRSAASFGSFHLIRLLYDEYMFYLVEHRVAEATGETPIAVMGEFNDLASLSLTLL--D 630 640 650 660 670 680 930 940 950 960 970 pF1KE1 KDEEEEEEEESEDELPQDISLAAGGESPALGPETLEPPAKLARTDARGLFVQALPSS ::. .:.. :: :: .. .:: :: .: :.: CCDS12 KDDMGDEQRGSE----------AGPDARSLG----EPLVKRERSDPNHSLQGI 690 700 710 720 >>CCDS75809.1 RFX3 gene_id:5991|Hs108|chr9 (413 aa) initn: 1396 init1: 846 opt: 1037 Z-score: 414.6 bits: 86.9 E(32554): 9e-17 Smith-Waterman score: 1239; 51.9% identity (77.1% similar) in 385 aa overlap (268-648:29-393) 240 250 260 270 280 290 pF1KE1 QQSVPVTQERSVVQATPQAPKPGPVQPLTVQGLQPVHVAQEVQQLQQVP-VPHVYSSQVQ : .: : : :.:::.: : : ::: .::: CCDS75 MQTSETGSDTGSTVTLQTSVASQAAVPTQVVQQVPVQQQVQQVQTVQQVQHVYPAQVQ 10 20 30 40 50 300 310 320 330 340 350 pF1KE1 YVEGGDASYTASAIRSSTYSYPETPLYTQTASTSYYEAAGTATQVSTPATSQAVASSGSM ::::.:. :: .:::..:: : :: .:.:... .:... :...::.: ..:......:.. CCDS75 YVEGSDTVYTNGAIRTTTYPYTETQMYSQNTGGNYFDTQGSSAQVTTVVSSHSMVGTGGI 60 70 80 90 100 110 360 370 380 390 400 410 pF1KE1 PMYVSGSQVVASSASTGAGASNSSGGGGSGGGGGGGGGGGGGGSGSTGGGGSGAGTYVIQ : :.:.:...:: :: :.. .:: . . :. .:. CCDS75 QMGVTGGQLISSS------------------GGTYLIGNSMENSGHSVTHTTRASPATIE 120 130 140 150 160 420 430 440 450 460 470 pF1KE1 GGYMLGSASQSYS-HTTRASPATVQWLLDNYETAEGVSLPRSTLYCHYLLHCQEQKLEPV . . :.. : : . . .::::::::::::::::::::: ::: ::::.::.:: CCDS75 MAIETLQKSDGLSTHRSSLLNSHLQWLLDNYETAEGVSLPRSTLYNHYLRHCQEHKLDPV 170 180 190 200 210 220 480 490 500 510 520 530 pF1KE1 NAASFGKLIRSVFMGLRTRRLGTRGNSKYHYYGLRIKASSPLLRLMEDQQHMAMRGQPFS :::::::::::.:::::::::::::::::::::.:.: .::: ::.::.:.:::: ::.. CCDS75 NAASFGKLIRSIFMGLRTRRLGTRGNSKYHYYGIRVKPDSPLNRLQEDMQYMAMRQQPMQ 230 240 250 260 270 280 540 550 560 570 580 590 pF1KE1 QKQRLKPIQKMEGMTNG-VAVGQQPSTGLSD-ISAQVQQYQQFLDASRSLPDFTELDLQG :::: ::.::..:...: .. ::: .:.. . . :: :..::::::::.::.: :..... CCDS75 QKQRYKPMQKVDGVADGFTGSGQQTGTSVEQTVIAQSQHHQQFLDASRALPEFGEVEISS 290 300 310 320 330 340 600 610 620 630 640 650 pF1KE1 KVLPEGVGPGDIKAFQVLYREHCEAIVDVMVNLQFTLVETLWKTFWRYNLSQPSEAPPLA ::.:. :::..: :::::::::.::.:::::.:.: ::.:::::. : :.. CCDS75 --LPDGTTFEDIKSLQSLYREHCEAILDVVVNLQFSLIEKLWQTFWRYSPSTPTDGTTIT 350 360 370 380 390 660 670 680 690 700 710 pF1KE1 VHDEAEKRLPKAILVLLSKFEPVLQWTKHCDNVLYQGLVEILIPDVLRPIPSALTQAIRN CCDS75 ESRSESTSFPIHFHG 400 410 979 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 07:27:59 2016 done: Sat Nov 5 07:28:00 2016 Total Scan time: 5.330 Total Display time: 0.140 Function used was FASTA [36.3.4 Apr, 2011]