FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6212, 698 aa 1>>>pF1KB6212 698 - 698 aa - 698 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.6246+/-0.000975; mu= 9.6065+/- 0.058 mean_var=140.3474+/-28.674, 0's: 0 Z-trim(109.6): 28 B-trim: 629 in 1/50 Lambda= 0.108261 statistics sampled from 10988 (11012) to 10988 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.684), E-opt: 0.2 (0.338), width: 16 Scan time: 3.960 The best scores are: opt bits E(32554) CCDS12158.1 RFX2 gene_id:5990|Hs108|chr19 ( 698) 4661 740.0 2.8e-213 CCDS12157.1 RFX2 gene_id:5990|Hs108|chr19 ( 723) 3540 564.9 1.5e-160 CCDS6449.1 RFX3 gene_id:5991|Hs108|chr9 ( 749) 2555 411.1 3.1e-114 CCDS6450.1 RFX3 gene_id:5991|Hs108|chr9 ( 707) 2479 399.2 1.1e-110 CCDS12301.1 RFX1 gene_id:5989|Hs108|chr19 ( 979) 2297 370.8 5.2e-102 CCDS75809.1 RFX3 gene_id:5991|Hs108|chr9 ( 413) 1082 180.9 3.4e-45 CCDS9108.1 RFX4 gene_id:5992|Hs108|chr12 ( 641) 574 101.6 3.7e-21 CCDS9106.1 RFX4 gene_id:5992|Hs108|chr12 ( 735) 374 70.4 1.1e-11 CCDS55880.1 RFX4 gene_id:5992|Hs108|chr12 ( 744) 374 70.4 1.1e-11 >>CCDS12158.1 RFX2 gene_id:5990|Hs108|chr19 (698 aa) initn: 4661 init1: 4661 opt: 4661 Z-score: 3942.6 bits: 740.0 E(32554): 2.8e-213 Smith-Waterman score: 4661; 99.9% identity (100.0% similar) in 698 aa overlap (1-698:1-698) 10 20 30 40 50 60 pF1KB6 MQNSEGGADSPASVALRPSAAAPPVPASPQRVLVQAASSNPKGAQMQPISLPRVQQVPQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MQNSEGGADSPASVALRPSAAAPPVPASPQRVLVQAASSNPKGAQMQPISLPRVQQVPQQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 VQPVQHVYPAQVQYVEGGDAVYTNGTIRTAYTYNPEPQMYAPSSTASYFEAPGGAQVTVA :::::::::::::::::::::::::.:::::::::::::::::::::::::::::::::: CCDS12 VQPVQHVYPAQVQYVEGGDAVYTNGAIRTAYTYNPEPQMYAPSSTASYFEAPGGAQVTVA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 ASSPPAVPSHSMVGITMDVGGSPIVSSAGAYLIHGGMDSTRHSLAHTSRSSPATLQWLLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 ASSPPAVPSHSMVGITMDVGGSPIVSSAGAYLIHGGMDSTRHSLAHTSRSSPATLQWLLD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 NYETAEGVSLPRSSLYNHYLRHCQEHKLDPVNAASFGKLIRSVFMGLRTRRLGTRGNSKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 NYETAEGVSLPRSSLYNHYLRHCQEHKLDPVNAASFGKLIRSVFMGLRTRRLGTRGNSKY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 HYYGIRLKPDSPLNRLQEDTQYMAMRQQPMHQKPRYRPAQKTDSLGDSGSHSGLHSTPEQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 HYYGIRLKPDSPLNRLQEDTQYMAMRQQPMHQKPRYRPAQKTDSLGDSGSHSGLHSTPEQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 TMAVQSQHHQQYIDVSHVFPEFPAPDLGSFLLQDGVTLHDVKALQLVYRRHCEATVDVVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 TMAVQSQHHQQYIDVSHVFPEFPAPDLGSFLLQDGVTLHDVKALQLVYRRHCEATVDVVM 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB6 NLQFHYIEKLWLSFWNSKASSSDGPTSLPASDEDPEGAVLPKDKLISLCQCDPILRWMRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 NLQFHYIEKLWLSFWNSKASSSDGPTSLPASDEDPEGAVLPKDKLISLCQCDPILRWMRS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB6 CDHILYQALVEILIPDVLRPVPSTLTQAIRNFAKSLEGWLTNAMSDFPQQVIQTKVGVVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 CDHILYQALVEILIPDVLRPVPSTLTQAIRNFAKSLEGWLTNAMSDFPQQVIQTKVGVVS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB6 AFAQTLRRYTSLNHLAQAARAVLQNTSQINQMLSDLNRVDFANVQEQASWVCQCEESVVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AFAQTLRRYTSLNHLAQAARAVLQNTSQINQMLSDLNRVDFANVQEQASWVCQCEESVVQ 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB6 RLEQDFKLTLQQQSSLDQWASWLDSVVTQVLKQHAGSPSFPKAARQFLLKWSFYSSMVIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 RLEQDFKLTLQQQSSLDQWASWLDSVVTQVLKQHAGSPSFPKAARQFLLKWSFYSSMVIR 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB6 DLTLRSAASFGSFHLIRLLYDEYMFYLVEHRVAEATGETPIAVMGEFNDLASLSLTLLDK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DLTLRSAASFGSFHLIRLLYDEYMFYLVEHRVAEATGETPIAVMGEFNDLASLSLTLLDK 610 620 630 640 650 660 670 680 690 pF1KB6 DDMGDEQRGSEAGPDARSLGEPLVKRERSDPNHSLQGI :::::::::::::::::::::::::::::::::::::: CCDS12 DDMGDEQRGSEAGPDARSLGEPLVKRERSDPNHSLQGI 670 680 690 >>CCDS12157.1 RFX2 gene_id:5990|Hs108|chr19 (723 aa) initn: 3518 init1: 3518 opt: 3540 Z-score: 2996.1 bits: 564.9 E(32554): 1.5e-160 Smith-Waterman score: 4601; 96.4% identity (96.5% similar) in 723 aa overlap (1-698:1-723) 10 20 30 40 50 60 pF1KB6 MQNSEGGADSPASVALRPSAAAPPVPASPQRVLVQAASSNPKGAQMQPISLPRVQQVPQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MQNSEGGADSPASVALRPSAAAPPVPASPQRVLVQAASSNPKGAQMQPISLPRVQQVPQQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 VQPVQHVYPAQVQYVEGGDAVYTNGTIRTAYTYNPEPQMYAPSSTASYFEAPGGAQVTVA :::::::::::::::::::::::::.:::::::::::::::::::::::::::::::::: CCDS12 VQPVQHVYPAQVQYVEGGDAVYTNGAIRTAYTYNPEPQMYAPSSTASYFEAPGGAQVTVA 70 80 90 100 110 120 130 140 150 160 170 pF1KB6 ASSPPAVPSHSMVGITMDVGGSPIVSSAGAYLIHGGMDSTRHSLAHTSRSSPATL----- ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 ASSPPAVPSHSMVGITMDVGGSPIVSSAGAYLIHGGMDSTRHSLAHTSRSSPATLEMAIE 130 140 150 160 170 180 180 190 200 210 pF1KB6 --------------------QWLLDNYETAEGVSLPRSSLYNHYLRHCQEHKLDPVNAAS :::::::::::::::::::::::::::::::::::::::: CCDS12 NLQKSEGITSHKSGLLNSHLQWLLDNYETAEGVSLPRSSLYNHYLRHCQEHKLDPVNAAS 190 200 210 220 230 240 220 230 240 250 260 270 pF1KB6 FGKLIRSVFMGLRTRRLGTRGNSKYHYYGIRLKPDSPLNRLQEDTQYMAMRQQPMHQKPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 FGKLIRSVFMGLRTRRLGTRGNSKYHYYGIRLKPDSPLNRLQEDTQYMAMRQQPMHQKPR 250 260 270 280 290 300 280 290 300 310 320 330 pF1KB6 YRPAQKTDSLGDSGSHSGLHSTPEQTMAVQSQHHQQYIDVSHVFPEFPAPDLGSFLLQDG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 YRPAQKTDSLGDSGSHSGLHSTPEQTMAVQSQHHQQYIDVSHVFPEFPAPDLGSFLLQDG 310 320 330 340 350 360 340 350 360 370 380 390 pF1KB6 VTLHDVKALQLVYRRHCEATVDVVMNLQFHYIEKLWLSFWNSKASSSDGPTSLPASDEDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VTLHDVKALQLVYRRHCEATVDVVMNLQFHYIEKLWLSFWNSKASSSDGPTSLPASDEDP 370 380 390 400 410 420 400 410 420 430 440 450 pF1KB6 EGAVLPKDKLISLCQCDPILRWMRSCDHILYQALVEILIPDVLRPVPSTLTQAIRNFAKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 EGAVLPKDKLISLCQCDPILRWMRSCDHILYQALVEILIPDVLRPVPSTLTQAIRNFAKS 430 440 450 460 470 480 460 470 480 490 500 510 pF1KB6 LEGWLTNAMSDFPQQVIQTKVGVVSAFAQTLRRYTSLNHLAQAARAVLQNTSQINQMLSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LEGWLTNAMSDFPQQVIQTKVGVVSAFAQTLRRYTSLNHLAQAARAVLQNTSQINQMLSD 490 500 510 520 530 540 520 530 540 550 560 570 pF1KB6 LNRVDFANVQEQASWVCQCEESVVQRLEQDFKLTLQQQSSLDQWASWLDSVVTQVLKQHA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LNRVDFANVQEQASWVCQCEESVVQRLEQDFKLTLQQQSSLDQWASWLDSVVTQVLKQHA 550 560 570 580 590 600 580 590 600 610 620 630 pF1KB6 GSPSFPKAARQFLLKWSFYSSMVIRDLTLRSAASFGSFHLIRLLYDEYMFYLVEHRVAEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GSPSFPKAARQFLLKWSFYSSMVIRDLTLRSAASFGSFHLIRLLYDEYMFYLVEHRVAEA 610 620 630 640 650 660 640 650 660 670 680 690 pF1KB6 TGETPIAVMGEFNDLASLSLTLLDKDDMGDEQRGSEAGPDARSLGEPLVKRERSDPNHSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 TGETPIAVMGEFNDLASLSLTLLDKDDMGDEQRGSEAGPDARSLGEPLVKRERSDPNHSL 670 680 690 700 710 720 pF1KB6 QGI ::: CCDS12 QGI >>CCDS6449.1 RFX3 gene_id:5991|Hs108|chr9 (749 aa) initn: 2618 init1: 1464 opt: 2555 Z-score: 2164.4 bits: 411.1 E(32554): 3.1e-114 Smith-Waterman score: 2863; 64.4% identity (81.8% similar) in 724 aa overlap (1-690:1-698) 10 20 30 40 50 60 pF1KB6 MQNSEGGADSPASVALRPSAAAPPVPASPQRVLVQAASSNPKGAQMQPISLPRVQQVPQQ ::.:: :.:. ..:.:. :.:. : : .:. :. : .:.: :::: : CCDS64 MQTSETGSDTGSTVTLQTSVASQA--AVPTQVVQQV----P--VQQQ------VQQV-QT 10 20 30 40 70 80 90 100 110 pF1KB6 VQPVQHVYPAQVQYVEGGDAVYTNGTIRTA-YTYNPEPQMYAPSSTASYFEAPGG-AQVT :: ::::::::::::::.:.:::::.:::. : :. : :::. .. ..::.. :. :::: CCDS64 VQQVQHVYPAQVQYVEGSDTVYTNGAIRTTTYPYT-ETQMYSQNTGGNYFDTQGSSAQVT 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB6 VAASSPPAVPSHSMVG---ITMDV-GGSPIVSSAGAYLIHGGMDSTRHSLAHTSRSSPAT ...:: ::::: : : : ::. : ::.:.::: ..:... ::..::.:.:::: CCDS64 TVVSS------HSMVGTGGIQMGVTGGQLISSSGGTYLIGNSMENSGHSVTHTTRASPAT 110 120 130 140 150 180 190 200 pF1KB6 -------------------------LQWLLDNYETAEGVSLPRSSLYNHYLRHCQEHKLD :::::::::::::::::::.::::::::::::::: CCDS64 IEMAIETLQKSDGLSTHRSSLLNSHLQWLLDNYETAEGVSLPRSTLYNHYLRHCQEHKLD 160 170 180 190 200 210 210 220 230 240 250 260 pF1KB6 PVNAASFGKLIRSVFMGLRTRRLGTRGNSKYHYYGIRLKPDSPLNRLQEDTQYMAMRQQP :::::::::::::.:::::::::::::::::::::::.:::::::::::: ::::::::: CCDS64 PVNAASFGKLIRSIFMGLRTRRLGTRGNSKYHYYGIRVKPDSPLNRLQEDMQYMAMRQQP 220 230 240 250 260 270 270 280 290 300 310 320 pF1KB6 MHQKPRYRPAQKTDSLGDSGSHSGLHS--TPEQTMAVQSQHHQQYIDVSHVFPEFPAPDL :.:: ::.: ::.:...:. . :: .. . :::. .:::::::..:.:...::: .. CCDS64 MQQKQRYKPMQKVDGVADGFTGSGQQTGTSVEQTVIAQSQHHQQFLDASRALPEFGEVEI 280 290 300 310 320 330 330 340 350 360 370 380 pF1KB6 GSFLLQDGVTLHDVKALQLVYRRHCEATVDVVMNLQFHYIEKLWLSFWN-SKASSSDGPT .: : ::.:..:.:.:: .::.:::: .:::.:::: ::::: .:: : .. .:: : CCDS64 SS--LPDGTTFEDIKSLQSLYREHCEAILDVVVNLQFSLIEKLWQTFWRYSPSTPTDGTT 340 350 360 370 380 390 390 400 410 420 430 440 pF1KB6 SLPASDEDPEGAVLPKDKLISLCQCDPILRWMRSCDHILYQALVEILIPDVLRPVPSTLT .:. . . ::: :::.::. . ::.:: .::: .:::::::::::::::.::.:: CCDS64 ITESSNLSEIESRLPKAKLITLCKHESILKWMCNCDHGMYQALVEILIPDVLRPIPSALT 400 410 420 430 440 450 450 460 470 480 490 500 pF1KB6 QAIRNFAKSLEGWLTNAMSDFPQQVIQTKVGVVSAFAQTLRRYTSLNHLAQAARAVLQNT ::::::::::::::.:::...::..:::::..:::::::::::::::::::::::::::: CCDS64 QAIRNFAKSLEGWLSNAMNNIPQRMIQTKVAAVSAFAQTLRRYTSLNHLAQAARAVLQNT 460 470 480 490 500 510 510 520 530 540 550 560 pF1KB6 SQINQMLSDLNRVDFANVQEQASWVCQCEESVVQRLEQDFKLTLQQQSSLDQWASWLDSV ::::::::::::::::::::::::::::....::::: :::.::::::.:.:::.:::.: CCDS64 SQINQMLSDLNRVDFANVQEQASWVCQCDDNMVQRLETDFKMTLQQQSTLEQWAAWLDNV 520 530 540 550 560 570 570 580 590 600 610 620 pF1KB6 VTQVLKQHAGSPSFPKAARQFLLKWSFYSSMVIRDLTLRSAASFGSFHLIRLLYDEYMFY . :.:: . : ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 MMQALKPYEGRPSFPKAARQFLLKWSFYSSMVIRDLTLRSAASFGSFHLIRLLYDEYMFY 580 590 600 610 620 630 630 640 650 660 670 680 pF1KB6 LVEHRVAEATGETPIAVMGEFNDLASLSLTLLDKDDMGDEQRGSEAGPDARSLGEPLVKR :::::::.:::::::::::::.:: ..: ::::. :.: . :: . . .:: .:: CCDS64 LVEHRVAQATGETPIAVMGEFGDLNAVSPGNLDKDE-GSEVE-SEMDEELDDSSEPQAKR 640 650 660 670 680 690 690 pF1KB6 ERSDPNHSLQGI :... CCDS64 EKTELSQAFPVGCMQPVLETGVQPSLLNPIHSEHIVTSTQTIRQCSATGNTYTAV 700 710 720 730 740 >>CCDS6450.1 RFX3 gene_id:5991|Hs108|chr9 (707 aa) initn: 1902 init1: 1426 opt: 2479 Z-score: 2100.7 bits: 399.2 E(32554): 1.1e-110 Smith-Waterman score: 2787; 66.0% identity (82.6% similar) in 680 aa overlap (1-646:1-656) 10 20 30 40 50 60 pF1KB6 MQNSEGGADSPASVALRPSAAAPPVPASPQRVLVQAASSNPKGAQMQPISLPRVQQVPQQ ::.:: :.:. ..:.:. :.:. : : .:. :. : .:.: :::: : CCDS64 MQTSETGSDTGSTVTLQTSVASQ--AAVPTQVVQQV----P--VQQQ------VQQV-QT 10 20 30 40 70 80 90 100 110 pF1KB6 VQPVQHVYPAQVQYVEGGDAVYTNGTIRTA-YTYNPEPQMYAPSSTASYFEAPGG-AQVT :: ::::::::::::::.:.:::::.:::. : :. : :::. .. ..::.. :. :::: CCDS64 VQQVQHVYPAQVQYVEGSDTVYTNGAIRTTTYPYT-ETQMYSQNTGGNYFDTQGSSAQVT 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB6 VAASSPPAVPSHSMVG---ITMDV-GGSPIVSSAGAYLIHGGMDSTRHSLAHTSRSSPAT ...:: ::::: : : : ::. : ::.:.::: ..:... ::..::.:.:::: CCDS64 TVVSS------HSMVGTGGIQMGVTGGQLISSSGGTYLIGNSMENSGHSVTHTTRASPAT 110 120 130 140 150 180 190 200 pF1KB6 -------------------------LQWLLDNYETAEGVSLPRSSLYNHYLRHCQEHKLD :::::::::::::::::::.::::::::::::::: CCDS64 IEMAIETLQKSDGLSTHRSSLLNSHLQWLLDNYETAEGVSLPRSTLYNHYLRHCQEHKLD 160 170 180 190 200 210 210 220 230 240 250 260 pF1KB6 PVNAASFGKLIRSVFMGLRTRRLGTRGNSKYHYYGIRLKPDSPLNRLQEDTQYMAMRQQP :::::::::::::.:::::::::::::::::::::::.:::::::::::: ::::::::: CCDS64 PVNAASFGKLIRSIFMGLRTRRLGTRGNSKYHYYGIRVKPDSPLNRLQEDMQYMAMRQQP 220 230 240 250 260 270 270 280 290 300 310 320 pF1KB6 MHQKPRYRPAQKTDSLGDSGSHSGLHS--TPEQTMAVQSQHHQQYIDVSHVFPEFPAPDL :.:: ::.: ::.:...:. . :: .. . :::. .:::::::..:.:...::: .. CCDS64 MQQKQRYKPMQKVDGVADGFTGSGQQTGTSVEQTVIAQSQHHQQFLDASRALPEFGEVEI 280 290 300 310 320 330 330 340 350 360 370 380 pF1KB6 GSFLLQDGVTLHDVKALQLVYRRHCEATVDVVMNLQFHYIEKLWLSFWN-SKASSSDGPT .: : ::.:..:.:.:: .::.:::: .:::.:::: ::::: .:: : .. .:: : CCDS64 SS--LPDGTTFEDIKSLQSLYREHCEAILDVVVNLQFSLIEKLWQTFWRYSPSTPTDGTT 340 350 360 370 380 390 390 400 410 420 430 440 pF1KB6 SLPASDEDPEGAVLPKDKLISLCQCDPILRWMRSCDHILYQALVEILIPDVLRPVPSTLT .:. . . ::: :::.::. . ::.:: .::: .:::::::::::::::.::.:: CCDS64 ITESSNLSEIESRLPKAKLITLCKHESILKWMCNCDHGMYQALVEILIPDVLRPIPSALT 400 410 420 430 440 450 450 460 470 480 490 500 pF1KB6 QAIRNFAKSLEGWLTNAMSDFPQQVIQTKVGVVSAFAQTLRRYTSLNHLAQAARAVLQNT ::::::::::::::.:::...::..:::::..:::::::::::::::::::::::::::: CCDS64 QAIRNFAKSLEGWLSNAMNNIPQRMIQTKVAAVSAFAQTLRRYTSLNHLAQAARAVLQNT 460 470 480 490 500 510 510 520 530 540 550 560 pF1KB6 SQINQMLSDLNRVDFANVQEQASWVCQCEESVVQRLEQDFKLTLQQQSSLDQWASWLDSV ::::::::::::::::::::::::::::....::::: :::.::::::.:.:::.:::.: CCDS64 SQINQMLSDLNRVDFANVQEQASWVCQCDDNMVQRLETDFKMTLQQQSTLEQWAAWLDNV 520 530 540 550 560 570 570 580 590 600 610 620 pF1KB6 VTQVLKQHAGSPSFPKAARQFLLKWSFYSSMVIRDLTLRSAASFGSFHLIRLLYDEYMFY . :.:: . : ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 MMQALKPYEGRPSFPKAARQFLLKWSFYSSMVIRDLTLRSAASFGSFHLIRLLYDEYMFY 580 590 600 610 620 630 630 640 650 660 670 680 pF1KB6 LVEHRVAEATGETPIAVMGEFNDLASLSLTLLDKDDMGDEQRGSEAGPDARSLGEPLVKR :::::::.:::::::::::: CCDS64 LVEHRVAQATGETPIAVMGEVREAERAVTHWVIKNKPELHFSLNTLLIKTMVPNQVSLRA 640 650 660 670 680 690 >>CCDS12301.1 RFX1 gene_id:5989|Hs108|chr19 (979 aa) initn: 2533 init1: 1338 opt: 2297 Z-score: 1944.9 bits: 370.8 E(32554): 5.2e-102 Smith-Waterman score: 2508; 56.5% identity (76.1% similar) in 735 aa overlap (25-690:241-967) 10 20 30 40 50 pF1KB6 MQNSEGGADSPASVALRPSAAAPPVPASPQRVLVQAASSNPKGAQMQPISLPRV ::.. .: .:::. . :: . .::... . CCDS12 VQANSSSSKTAGAPTGTVPQQLQVHGVQQSVPVTQERSVVQATPQAPKPGPVQPLTVQGL 220 230 240 250 260 270 60 70 80 90 100 pF1KB6 Q--QVPQQVQ-----PVQHVYPAQVQYVEGGDAVYTNGTIRTA-YTYNPEPQMYAPSSTA : .: :.:: :: ::: .:::::::::: :: ..::.. :.: :: .:. .... CCDS12 QPVHVAQEVQQLQQVPVPHVYSSQVQYVEGGDASYTASAIRSSTYSY-PETPLYTQTAST 280 290 300 310 320 110 120 130 140 pF1KB6 SYFEAPGGA-QVTVAASSPPAVPSHSMVGITMDVGGSPIVSS------------------ ::.:: : : ::.. :.: .. : :: : :.:: .:.: CCDS12 SYYEAAGTATQVSTPATSQAVASSGSM---PMYVSGSQVVASSTSTGAGASNSSGGGGSG 330 340 350 360 370 380 150 160 170 180 pF1KB6 -----------------------AGAYLIHGG--MDSTRHSLAHTSRSSPATLQWLLDNY ::.:.:.:: . :. .: .::.:.::::.::::::: CCDS12 GGGGGGGGGGGGGSGSTGGGGSGAGTYVIQGGYMLGSASQSYSHTTRASPATVQWLLDNY 390 400 410 420 430 440 190 200 210 220 230 240 pF1KB6 ETAEGVSLPRSSLYNHYLRHCQEHKLDPVNAASFGKLIRSVFMGLRTRRLGTRGNSKYHY :::::::::::.:: ::: ::::.::.::::::::::::::::::::::::::::::::: CCDS12 ETAEGVSLPRSTLYCHYLLHCQEQKLEPVNAASFGKLIRSVFMGLRTRRLGTRGNSKYHY 450 460 470 480 490 500 250 260 270 280 290 300 pF1KB6 YGIRLKPDSPLNRLQEDTQYMAMRQQPMHQKPRYRPAQKTDSLGDSGSHSGLHSTPEQTM ::.:.: .::: ::.:: :.:::: ::. :: : .: :: ... .. . . :: . . CCDS12 YGLRIKASSPLLRLMEDQQHMAMRGQPFSQKQRLKPIQKMEGMTNGVAVGQQPSTGLSDI 510 520 530 540 550 560 310 320 330 340 350 360 pF1KB6 AVQSQHHQQYIDVSHVFPEFPAPDLGSFLLQDGVTLHDVKALQLVYRRHCEATVDVVMNL ..: :..::..:.:. .:.: :: . .: .:: :.::.:..::.:::: :::..:: CCDS12 SAQVQQYQQFLDASRSLPDFTELDLQGKVLPEGVGPGDIKAFQVLYREHCEAIVDVMVNL 570 580 590 600 610 620 370 380 390 400 410 420 pF1KB6 QFHYIEKLWLSFWNSKASS-SDGPTSLPASDEDPEGAVLPKDKLISLCQCDPILRWMRSC :: .: :: .:: . :. :..: : . .: ::: :. : . .:.:.: . : CCDS12 QFTLVETLWKTFWRYNLSQPSEAP---PLAVHDEAEKRLPKAILVLLSKFEPVLQWTKHC 630 640 650 660 670 680 430 440 450 460 470 480 pF1KB6 DHILYQALVEILIPDVLRPVPSTLTQAIRNFAKSLEGWLTNAMSDFPQQVIQTKVGVVSA :..:::.::::::::::::.::.:::::::::::::.:::.:: ..:......::....: CCDS12 DNVLYQGLVEILIPDVLRPIPSALTQAIRNFAKSLESWLTHAMVNIPEEMLRVKVAAAGA 690 700 710 720 730 740 490 500 510 520 530 540 pF1KB6 FAQTLRRYTSLNHLAQAARAVLQNTSQINQMLSDLNRVDFANVQEQASWVCQCEESVVQR :::::::::::::::::::::::::.:::::::::::::::::::::::::.::. :::: CCDS12 FAQTLRRYTSLNHLAQAARAVLQNTAQINQMLSDLNRVDFANVQEQASWVCRCEDRVVQR 750 760 770 780 790 800 550 560 570 580 590 600 pF1KB6 LEQDFKLTLQQQSSLDQWASWLDSVVTQVLKQHAGSPSFPKAARQFLLKWSFYSSMVIRD ::::::.:::::.::.:::.:::.::.:::: . :: .:::::. ::::::::::::::: CCDS12 LEQDFKVTLQQQNSLEQWAAWLDGVVSQVLKPYQGSAGFPKAAKLFLLKWSFYSSMVIRD 810 820 830 840 850 860 610 620 630 640 650 pF1KB6 LTLRSAASFGSFHLIRLLYDEYMFYLVEHRVAEATGETPIAVMGEFNDLASLSLTLLD-- :::::::::::::::::::::::.::.:::::.: ::::::::::: .::. ::. :: CCDS12 LTLRSAASFGSFHLIRLLYDEYMYYLIEHRVAQAKGETPIAVMGEFANLAT-SLNPLDPD 870 880 890 900 910 920 660 670 680 690 pF1KB6 KDDMGDEQRGSE----------AGPDARSLG----EPLVKRERSDPNHSLQGI ::. .:.. :: :: .. .:: :: .: :.: CCDS12 KDEEEEEEEESEDELPQDISLAAGGESPALGPETLEPPAKLARTDARGLFVQALPSS 930 940 950 960 970 >>CCDS75809.1 RFX3 gene_id:5991|Hs108|chr9 (413 aa) initn: 1377 init1: 901 opt: 1082 Z-score: 924.9 bits: 180.9 E(32554): 3.4e-45 Smith-Waterman score: 1390; 56.0% identity (75.4% similar) in 427 aa overlap (1-393:1-403) 10 20 30 40 50 60 pF1KB6 MQNSEGGADSPASVALRPSAAAPPVPASPQRVLVQAASSNPKGAQMQPISLPRVQQVPQQ ::.:: :.:. ..:.:. :.:. : : .:. :. :.. .:::: : CCDS75 MQTSETGSDTGSTVTLQTSVASQA--AVPTQVVQQV-----------PVQ-QQVQQV-QT 10 20 30 40 70 80 90 100 110 pF1KB6 VQPVQHVYPAQVQYVEGGDAVYTNGTIRTA-YTYNPEPQMYAPSSTASYFEAPGG-AQVT :: ::::::::::::::.:.:::::.:::. : :. : :::. .. ..::.. :. :::: CCDS75 VQQVQHVYPAQVQYVEGSDTVYTNGAIRTTTYPYT-ETQMYSQNTGGNYFDTQGSSAQVT 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB6 VAASSPPAVPSHSMVG---ITMDV-GGSPIVSSAGAYLIHGGMDSTRHSLAHTSRSSPAT ...: :::::: : : : ::. : ::.:.::: ..:... ::..::.:.:::: CCDS75 TVVS------SHSMVGTGGIQMGVTGGQLISSSGGTYLIGNSMENSGHSVTHTTRASPAT 110 120 130 140 150 180 190 200 pF1KB6 -------------------------LQWLLDNYETAEGVSLPRSSLYNHYLRHCQEHKLD :::::::::::::::::::.::::::::::::::: CCDS75 IEMAIETLQKSDGLSTHRSSLLNSHLQWLLDNYETAEGVSLPRSTLYNHYLRHCQEHKLD 160 170 180 190 200 210 210 220 230 240 250 260 pF1KB6 PVNAASFGKLIRSVFMGLRTRRLGTRGNSKYHYYGIRLKPDSPLNRLQEDTQYMAMRQQP :::::::::::::.:::::::::::::::::::::::.:::::::::::: ::::::::: CCDS75 PVNAASFGKLIRSIFMGLRTRRLGTRGNSKYHYYGIRVKPDSPLNRLQEDMQYMAMRQQP 220 230 240 250 260 270 270 280 290 300 310 320 pF1KB6 MHQKPRYRPAQKTDSLGDSGSHSGLHS--TPEQTMAVQSQHHQQYIDVSHVFPEFPAPDL :.:: ::.: ::.:...:. . :: .. . :::. .:::::::..:.:...::: .. CCDS75 MQQKQRYKPMQKVDGVADGFTGSGQQTGTSVEQTVIAQSQHHQQFLDASRALPEFGEVEI 280 290 300 310 320 330 330 340 350 360 370 380 pF1KB6 GSFLLQDGVTLHDVKALQLVYRRHCEATVDVVMNLQFHYIEKLWLSFWN-SKASSSDGPT .: : ::.:..:.:.:: .::.:::: .:::.:::: ::::: .:: : .. .:: : CCDS75 SS--LPDGTTFEDIKSLQSLYREHCEAILDVVVNLQFSLIEKLWQTFWRYSPSTPTDGTT 340 350 360 370 380 390 390 400 410 420 430 440 pF1KB6 SLPASDEDPEGAVLPKDKLISLCQCDPILRWMRSCDHILYQALVEILIPDVLRPVPSTLT . .: CCDS75 ITESRSESTSFPIHFHG 400 410 >>CCDS9108.1 RFX4 gene_id:5992|Hs108|chr12 (641 aa) initn: 654 init1: 312 opt: 574 Z-score: 493.3 bits: 101.6 E(32554): 3.7e-21 Smith-Waterman score: 656; 31.0% identity (63.7% similar) in 419 aa overlap (236-646:7-393) 210 220 230 240 250 260 pF1KB6 HKLDPVNAASFGKLIRSVFMGLRTRRLGTRGNSKYHY-YGIRLKPDSPLNRLQEDTQYMA :.:.. ::.. ::.: . :... CCDS91 MNWAAFGGSEFFIPEGIQIDSRCPLSR--NITEWYH 10 20 30 270 280 290 300 310 320 pF1KB6 MRQQPMHQKPRYRPAQKTDSLGDSGSHSGLHSTPEQTMAVQSQHHQQYIDVSHVFPEFPA . .... .: .. . . . :..: . . .::.: . . . .. ..::: CCDS91 YYGIAVKESSQYYDVMYSKKGAAWVSETGKKEVSKQTVAYSPRSK-----LGTLLPEF-- 40 50 60 70 80 330 340 350 360 370 380 pF1KB6 PDLGSFLLQDGVTLHDVKALQLVYRRHCEATVDVVMNLQFHYIEKLWLSFWNSKASSSDG :.. .. : .. . :... ..:: ::. .:.:. .: .... : ::.. CCDS91 PNVKDLNLPASLPEEKVSTFIMMYRTHCQRILDTVIRANFDEVQSFLLHFWQGMP----- 90 100 110 120 130 140 390 400 410 420 430 440 pF1KB6 PTSLPASDEDPEGAVLPKDKLISLCQCDPILRWMRSCDHILYQALVEILIPDVLRPVPST : :: :: .. .... :: :::.:. .:.: ::. .:.. CCDS91 PHMLP---------VLGSSTVVNIVGV---------CDSILYKAISGVLMPTVLQALPDS 150 160 170 180 450 460 470 480 490 500 pF1KB6 LTQAIRNFAKSLEGWLTNAMSDFPQQVIQTKVGVVSAFAQTLRRYTSLNHLAQAARAVLQ :::.::.:::.:. :: :. :.:... . : . :.: ::: :::::: ::.:.:.. CCDS91 LTQVIRKFAKQLDEWLKVALHDLPENLRNIKFELSRRFSQILRRQTSLNHLCQASRTVIH 190 200 210 220 230 240 510 520 530 540 550 560 pF1KB6 NTSQINQMLSDLNRVDFANVQEQASWVCQ----CEESVVQRLEQDFKLTLQQQSSLDQWA ... ::: : ::. .. .:. .. . ..... .: :.: :..:: .... CCDS91 SADITFQMLEDWRNVDLNSITKQTLYTMEDSRDEHRKLITQLYQEFDHLLEEQSPIESYI 250 260 270 280 290 300 570 580 590 600 610 pF1KB6 SWLDSVVTQVLKQHAGS--PSFPKAARQFLLKWSFYSSMVIRDLTLRSAASFGSFHLIRL :::..: . . . :.. :. :.:.:::: :: ... ::::.::.:: ::::::::.: CCDS91 EWLDTMVDRCVVKVAAKRQGSLKKVAQQFLLMWSCFGTRVIRDMTLHSAPSFGSFHLIHL 310 320 330 340 350 360 620 630 640 650 660 670 pF1KB6 LYDEYMFYLVEH-RVAEATGETPIAVMGEFNDLASLSLTLLDKDDMGDEQRGSEAGPDAR ..:.:..::.: . : ..: :. :: CCDS91 MFDDYVLYLLESLHCQERANELMRAMKGEGSTAEVREEIILTEAAAPTPSPVPSFSPAKS 370 380 390 400 410 420 >>CCDS9106.1 RFX4 gene_id:5992|Hs108|chr12 (735 aa) initn: 968 init1: 370 opt: 374 Z-score: 323.6 bits: 70.4 E(32554): 1.1e-11 Smith-Waterman score: 964; 37.1% identity (65.1% similar) in 496 aa overlap (158-646:48-487) 130 140 150 160 170 180 pF1KB6 PSHSMVGITMDVGGSPIVSSAGAYLIHGGMDSTRHSLAHTSRSSPATLQWLLDNYETAEG ...: : : :.::::::: .::: ::: CCDS91 IERCLNESENKRYSSHTSLGNVSNDENEEKENNRASKPH---STPATLQWLEENYEIAEG 20 30 40 50 60 70 190 200 210 220 230 240 pF1KB6 VSLPRSSLYNHYLRHCQEHKLDPVNAASFGKLIRSVFMGLRTRRLGTRGNSKYHYYGIRL : .:::.:: ::: :... .:::::::::.::. : : ::::::::.:::::::: . CCDS91 VCIPRSALYMHYLDFCEKNDTQPVNAASFGKIIRQQFPQLTTRRLGTRGQSKYHYYGIAV 80 90 100 110 120 130 250 260 270 280 290 300 pF1KB6 KPDSPLNRLQEDTQYMAMRQQPMHQKPRYRPAQKTDSLGDSGSHSGLHSTPEQTMAVQSQ : :..::. . :..: . : . :..: . . .::.: . . CCDS91 K---------ESSQYYDV----MYSK---KGAAWV-------SETGKKEVSKQTVAYSPR 140 150 160 170 310 320 330 340 350 360 pF1KB6 HHQQYIDVSHVFPEFPAPDLGSFLLQDGVTLHDVKALQLVYRRHCEATVDVVMNLQFHYI . .. ..::: :.. .. : .. . :... ..:: ::. .:.:. .: . CCDS91 SK-----LGTLLPEF--PNVKDLNLPASLPEEKVSTFIMMYRTHCQRILDTVIRANFDEV 180 190 200 210 220 370 380 390 400 410 420 pF1KB6 EKLWLSFWNSKASSSDGPTSLPASDEDPEGAVLPKDKLISLCQCDPILRWMRSCDHILYQ ... : ::.. : :: :: .. .... :: :::. CCDS91 QSFLLHFWQGMP-----PHMLP---------VLGSSTVVNIVGV---------CDSILYK 230 240 250 260 430 440 450 460 470 480 pF1KB6 ALVEILIPDVLRPVPSTLTQAIRNFAKSLEGWLTNAMSDFPQQVIQTKVGVVSAFAQTLR :. .:.: ::. .:..:::.::.:::.:. :: :. :.:... . : . :.: :: CCDS91 AISGVLMPTVLQALPDSLTQVIRKFAKQLDEWLKVALHDLPENLRNIKFELSRRFSQILR 270 280 290 300 310 320 490 500 510 520 530 540 pF1KB6 RYTSLNHLAQAARAVLQNTSQINQMLSDLNRVDFANVQEQASWVCQ----CEESVVQRLE : :::::: ::.:.:..... ::: : ::. .. .:. .. . ..... .: CCDS91 RQTSLNHLCQASRTVIHSADITFQMLEDWRNVDLNSITKQTLYTMEDSRDEHRKLITQLY 330 340 350 360 370 380 550 560 570 580 590 600 pF1KB6 QDFKLTLQQQSSLDQWASWLDSVVTQVLKQHAGS--PSFPKAARQFLLKWSFYSSMVIRD :.: :..:: .... :::..: . . . :.. :. :.:.:::: :: ... :::: CCDS91 QEFDHLLEEQSPIESYIEWLDTMVDRCVVKVAAKRQGSLKKVAQQFLLMWSCFGTRVIRD 390 400 410 420 430 440 610 620 630 640 650 660 pF1KB6 LTLRSAASFGSFHLIRLLYDEYMFYLVEH-RVAEATGETPIAVMGEFNDLASLSLTLLDK .::.:: ::::::::.:..:.:..::.: . : ..: :. :: CCDS91 MTLHSAPSFGSFHLIHLMFDDYVLYLLESLHCQERANELMRAMKGEGSTAEVREEIILTE 450 460 470 480 490 500 670 680 690 pF1KB6 DDMGDEQRGSEAGPDARSLGEPLVKRERSDPNHSLQGI CCDS91 AAAPTPSPVPSFSPAKSATSVEVPPPSSPVSNPSPEYTGLSTTGAMQSYTWSLTYTVTTA 510 520 530 540 550 560 >>CCDS55880.1 RFX4 gene_id:5992|Hs108|chr12 (744 aa) initn: 968 init1: 370 opt: 374 Z-score: 323.5 bits: 70.4 E(32554): 1.1e-11 Smith-Waterman score: 964; 37.1% identity (65.1% similar) in 496 aa overlap (158-646:57-496) 130 140 150 160 170 180 pF1KB6 PSHSMVGITMDVGGSPIVSSAGAYLIHGGMDSTRHSLAHTSRSSPATLQWLLDNYETAEG ...: : : :.::::::: .::: ::: CCDS55 IERCLNESENKRYSSHTSLGNVSNDENEEKENNRASKPH---STPATLQWLEENYEIAEG 30 40 50 60 70 80 190 200 210 220 230 240 pF1KB6 VSLPRSSLYNHYLRHCQEHKLDPVNAASFGKLIRSVFMGLRTRRLGTRGNSKYHYYGIRL : .:::.:: ::: :... .:::::::::.::. : : ::::::::.:::::::: . CCDS55 VCIPRSALYMHYLDFCEKNDTQPVNAASFGKIIRQQFPQLTTRRLGTRGQSKYHYYGIAV 90 100 110 120 130 140 250 260 270 280 290 300 pF1KB6 KPDSPLNRLQEDTQYMAMRQQPMHQKPRYRPAQKTDSLGDSGSHSGLHSTPEQTMAVQSQ : :..::. . :..: . : . :..: . . .::.: . . CCDS55 K---------ESSQYYDV----MYSK---KGAAWV-------SETGKKEVSKQTVAYSPR 150 160 170 180 310 320 330 340 350 360 pF1KB6 HHQQYIDVSHVFPEFPAPDLGSFLLQDGVTLHDVKALQLVYRRHCEATVDVVMNLQFHYI . .. ..::: :.. .. : .. . :... ..:: ::. .:.:. .: . CCDS55 SK-----LGTLLPEF--PNVKDLNLPASLPEEKVSTFIMMYRTHCQRILDTVIRANFDEV 190 200 210 220 230 370 380 390 400 410 420 pF1KB6 EKLWLSFWNSKASSSDGPTSLPASDEDPEGAVLPKDKLISLCQCDPILRWMRSCDHILYQ ... : ::.. : :: :: .. .... :: :::. CCDS55 QSFLLHFWQGMP-----PHMLP---------VLGSSTVVNIVGV---------CDSILYK 240 250 260 270 430 440 450 460 470 480 pF1KB6 ALVEILIPDVLRPVPSTLTQAIRNFAKSLEGWLTNAMSDFPQQVIQTKVGVVSAFAQTLR :. .:.: ::. .:..:::.::.:::.:. :: :. :.:... . : . :.: :: CCDS55 AISGVLMPTVLQALPDSLTQVIRKFAKQLDEWLKVALHDLPENLRNIKFELSRRFSQILR 280 290 300 310 320 330 490 500 510 520 530 540 pF1KB6 RYTSLNHLAQAARAVLQNTSQINQMLSDLNRVDFANVQEQASWVCQ----CEESVVQRLE : :::::: ::.:.:..... ::: : ::. .. .:. .. . ..... .: CCDS55 RQTSLNHLCQASRTVIHSADITFQMLEDWRNVDLNSITKQTLYTMEDSRDEHRKLITQLY 340 350 360 370 380 390 550 560 570 580 590 600 pF1KB6 QDFKLTLQQQSSLDQWASWLDSVVTQVLKQHAGS--PSFPKAARQFLLKWSFYSSMVIRD :.: :..:: .... :::..: . . . :.. :. :.:.:::: :: ... :::: CCDS55 QEFDHLLEEQSPIESYIEWLDTMVDRCVVKVAAKRQGSLKKVAQQFLLMWSCFGTRVIRD 400 410 420 430 440 450 610 620 630 640 650 660 pF1KB6 LTLRSAASFGSFHLIRLLYDEYMFYLVEH-RVAEATGETPIAVMGEFNDLASLSLTLLDK .::.:: ::::::::.:..:.:..::.: . : ..: :. :: CCDS55 MTLHSAPSFGSFHLIHLMFDDYVLYLLESLHCQERANELMRAMKGEGSTAEVREEIILTE 460 470 480 490 500 510 670 680 690 pF1KB6 DDMGDEQRGSEAGPDARSLGEPLVKRERSDPNHSLQGI CCDS55 AAAPTPSPVPSFSPAKSATSVEVPPPSSPVSNPSPEYTGLSTTGAMQSYTWSLTYTVTTA 520 530 540 550 560 570 698 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 13:51:10 2016 done: Sat Nov 5 13:51:11 2016 Total Scan time: 3.960 Total Display time: 0.120 Function used was FASTA [36.3.4 Apr, 2011]