FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9760, 739 aa 1>>>pF1KB9760 739 - 739 aa - 739 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 11.4050+/-0.00102; mu= -4.3838+/- 0.062 mean_var=447.2030+/-92.429, 0's: 0 Z-trim(116.6): 27 B-trim: 170 in 1/52 Lambda= 0.060649 statistics sampled from 17227 (17251) to 17227 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.797), E-opt: 0.2 (0.53), width: 16 Scan time: 4.750 The best scores are: opt bits E(32554) CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 ( 739) 4869 440.6 4.1e-123 CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 ( 781) 1055 106.9 1.2e-22 CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 ( 291) 744 79.3 9.5e-15 CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 ( 332) 740 79.0 1.3e-14 CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 ( 284) 731 78.1 2.1e-14 CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 ( 246) 690 74.5 2.2e-13 >>CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 (739 aa) initn: 4869 init1: 4869 opt: 4869 Z-score: 2323.8 bits: 440.6 E(32554): 4.1e-123 Smith-Waterman score: 4869; 99.7% identity (100.0% similar) in 739 aa overlap (1-739:1-739) 10 20 30 40 50 60 pF1KB9 MATLPAEPSAGPAAGGEAVAAAAATEEEEEEARQLLQTLQAAEGEAAAAAGAGAGAAAAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MATLPAEPSAGPAAGGEAVAAAAATEEEEEEARQLLQTLQAAEGEAAAAAGAGAGAAAAG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 AEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGALPPAERL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGALPPAERL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 RGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYHEAERARGRAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 RGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYHEAERARGRAL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 GAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDEKRRLATLTGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDEKRRLATLTGL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 SLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLERGAAPVSAEAAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLERGAAPVSAEAAA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 QGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLALGEASSLGPLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 QGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLALGEASSLGPLL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 LTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKGAQVAAPGPALGEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKGAQVAAPGPALGEE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 VLGPLAQVVPGPPTAATFPLPPGPVPAVAAPQVVPLSPPPGYPTGLSPTSPLLNLPQVVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VLGPLAQVVPGPPTAATFPLPPGPVPAVAAPQVVPLSPPPGYPTGLSPTSPLLNLPQVVP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 TSQVVTLPQAVGPLQLLAAGPGSPVKVAAAAGPANVHLINSGVGVTALQLPSATAPGNFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 TSQVVTLPQAVGPLQLLAAGPGSPVKVAAAAGPANVHLINSGVGVTALQLPSATAPGNFL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB9 LANPVSGSPIVTGVAVQQGKIILTATFPTSMLVSQVLPPAPGLALPLKPETAISVPEGGL :::::::::::::::.:::::::::::::::::::::::::::::::::::::::::::: CCDS12 LANPVSGSPIVTGVALQQGKIILTATFPTSMLVSQVLPPAPGLALPLKPETAISVPEGGL 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB9 PVAPSPALPEAHALGTLSAQQPPPAAATTSSTSLPFSPDSPGLLPNFPAPPPEGLMLSPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PVAPSPALPEAHALGTLSAQQPPPAAATTSSTSLPFSPDSPGLLPNFPAPPPEGLMLSPA 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB9 AVPVWSAGLELSAGTEGLLEAEKGLGTQAPHTMLRLPDPDPEGLLLGATAGGEVDEGLEA ::::::::::::::::::::::::::::::::.::::::::::::::::::::::::::: CCDS12 AVPVWSAGLELSAGTEGLLEAEKGLGTQAPHTVLRLPDPDPEGLLLGATAGGEVDEGLEA 670 680 690 700 710 720 730 pF1KB9 EAKVLTQLQSVPVEEPLEL ::::::::::::::::::: CCDS12 EAKVLTQLQSVPVEEPLEL 730 >>CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 (781 aa) initn: 907 init1: 853 opt: 1055 Z-score: 520.0 bits: 106.9 E(32554): 1.2e-22 Smith-Waterman score: 1099; 35.5% identity (59.1% similar) in 785 aa overlap (10-738:36-779) 10 20 30 pF1KB9 MATLPAEPSAGPAAGGEAVAAAAATEEEEEEARQLLQTL :: :: : . : : : .: . CCDS97 PTGQIASAADIKQENGMESASEGQEAHREVAGGAAVGLSPPAPAPFPLEPGDAATAAARV 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB9 QAAEGE-AAAAAGAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEAL .. :: :::::::.: . .: : ::. : : :::..:::::::: CCDS97 SGEEGAVAAAAAGAAADQVQLHSELLGR-----HHHAAAAAAQTPLAFSPDHVACVCEAL 70 80 90 100 110 120 100 110 120 130 140 150 pF1KB9 LQAGHAGRLSRFLGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHA :.:. ::.::: .:: .. :::.. .:.:::::::..: : ::: .:::. : .:.: CCDS97 QQGGNLDRLARFLWSLPQSDLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHP 130 140 150 160 170 180 160 170 180 190 200 210 pF1KB9 FLQDLYLRARYHEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKA .::.:. .::: :::::::: ::::::::::.:::::.::::::::::::::.:: ::: CCDS97 LLQQLWYKARYTEAERARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKE 190 200 210 220 230 240 220 230 240 250 260 270 pF1KB9 CYRGNRYPTPDEKRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTED :. ::::.: :::.:: .::::::::::::::::::::. . . ::::::::.::: CCDS97 LYKQNRYPSPAEKRHLAKITGLSLTQVSNWFKNRRQRDRNPSE--TQSKSESDGNPSTED 250 260 270 280 290 280 290 300 310 320 330 pF1KB9 ESSRSPEDLERGAAPVSAEAAAQGS-------IFLAGTGPPAPCPASSSILVNGSFLAAS :::.. ::: :... .. : ... : .::..:.:::.. :: CCDS97 ESSKGHEDLSPHPLSSSSDGITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPAS 300 310 320 330 340 350 340 350 360 370 380 pF1KB9 GSPAVLLNG-----GP--VIINGLALGEASSLGPLLLTGGGGAPPPQPSPQGASETKTSL :: :.::: :: ::.::: .:...... :. :: . : .. . . CCDS97 TSP-VFLNGNSFIQGPSGVILNGLNVGNTQAVA---LN-----PPKMSSNIVSNGISMTD 360 370 380 390 400 390 400 410 420 430 440 pF1KB9 VLDPQTGEVR-LEEAQSEAPETKGAQVAAPGPALGEEVLGPLAQVVPG-PPTAATFPLPP .: . .:. .. :: : ..: ... .:.. :.. :: :.. . CCDS97 ILGSTSQDVKEFKVLQSSA---NSATTTSYSPSV------PVS--FPGLIPSTEVKREGI 410 420 430 440 450 450 460 470 480 490 500 pF1KB9 GPVPAVAAPQVVPLSPPPGYPTGLSPTSPLLNLPQVVPTSQVVTLPQAVGPLQLLAAGPG : . . .:: .. : . .. . ....:. .:: .. . .:::: : CCDS97 QTVASQDGGSVVTFTTP----VQINQYG-IVQIPNSGANSQFLNGSIGFSPLQL----P- 460 470 480 490 500 510 520 530 540 550 pF1KB9 SPVKVAAAAGPANVHLINSGVGV-----TALQ----LPSATAPGNFLLANPVSGSPIVTG ::.:::. : .: .: .. :..: . :. ::. . . : .:. : : CCDS97 -PVSVAASQGNISVSSSTSDGSTFTSESTTVQQGKVFLSSLAPSAVVYTVPNTGQTI--G 510 520 530 540 550 560 560 570 580 590 600 pF1KB9 VAVQQG---KIILTATFPTSM--LVSQVLPPA--PGLAL-PLKPETAISVPEGGLPVAPS . :.: ..... .:... :. : : .: :: . : .. ..:: CCDS97 SVKQEGLERSLVFSQLMPVNQNAQVNANLSSENISGSGLHPLASSLVNVSPTHNFSLSPS 570 580 590 600 610 620 610 620 630 640 650 660 pF1KB9 PALPEAHALGTLSAQQPPPAAATTSSTSLPFSPDSPGLLPNFPAPPPEGLMLSP---AA- : .. .. .:: : ....:: : . . : : . :. : :: CCDS97 TLLNPTELNRDIADSQPMSAPVASKSTVTSVSNTNYATLQNCSLITGQDLLSVPMTQAAL 630 640 650 660 670 680 670 680 690 700 710 pF1KB9 ---VPVW--SAGLELSAGTEGLLEAEKGLGTQAPHTMLR--LPDPDPEG----LLLGATA ::. ..: : . ... :. : :. .: . : . . .. ..: . . CCDS97 GEIVPTAEDQVGHPSPAVHQDFVQ-EHRLVLQSVANMKENFLSNSESKATSSLMMLDSKS 690 700 710 720 730 740 720 730 pF1KB9 ----GGEVD---EGLEAEAKVLTQLQSVPVEEPLEL : :: : ::.. : :..::.: ..: .. CCDS97 KYVLDGMVDTVCEDLETDKKELAKLQTVQLDEDMQDL 750 760 770 780 >>CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 (291 aa) initn: 808 init1: 730 opt: 744 Z-score: 378.2 bits: 79.3 E(32554): 9.5e-15 Smith-Waterman score: 767; 44.3% identity (67.7% similar) in 316 aa overlap (81-393:5-286) 60 70 80 90 100 110 pF1KB9 GAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRF :: . :. ::::::::.: :.:. ::.:: CCDS18 MSMLPT-FGFTQEQVACVCEVLQQGGNIERLGRF 10 20 30 120 130 140 150 160 170 pF1KB9 LGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYH : .:: :.:. .. ::.:.:.:::.::.. :::..:::. : .:: ::.:.:.:.: CCDS18 LWSLPACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQLWLKAHYI 40 50 60 70 80 90 180 190 200 210 220 230 pF1KB9 EAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDE :::. ::: :::: :::.:.:::::..::::::: :::::.::..:. : : ::.: : CCDS18 EAEKLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHNPYPSPRE 100 110 120 130 140 150 240 250 260 270 280 290 pF1KB9 KRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLERG ::.:: :::. ::::::::::::::: : .: ..: .. . .:..: CCDS18 KRELAEATGLTTTQVSNWFKNRRQRDR------AAEAKERENNENS-NSNSHNP------ 160 170 180 190 200 300 310 320 330 340 pF1KB9 AAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGL-A : :.: . . . .:. .:.:::.::. : . .: . CCDS18 ---------------LNGSGKSVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGLPSLHS 210 220 230 240 350 360 370 380 390 400 pF1KB9 LGE--ASSLGPLLLTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKG ::. . : :. . ::::: : : .: ... .:.:..... CCDS18 LGHPPGPSAVPVPVPGGGGADPLQHH-HGLQDS----ILNPMSANLVDLGS 250 260 270 280 290 410 420 430 440 450 460 pF1KB9 AQVAAPGPALGEEVLGPLAQVVPGPPTAATFPLPPGPVPAVAAPQVVPLSPPPGYPTGLS >>CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 (332 aa) initn: 772 init1: 546 opt: 740 Z-score: 375.6 bits: 79.0 E(32554): 1.3e-14 Smith-Waterman score: 754; 46.6% identity (69.2% similar) in 292 aa overlap (44-315:42-330) 20 30 40 50 60 70 pF1KB9 AGGEAVAAAAATEEEEEEARQLLQTLQAAEGEAAAAAGAGAGAAAAGAEGPGSPGVPGS- : :....:.: ::...:: : :. : :: CCDS18 SHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAGGAGGGGGGGSR 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 -PPEAAS--EPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGALPPA----ERLRGSDP ::: : . :: : ::::::: :::.: ..: ::.::: .:: : : . . CCDS18 APPEELSMFQLPT-LNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPGACEAINKHES 80 90 100 110 120 130 130 140 150 160 170 180 pF1KB9 VLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYHEAERARGRALGAVDK .:::::.:::. :.. .::..::.. : :. :: ..:.:.:.:::. ::: :: ::: CCDS18 ILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKLRGRPLGPVDK 140 150 160 170 180 190 190 200 210 220 230 240 pF1KB9 YRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDEKRRLATLTGLSLTQV ::.:::::::.::::::. ..:::::.:. :. : . ::.:..::.:: :::. ::: CCDS18 YRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKRELAQATGLTPTQV 200 210 220 230 240 250 250 260 270 280 290 pF1KB9 SNWFKNRRQRDRTGAG---------GGAPCKSESD-GNPTTEDESSRSPEDLERGAAPVS .:::::::::::..:. : . .: .. : :: :..:: .. :: CCDS18 GNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGCPT--HGSAESPSTAASPTTSVS 260 270 280 290 300 300 310 320 330 340 350 pF1KB9 A--EAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLALGEA . : : :. .:. :. . : CCDS18 SLTERADTGTSILSVTSSDSECDV 310 320 330 >>CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 (284 aa) initn: 745 init1: 719 opt: 731 Z-score: 372.2 bits: 78.1 E(32554): 2.1e-14 Smith-Waterman score: 743; 48.8% identity (72.4% similar) in 254 aa overlap (80-333:5-244) 50 60 70 80 90 100 pF1KB9 AGAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSR : : :. ::::::::.: :.:. ::.: CCDS97 MSMLPSFG--FTQEQVACVCEVLQQGGNLERLGR 10 20 30 110 120 130 140 150 160 pF1KB9 FLGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARY :: .:: ..:. .. ::.:.:.:::.::.. :::..:::. : .: ::.:.:.:.: CCDS97 FLWSLPACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQLWLKAHY 40 50 60 70 80 90 170 180 190 200 210 220 pF1KB9 HEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPD :::. ::: :::: :::.:.:::::.:::::::: :::::.::..:. : : ::.: CCDS97 VEAEKLRGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHNPYPSPR 100 110 120 130 140 150 230 240 250 260 270 280 pF1KB9 EKRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLER :::.:: :::. ::::::::::::::: :. . .. ..: ... ... :: :: CCDS97 EKRELAEATGLTTTQVSNWFKNRRQRDR--AAEAKERENTENNNSSSNKQNQLSP--LE- 160 170 180 190 200 290 300 310 320 330 340 pF1KB9 GAAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLA :. :. . . . : :: .: .:..:.. : .: CCDS97 GGKPLMSSSEEEFS-------PPQSPDQNSVLLLQGNMGHARSSNYSLPGLTASQPSHGL 210 220 230 240 250 260 350 360 370 380 390 400 pF1KB9 LGEASSLGPLLLTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKGAQ CCDS97 QTHQHQLQDSLLGPLTSSLVDLGS 270 280 >>CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 (246 aa) initn: 671 init1: 562 opt: 690 Z-score: 353.6 bits: 74.5 E(32554): 2.2e-13 Smith-Waterman score: 694; 51.7% identity (72.4% similar) in 232 aa overlap (84-299:7-231) 60 70 80 90 100 110 pF1KB9 AGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGA : :::.::: :::.: ..: . ::.::: . CCDS97 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWS 10 20 30 120 130 140 150 160 pF1KB9 LP--PA--ERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARY :: :: : : .. ::::::.:::. :.: :::..::.. : :: :: :.:.:.: CCDS97 LPVAPAACEALNKNESVLRARAIVAFHGGNYRELYHILENHKFTKESHAKLQALWLEAHY 40 50 60 70 80 90 170 180 190 200 210 220 pF1KB9 HEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPD .:::. ::: :: :::::.:::::::.::::::. ..:::::.: :. : . ::.:. CCDS97 QEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRHLLREWYLQDPYPNPS 100 110 120 130 140 150 230 240 250 260 270 pF1KB9 EKRRLATLTGLSLTQVSNWFKNRRQRDRTGA------------GGGAPCKSESDGNPTTE .::.:: :::. :::.:::::::::::..: :.: ..:.::.: . CCDS97 KKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVL 160 170 180 190 200 210 280 290 300 310 320 330 pF1KB9 DESSRSPEDLERGAAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVL .. :: :: .:..:: CCDS97 GVAT-SP------AASLSSKAATSAISITSSDSECDI 220 230 240 739 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 00:56:13 2016 done: Sat Nov 5 00:56:14 2016 Total Scan time: 4.750 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]