FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8143, 406 aa 1>>>pF1KB8143 406 - 406 aa - 406 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.8034+/-0.000925; mu= 5.4442+/- 0.057 mean_var=335.4304+/-69.146, 0's: 0 Z-trim(115.7): 132 B-trim: 0 in 0/53 Lambda= 0.070028 statistics sampled from 16179 (16318) to 16179 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.808), E-opt: 0.2 (0.501), width: 16 Scan time: 2.570 The best scores are: opt bits E(32554) CCDS11316.1 LHX1 gene_id:3975|Hs108|chr17 ( 406) 2863 302.5 4.6e-82 CCDS9171.1 LHX5 gene_id:64211|Hs108|chr12 ( 402) 2122 227.6 1.6e-59 CCDS1338.1 LHX4 gene_id:89884|Hs108|chr1 ( 390) 555 69.3 7e-12 CCDS6994.1 LHX3 gene_id:8022|Hs108|chr9 ( 397) 535 67.3 2.9e-11 CCDS6995.1 LHX3 gene_id:8022|Hs108|chr9 ( 402) 535 67.3 2.9e-11 >>CCDS11316.1 LHX1 gene_id:3975|Hs108|chr17 (406 aa) initn: 2863 init1: 2863 opt: 2863 Z-score: 1586.8 bits: 302.5 E(32554): 4.6e-82 Smith-Waterman score: 2863; 100.0% identity (100.0% similar) in 406 aa overlap (1-406:1-406) 10 20 30 40 50 60 pF1KB8 MVHCAGCKRPILDRFLLNVLDRAWHVKCVQCCECKCNLTEKCFSREGKLYCKNDFFRCFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MVHCAGCKRPILDRFLLNVLDRAWHVKCVQCCECKCNLTEKCFSREGKLYCKNDFFRCFG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 TKCAGCAQGISPSDLVRRARSKVFHLNCFTCMMCNKQLSTGEELYIIDENKFVCKEDYLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 TKCAGCAQGISPSDLVRRARSKVFHLNCFTCMMCNKQLSTGEELYIIDENKFVCKEDYLS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 NSSVAKENSLHSATTGSDPSLSPDSQDPSQDDAKDSESANVSDKEAGSNENDDQNLGAKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 NSSVAKENSLHSATTGSDPSLSPDSQDPSQDDAKDSESANVSDKEAGSNENDDQNLGAKR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 RGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMKQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 LSALGARRHAFFRSPRRMRPLVDRLEPGELIPNGPFSFYGDYQSEYYGPGGNYDFFPQGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LSALGARRHAFFRSPRRMRPLVDRLEPGELIPNGPFSFYGDYQSEYYGPGGNYDFFPQGP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 PSSQAQTPVDLPFVPSSGPSGTPLGGLEHPLPGHHPSSEAQRFTDILAHPPGDSPSPEPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PSSQAQTPVDLPFVPSSGPSGTPLGGLEHPLPGHHPSSEAQRFTDILAHPPGDSPSPEPS 310 320 330 340 350 360 370 380 390 400 pF1KB8 LPGPLHSMSAEVFGPSPPFSSLSVNGGASYGNHLSHPPEMNEAAVW :::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LPGPLHSMSAEVFGPSPPFSSLSVNGGASYGNHLSHPPEMNEAAVW 370 380 390 400 >>CCDS9171.1 LHX5 gene_id:64211|Hs108|chr12 (402 aa) initn: 1209 init1: 916 opt: 2122 Z-score: 1182.2 bits: 227.6 E(32554): 1.6e-59 Smith-Waterman score: 2122; 74.6% identity (90.0% similar) in 409 aa overlap (1-406:2-402) 10 20 30 40 50 pF1KB8 MVHCAGCKRPILDRFLLNVLDRAWHVKCVQCCECKCNLTEKCFSREGKLYCKNDFFRCF :::::::.:::::::::::::::::.::::::::: ::.:::::::::::::::::: : CCDS91 MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCECKTNLSEKCFSREGKLYCKNDFFRRF 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB8 GTKCAGCAQGISPSDLVRRARSKVFHLNCFTCMMCNKQLSTGEELYIIDENKFVCKEDYL ::::::::::::::::::.::::::::::::::.::::::::::::.:::::::::.::: CCDS91 GTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMVCNKQLSTGEELYVIDENKFVCKDDYL 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB8 SNSSVAKENSLHSATTGSDPSLSPDSQDPSQDDAKDSESANVSDKEAGSNENDDQNLGAK :.::. ::.::.:... .: ::::: :: ::: :...... ::::...:::..:: :.: CCDS91 SSSSL-KEGSLNSVSSCTDRSLSPDLQDALQDDPKETDNSTSSDKETANNENEEQNSGTK 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 RRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS91 RRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 QLSALGARRHAFFRSPRRMRPLVDRLEPGELIPNGPFSFYGDYQSEYYGPGGNYDFFPQG :::::::::::::::::::::: ::. .:.. . :...:::::..::.::.::::: .: CCDS91 QLSALGARRHAFFRSPRRMRPLGGRLDESEMLGSTPYTYYGDYQGDYYAPGSNYDFFAHG 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 PPSSQAQTPVDLPFVPSSGPSGTPLGGLEHPLPGHHPSSEAQRFTDILAHPPGDSPSPEP ::: :::.:.: :. .:::..::::.:: :: : : ... ::::...:: :.::::: CCDS91 PPS-QAQSPADSSFLAASGPGSTPLGALEPPLAGPH-AADNPRFTDMISHP--DTPSPEP 300 310 320 330 340 350 360 370 380 390 400 pF1KB8 SLPGPLHSMSAEVF--GPSPPFSSLSVNGGASYGNHLSHP-PEMNEAAVW .::: :: : .::: :::::: ..: ..:.. :::: ::.:::::: CCDS91 GLPGTLHPMPGEVFSGGPSPPFP---MSGTSGYSGPLSHPNPELNEAAVW 360 370 380 390 400 >>CCDS1338.1 LHX4 gene_id:89884|Hs108|chr1 (390 aa) initn: 924 init1: 553 opt: 555 Z-score: 326.8 bits: 69.3 E(32554): 7e-12 Smith-Waterman score: 842; 37.0% identity (61.3% similar) in 424 aa overlap (3-398:29-389) 10 20 30 pF1KB8 MVHCAGCKRPILDRFLLNVLDRAWHVKCVQCCEC .::::.. :::.:.:.:::: :: .:..: .: CCDS13 MMQSATVPAEGAVKGLPEMLGVPMQQIPQCAGCNQHILDKFILKVLDRHWHSSCLKCADC 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB8 KCNLTEKCFSREGKLYCKNDFFRCFGTKCAGCAQGISPSDLVRRARSKVFHLNCFTCMMC . .:...:::: :..:::.:::. :::::..: ::: :...::.:.. :.::.::.:..: CCDS13 QMQLADRCFSRAGSVYCKEDFFKRFGTKCTACQQGIPPTQVVRKAQDFVYHLHCFACIIC 70 80 90 100 110 120 100 110 120 130 140 150 pF1KB8 NKQLSTGEELYIIDENKFVCKEDYLSNSSVAKENSLHSATTGSDPSLSPDSQDPSQDDAK :.::.::.:.:.......:::::: CCDS13 NRQLATGDEFYLMEDGRLVCKEDY------------------------------------ 130 140 160 170 180 190 200 210 pF1KB8 DSESANVSDKEAGSNENDDQNLGAKRRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLA :.:. .:::.. :::: ::::: :::::::: :. .:::.::.::::. CCDS13 --ETAK---------QNDDSEAGAKR--PRTTITAKQLETLKNAYKNSPKPARHVREQLS 150 160 170 180 190 220 230 240 250 260 270 pF1KB8 QETGLNMRVIQVWFQNRRSKERRMKQLSALGARRHAFFRSPRRMRPLVDRLEPGEL---- .::::.:::.::::::::.::.:.:. .: : :..: .: : . . . CCDS13 SETGLDMRVVQVWFQNRRAKEKRLKK-DAGRHRWGQFYKSVKRSRGSSKQEKESSAEDCG 200 210 220 230 240 250 280 290 300 310 pF1KB8 IPNGPFSFYGD-------YQSEYYG-----PGG---NYDFFPQGPPSSQAQ----TPVDL . .. .:: : . .. :: :: : .: .: .: . .: . CCDS13 VSDSELSFREDQILSELGHTNRIYGNVGDVTGGQLMNGSFSMDGTGQSYQDLRDGSPYGI 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 PFVPSSG---PSGTPL-GGLEHPLPGHHPSSEAQRFTDILAHP-PGDSPSPEPSLPGPLH : ::: :: .:: .::.. . .. :.:: : : . . :: CCDS13 PQSPSSISSLPSHAPLLNGLDYTVDSN---------LGIIAHAGQGVSQTLRAMAGGPTS 320 330 340 350 360 370 380 390 400 pF1KB8 SMSAEVFGPSPPFSSLSVNGGASYGNHLSHPPEMNEAAVW ..:. : : . .. .. : :. ....::: CCDS13 DIST---GSSVGYPDFPTSPG-SWLDEMDHPPF 370 380 390 >>CCDS6994.1 LHX3 gene_id:8022|Hs108|chr9 (397 aa) initn: 903 init1: 531 opt: 535 Z-score: 315.8 bits: 67.3 E(32554): 2.9e-11 Smith-Waterman score: 815; 39.5% identity (59.8% similar) in 403 aa overlap (4-400:31-358) 10 20 30 pF1KB8 MVHCAGCKRPILDRFLLNVLDRAWHVKCVQCCE :::: . :::::.:..::: :: ::..: . CCDS69 MLLETGLERDRARPGAAAVCTLGGTREIPLCAGCDQHILDRFILKALDRHWHSKCLKCSD 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB8 CKCNLTEKCFSREGKLYCKNDFFRCFGTKCAGCAQGISPSDLVRRARSKVFHLNCFTCMM :. :.:.:::: ..:::.:::. ::::::.: :: :...::::.. :.::.::.:.. CCDS69 CHTPLAERCFSRGESVYCKDDFFKRFGTKCAACQLGIPPTQVVRRAQDFVYHLHCFACVV 70 80 90 100 110 120 100 110 120 130 140 150 pF1KB8 CNKQLSTGEELYIIDENKFVCKEDYLSNSSVAKENSLHSATTGSDPSLSPDSQDPSQDDA :..::.::.:.:.......::: :: CCDS69 CKRQLATGDEFYLMEDSRLVCKADY----------------------------------- 130 140 160 170 180 190 200 210 pF1KB8 KDSESANVSDKEAGSNENDDQNLGAKRRGPRTTIKAKQLETLKAAFAATPKPTRHIREQL :.:. . :: ::: ::::: ::::::::.:. ..:::.::.:::: CCDS69 ---ETAKQREAEA----------TAKR--PRTTITAKQLETLKSAYNTSPKPARHVREQL 150 160 170 180 190 220 230 240 250 260 pF1KB8 AQETGLNMRVIQVWFQNRRSKERRMKQLSALGARRHAFFRSPRRMRPLV----DRLEPGE ..::::.:::.::::::::.::.:.:. .: : .::. .: : : .. :. CCDS69 SSETGLDMRVVQVWFQNRRAKEKRLKK-DAGRQRWGQYFRNMKRSRGGSKSDKDSVQEGQ 200 210 220 230 240 270 280 290 300 310 320 pF1KB8 LIPNGPFSFYGDYQSEYYGPGGNYDFFPQGPPSSQAQTPVDLPFVPSSGPSGTPLGGLEH .. :: . . .::. : . : :.. : :: :. .::: CCDS69 D-SDAEVSFPDEPSLAEMGPA-NGLYGSLGEPTQALGRP--------SGALGNF--SLEH 250 260 270 280 290 330 340 350 360 370 380 pF1KB8 P-LPGHHPSSEAQRFTDILAHPPGDSPSPEPSLPGPLHSMSAEVFGPSPPFSSLS-VNGG : : . : : . . :: ::. ::::: .:. :. : .::. : .: CCDS69 GGLAGPEQYREL-RPGSPYGVPP--SPAAPQSLPGPQPLLSSLVY----PDTSLGLVPSG 300 310 320 330 340 350 390 400 pF1KB8 ASYGNHLSHPPEMNEAAVW : : :: : CCDS69 APGG-----PPPMRVLAGNGPSSDLSTGSSGGYPDFPASPASWLDEVDHAQF 360 370 380 390 >>CCDS6995.1 LHX3 gene_id:8022|Hs108|chr9 (402 aa) initn: 903 init1: 531 opt: 535 Z-score: 315.7 bits: 67.3 E(32554): 2.9e-11 Smith-Waterman score: 815; 39.5% identity (59.8% similar) in 403 aa overlap (4-400:36-363) 10 20 30 pF1KB8 MVHCAGCKRPILDRFLLNVLDRAWHVKCVQCCE :::: . :::::.:..::: :: ::..: . CCDS69 ELGPARESAGGDLLLALLARRADLRREIPLCAGCDQHILDRFILKALDRHWHSKCLKCSD 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB8 CKCNLTEKCFSREGKLYCKNDFFRCFGTKCAGCAQGISPSDLVRRARSKVFHLNCFTCMM :. :.:.:::: ..:::.:::. ::::::.: :: :...::::.. :.::.::.:.. CCDS69 CHTPLAERCFSRGESVYCKDDFFKRFGTKCAACQLGIPPTQVVRRAQDFVYHLHCFACVV 70 80 90 100 110 120 100 110 120 130 140 150 pF1KB8 CNKQLSTGEELYIIDENKFVCKEDYLSNSSVAKENSLHSATTGSDPSLSPDSQDPSQDDA :..::.::.:.:.......::: :: CCDS69 CKRQLATGDEFYLMEDSRLVCKADY----------------------------------- 130 140 150 160 170 180 190 200 210 pF1KB8 KDSESANVSDKEAGSNENDDQNLGAKRRGPRTTIKAKQLETLKAAFAATPKPTRHIREQL :.:. . :: ::: ::::: ::::::::.:. ..:::.::.:::: CCDS69 ---ETAKQREAEA----------TAKR--PRTTITAKQLETLKSAYNTSPKPARHVREQL 160 170 180 190 220 230 240 250 260 pF1KB8 AQETGLNMRVIQVWFQNRRSKERRMKQLSALGARRHAFFRSPRRMRPLV----DRLEPGE ..::::.:::.::::::::.::.:.:. .: : .::. .: : : .. :. CCDS69 SSETGLDMRVVQVWFQNRRAKEKRLKK-DAGRQRWGQYFRNMKRSRGGSKSDKDSVQEGQ 200 210 220 230 240 250 270 280 290 300 310 320 pF1KB8 LIPNGPFSFYGDYQSEYYGPGGNYDFFPQGPPSSQAQTPVDLPFVPSSGPSGTPLGGLEH .. :: . . .::. : . : :.. : :: :. .::: CCDS69 D-SDAEVSFPDEPSLAEMGPA-NGLYGSLGEPTQALGRP--------SGALGNF--SLEH 260 270 280 290 300 330 340 350 360 370 380 pF1KB8 P-LPGHHPSSEAQRFTDILAHPPGDSPSPEPSLPGPLHSMSAEVFGPSPPFSSLS-VNGG : : . : : . . :: ::. ::::: .:. :. : .::. : .: CCDS69 GGLAGPEQYREL-RPGSPYGVPP--SPAAPQSLPGPQPLLSSLVY----PDTSLGLVPSG 310 320 330 340 350 390 400 pF1KB8 ASYGNHLSHPPEMNEAAVW : : :: : CCDS69 APGG-----PPPMRVLAGNGPSSDLSTGSSGGYPDFPASPASWLDEVDHAQF 360 370 380 390 400 406 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 09:58:27 2016 done: Fri Nov 4 09:58:28 2016 Total Scan time: 2.570 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]