FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB8143, 406 aa
1>>>pF1KB8143 406 - 406 aa - 406 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.8034+/-0.000925; mu= 5.4442+/- 0.057
mean_var=335.4304+/-69.146, 0's: 0 Z-trim(115.7): 132 B-trim: 0 in 0/53
Lambda= 0.070028
statistics sampled from 16179 (16318) to 16179 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.808), E-opt: 0.2 (0.501), width: 16
Scan time: 2.570
The best scores are: opt bits E(32554)
CCDS11316.1 LHX1 gene_id:3975|Hs108|chr17 ( 406) 2863 302.5 4.6e-82
CCDS9171.1 LHX5 gene_id:64211|Hs108|chr12 ( 402) 2122 227.6 1.6e-59
CCDS1338.1 LHX4 gene_id:89884|Hs108|chr1 ( 390) 555 69.3 7e-12
CCDS6994.1 LHX3 gene_id:8022|Hs108|chr9 ( 397) 535 67.3 2.9e-11
CCDS6995.1 LHX3 gene_id:8022|Hs108|chr9 ( 402) 535 67.3 2.9e-11
>>CCDS11316.1 LHX1 gene_id:3975|Hs108|chr17 (406 aa)
initn: 2863 init1: 2863 opt: 2863 Z-score: 1586.8 bits: 302.5 E(32554): 4.6e-82
Smith-Waterman score: 2863; 100.0% identity (100.0% similar) in 406 aa overlap (1-406:1-406)
10 20 30 40 50 60
pF1KB8 MVHCAGCKRPILDRFLLNVLDRAWHVKCVQCCECKCNLTEKCFSREGKLYCKNDFFRCFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MVHCAGCKRPILDRFLLNVLDRAWHVKCVQCCECKCNLTEKCFSREGKLYCKNDFFRCFG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 TKCAGCAQGISPSDLVRRARSKVFHLNCFTCMMCNKQLSTGEELYIIDENKFVCKEDYLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 TKCAGCAQGISPSDLVRRARSKVFHLNCFTCMMCNKQLSTGEELYIIDENKFVCKEDYLS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 NSSVAKENSLHSATTGSDPSLSPDSQDPSQDDAKDSESANVSDKEAGSNENDDQNLGAKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 NSSVAKENSLHSATTGSDPSLSPDSQDPSQDDAKDSESANVSDKEAGSNENDDQNLGAKR
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB8 RGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMKQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB8 LSALGARRHAFFRSPRRMRPLVDRLEPGELIPNGPFSFYGDYQSEYYGPGGNYDFFPQGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LSALGARRHAFFRSPRRMRPLVDRLEPGELIPNGPFSFYGDYQSEYYGPGGNYDFFPQGP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB8 PSSQAQTPVDLPFVPSSGPSGTPLGGLEHPLPGHHPSSEAQRFTDILAHPPGDSPSPEPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PSSQAQTPVDLPFVPSSGPSGTPLGGLEHPLPGHHPSSEAQRFTDILAHPPGDSPSPEPS
310 320 330 340 350 360
370 380 390 400
pF1KB8 LPGPLHSMSAEVFGPSPPFSSLSVNGGASYGNHLSHPPEMNEAAVW
::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LPGPLHSMSAEVFGPSPPFSSLSVNGGASYGNHLSHPPEMNEAAVW
370 380 390 400
>>CCDS9171.1 LHX5 gene_id:64211|Hs108|chr12 (402 aa)
initn: 1209 init1: 916 opt: 2122 Z-score: 1182.2 bits: 227.6 E(32554): 1.6e-59
Smith-Waterman score: 2122; 74.6% identity (90.0% similar) in 409 aa overlap (1-406:2-402)
10 20 30 40 50
pF1KB8 MVHCAGCKRPILDRFLLNVLDRAWHVKCVQCCECKCNLTEKCFSREGKLYCKNDFFRCF
:::::::.:::::::::::::::::.::::::::: ::.:::::::::::::::::: :
CCDS91 MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCECKTNLSEKCFSREGKLYCKNDFFRRF
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB8 GTKCAGCAQGISPSDLVRRARSKVFHLNCFTCMMCNKQLSTGEELYIIDENKFVCKEDYL
::::::::::::::::::.::::::::::::::.::::::::::::.:::::::::.:::
CCDS91 GTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMVCNKQLSTGEELYVIDENKFVCKDDYL
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB8 SNSSVAKENSLHSATTGSDPSLSPDSQDPSQDDAKDSESANVSDKEAGSNENDDQNLGAK
:.::. ::.::.:... .: ::::: :: ::: :...... ::::...:::..:: :.:
CCDS91 SSSSL-KEGSLNSVSSCTDRSLSPDLQDALQDDPKETDNSTSSDKETANNENEEQNSGTK
130 140 150 160 170
180 190 200 210 220 230
pF1KB8 RRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 RRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMK
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB8 QLSALGARRHAFFRSPRRMRPLVDRLEPGELIPNGPFSFYGDYQSEYYGPGGNYDFFPQG
:::::::::::::::::::::: ::. .:.. . :...:::::..::.::.::::: .:
CCDS91 QLSALGARRHAFFRSPRRMRPLGGRLDESEMLGSTPYTYYGDYQGDYYAPGSNYDFFAHG
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB8 PPSSQAQTPVDLPFVPSSGPSGTPLGGLEHPLPGHHPSSEAQRFTDILAHPPGDSPSPEP
::: :::.:.: :. .:::..::::.:: :: : : ... ::::...:: :.:::::
CCDS91 PPS-QAQSPADSSFLAASGPGSTPLGALEPPLAGPH-AADNPRFTDMISHP--DTPSPEP
300 310 320 330 340 350
360 370 380 390 400
pF1KB8 SLPGPLHSMSAEVF--GPSPPFSSLSVNGGASYGNHLSHP-PEMNEAAVW
.::: :: : .::: :::::: ..: ..:.. :::: ::.::::::
CCDS91 GLPGTLHPMPGEVFSGGPSPPFP---MSGTSGYSGPLSHPNPELNEAAVW
360 370 380 390 400
>>CCDS1338.1 LHX4 gene_id:89884|Hs108|chr1 (390 aa)
initn: 924 init1: 553 opt: 555 Z-score: 326.8 bits: 69.3 E(32554): 7e-12
Smith-Waterman score: 842; 37.0% identity (61.3% similar) in 424 aa overlap (3-398:29-389)
10 20 30
pF1KB8 MVHCAGCKRPILDRFLLNVLDRAWHVKCVQCCEC
.::::.. :::.:.:.:::: :: .:..: .:
CCDS13 MMQSATVPAEGAVKGLPEMLGVPMQQIPQCAGCNQHILDKFILKVLDRHWHSSCLKCADC
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB8 KCNLTEKCFSREGKLYCKNDFFRCFGTKCAGCAQGISPSDLVRRARSKVFHLNCFTCMMC
. .:...:::: :..:::.:::. :::::..: ::: :...::.:.. :.::.::.:..:
CCDS13 QMQLADRCFSRAGSVYCKEDFFKRFGTKCTACQQGIPPTQVVRKAQDFVYHLHCFACIIC
70 80 90 100 110 120
100 110 120 130 140 150
pF1KB8 NKQLSTGEELYIIDENKFVCKEDYLSNSSVAKENSLHSATTGSDPSLSPDSQDPSQDDAK
:.::.::.:.:.......::::::
CCDS13 NRQLATGDEFYLMEDGRLVCKEDY------------------------------------
130 140
160 170 180 190 200 210
pF1KB8 DSESANVSDKEAGSNENDDQNLGAKRRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLA
:.:. .:::.. :::: ::::: :::::::: :. .:::.::.::::.
CCDS13 --ETAK---------QNDDSEAGAKR--PRTTITAKQLETLKNAYKNSPKPARHVREQLS
150 160 170 180 190
220 230 240 250 260 270
pF1KB8 QETGLNMRVIQVWFQNRRSKERRMKQLSALGARRHAFFRSPRRMRPLVDRLEPGEL----
.::::.:::.::::::::.::.:.:. .: : :..: .: : . . .
CCDS13 SETGLDMRVVQVWFQNRRAKEKRLKK-DAGRHRWGQFYKSVKRSRGSSKQEKESSAEDCG
200 210 220 230 240 250
280 290 300 310
pF1KB8 IPNGPFSFYGD-------YQSEYYG-----PGG---NYDFFPQGPPSSQAQ----TPVDL
. .. .:: : . .. :: :: : .: .: .: . .: .
CCDS13 VSDSELSFREDQILSELGHTNRIYGNVGDVTGGQLMNGSFSMDGTGQSYQDLRDGSPYGI
260 270 280 290 300 310
320 330 340 350 360
pF1KB8 PFVPSSG---PSGTPL-GGLEHPLPGHHPSSEAQRFTDILAHP-PGDSPSPEPSLPGPLH
: ::: :: .:: .::.. . .. :.:: : : . . ::
CCDS13 PQSPSSISSLPSHAPLLNGLDYTVDSN---------LGIIAHAGQGVSQTLRAMAGGPTS
320 330 340 350 360
370 380 390 400
pF1KB8 SMSAEVFGPSPPFSSLSVNGGASYGNHLSHPPEMNEAAVW
..:. : : . .. .. : :. ....:::
CCDS13 DIST---GSSVGYPDFPTSPG-SWLDEMDHPPF
370 380 390
>>CCDS6994.1 LHX3 gene_id:8022|Hs108|chr9 (397 aa)
initn: 903 init1: 531 opt: 535 Z-score: 315.8 bits: 67.3 E(32554): 2.9e-11
Smith-Waterman score: 815; 39.5% identity (59.8% similar) in 403 aa overlap (4-400:31-358)
10 20 30
pF1KB8 MVHCAGCKRPILDRFLLNVLDRAWHVKCVQCCE
:::: . :::::.:..::: :: ::..: .
CCDS69 MLLETGLERDRARPGAAAVCTLGGTREIPLCAGCDQHILDRFILKALDRHWHSKCLKCSD
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB8 CKCNLTEKCFSREGKLYCKNDFFRCFGTKCAGCAQGISPSDLVRRARSKVFHLNCFTCMM
:. :.:.:::: ..:::.:::. ::::::.: :: :...::::.. :.::.::.:..
CCDS69 CHTPLAERCFSRGESVYCKDDFFKRFGTKCAACQLGIPPTQVVRRAQDFVYHLHCFACVV
70 80 90 100 110 120
100 110 120 130 140 150
pF1KB8 CNKQLSTGEELYIIDENKFVCKEDYLSNSSVAKENSLHSATTGSDPSLSPDSQDPSQDDA
:..::.::.:.:.......::: ::
CCDS69 CKRQLATGDEFYLMEDSRLVCKADY-----------------------------------
130 140
160 170 180 190 200 210
pF1KB8 KDSESANVSDKEAGSNENDDQNLGAKRRGPRTTIKAKQLETLKAAFAATPKPTRHIREQL
:.:. . :: ::: ::::: ::::::::.:. ..:::.::.::::
CCDS69 ---ETAKQREAEA----------TAKR--PRTTITAKQLETLKSAYNTSPKPARHVREQL
150 160 170 180 190
220 230 240 250 260
pF1KB8 AQETGLNMRVIQVWFQNRRSKERRMKQLSALGARRHAFFRSPRRMRPLV----DRLEPGE
..::::.:::.::::::::.::.:.:. .: : .::. .: : : .. :.
CCDS69 SSETGLDMRVVQVWFQNRRAKEKRLKK-DAGRQRWGQYFRNMKRSRGGSKSDKDSVQEGQ
200 210 220 230 240
270 280 290 300 310 320
pF1KB8 LIPNGPFSFYGDYQSEYYGPGGNYDFFPQGPPSSQAQTPVDLPFVPSSGPSGTPLGGLEH
.. :: . . .::. : . : :.. : :: :. .:::
CCDS69 D-SDAEVSFPDEPSLAEMGPA-NGLYGSLGEPTQALGRP--------SGALGNF--SLEH
250 260 270 280 290
330 340 350 360 370 380
pF1KB8 P-LPGHHPSSEAQRFTDILAHPPGDSPSPEPSLPGPLHSMSAEVFGPSPPFSSLS-VNGG
: : . : : . . :: ::. ::::: .:. :. : .::. : .:
CCDS69 GGLAGPEQYREL-RPGSPYGVPP--SPAAPQSLPGPQPLLSSLVY----PDTSLGLVPSG
300 310 320 330 340 350
390 400
pF1KB8 ASYGNHLSHPPEMNEAAVW
: : :: :
CCDS69 APGG-----PPPMRVLAGNGPSSDLSTGSSGGYPDFPASPASWLDEVDHAQF
360 370 380 390
>>CCDS6995.1 LHX3 gene_id:8022|Hs108|chr9 (402 aa)
initn: 903 init1: 531 opt: 535 Z-score: 315.7 bits: 67.3 E(32554): 2.9e-11
Smith-Waterman score: 815; 39.5% identity (59.8% similar) in 403 aa overlap (4-400:36-363)
10 20 30
pF1KB8 MVHCAGCKRPILDRFLLNVLDRAWHVKCVQCCE
:::: . :::::.:..::: :: ::..: .
CCDS69 ELGPARESAGGDLLLALLARRADLRREIPLCAGCDQHILDRFILKALDRHWHSKCLKCSD
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB8 CKCNLTEKCFSREGKLYCKNDFFRCFGTKCAGCAQGISPSDLVRRARSKVFHLNCFTCMM
:. :.:.:::: ..:::.:::. ::::::.: :: :...::::.. :.::.::.:..
CCDS69 CHTPLAERCFSRGESVYCKDDFFKRFGTKCAACQLGIPPTQVVRRAQDFVYHLHCFACVV
70 80 90 100 110 120
100 110 120 130 140 150
pF1KB8 CNKQLSTGEELYIIDENKFVCKEDYLSNSSVAKENSLHSATTGSDPSLSPDSQDPSQDDA
:..::.::.:.:.......::: ::
CCDS69 CKRQLATGDEFYLMEDSRLVCKADY-----------------------------------
130 140 150
160 170 180 190 200 210
pF1KB8 KDSESANVSDKEAGSNENDDQNLGAKRRGPRTTIKAKQLETLKAAFAATPKPTRHIREQL
:.:. . :: ::: ::::: ::::::::.:. ..:::.::.::::
CCDS69 ---ETAKQREAEA----------TAKR--PRTTITAKQLETLKSAYNTSPKPARHVREQL
160 170 180 190
220 230 240 250 260
pF1KB8 AQETGLNMRVIQVWFQNRRSKERRMKQLSALGARRHAFFRSPRRMRPLV----DRLEPGE
..::::.:::.::::::::.::.:.:. .: : .::. .: : : .. :.
CCDS69 SSETGLDMRVVQVWFQNRRAKEKRLKK-DAGRQRWGQYFRNMKRSRGGSKSDKDSVQEGQ
200 210 220 230 240 250
270 280 290 300 310 320
pF1KB8 LIPNGPFSFYGDYQSEYYGPGGNYDFFPQGPPSSQAQTPVDLPFVPSSGPSGTPLGGLEH
.. :: . . .::. : . : :.. : :: :. .:::
CCDS69 D-SDAEVSFPDEPSLAEMGPA-NGLYGSLGEPTQALGRP--------SGALGNF--SLEH
260 270 280 290 300
330 340 350 360 370 380
pF1KB8 P-LPGHHPSSEAQRFTDILAHPPGDSPSPEPSLPGPLHSMSAEVFGPSPPFSSLS-VNGG
: : . : : . . :: ::. ::::: .:. :. : .::. : .:
CCDS69 GGLAGPEQYREL-RPGSPYGVPP--SPAAPQSLPGPQPLLSSLVY----PDTSLGLVPSG
310 320 330 340 350
390 400
pF1KB8 ASYGNHLSHPPEMNEAAVW
: : :: :
CCDS69 APGG-----PPPMRVLAGNGPSSDLSTGSSGGYPDFPASPASWLDEVDHAQF
360 370 380 390 400
406 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 09:58:27 2016 done: Fri Nov 4 09:58:28 2016
Total Scan time: 2.570 Total Display time: 0.020
Function used was FASTA [36.3.4 Apr, 2011]