FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7668, 402 aa 1>>>pF1KB7668 402 - 402 aa - 402 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.6325+/-0.00105; mu= 0.4627+/- 0.064 mean_var=344.4001+/-71.518, 0's: 0 Z-trim(115.1): 140 B-trim: 550 in 1/50 Lambda= 0.069110 statistics sampled from 15529 (15676) to 15529 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.8), E-opt: 0.2 (0.482), width: 16 Scan time: 3.520 The best scores are: opt bits E(32554) CCDS9171.1 LHX5 gene_id:64211|Hs108|chr12 ( 402) 2808 293.4 2.6e-79 CCDS11316.1 LHX1 gene_id:3975|Hs108|chr17 ( 406) 2122 225.0 1e-58 CCDS1338.1 LHX4 gene_id:89884|Hs108|chr1 ( 390) 608 74.0 2.7e-13 CCDS6994.1 LHX3 gene_id:8022|Hs108|chr9 ( 397) 556 68.8 1e-11 CCDS6995.1 LHX3 gene_id:8022|Hs108|chr9 ( 402) 556 68.8 1e-11 >>CCDS9171.1 LHX5 gene_id:64211|Hs108|chr12 (402 aa) initn: 2808 init1: 2808 opt: 2808 Z-score: 1537.4 bits: 293.4 E(32554): 2.6e-79 Smith-Waterman score: 2808; 100.0% identity (100.0% similar) in 402 aa overlap (1-402:1-402) 10 20 30 40 50 60 pF1KB7 MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCECKTNLSEKCFSREGKLYCKNDFFRRF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS91 MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCECKTNLSEKCFSREGKLYCKNDFFRRF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 GTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMVCNKQLSTGEELYVIDENKFVCKDDYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS91 GTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMVCNKQLSTGEELYVIDENKFVCKDDYL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 SSSSLKEGSLNSVSSCTDRSLSPDLQDALQDDPKETDNSTSSDKETANNENEEQNSGTKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS91 SSSSLKEGSLNSVSSCTDRSLSPDLQDALQDDPKETDNSTSSDKETANNENEEQNSGTKR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 RGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS91 RGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMKQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 LSALGARRHAFFRSPRRMRPLGGRLDESEMLGSTPYTYYGDYQGDYYAPGSNYDFFAHGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS91 LSALGARRHAFFRSPRRMRPLGGRLDESEMLGSTPYTYYGDYQGDYYAPGSNYDFFAHGP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 PSQAQSPADSSFLAASGPGSTPLGALEPPLAGPHAADNPRFTDMISHPDTPSPEPGLPGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS91 PSQAQSPADSSFLAASGPGSTPLGALEPPLAGPHAADNPRFTDMISHPDTPSPEPGLPGT 310 320 330 340 350 360 370 380 390 400 pF1KB7 LHPMPGEVFSGGPSPPFPMSGTSGYSGPLSHPNPELNEAAVW :::::::::::::::::::::::::::::::::::::::::: CCDS91 LHPMPGEVFSGGPSPPFPMSGTSGYSGPLSHPNPELNEAAVW 370 380 390 400 >>CCDS11316.1 LHX1 gene_id:3975|Hs108|chr17 (406 aa) initn: 1209 init1: 916 opt: 2122 Z-score: 1167.7 bits: 225.0 E(32554): 1e-58 Smith-Waterman score: 2122; 74.6% identity (90.0% similar) in 409 aa overlap (2-402:1-406) 10 20 30 40 50 60 pF1KB7 MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCECKTNLSEKCFSREGKLYCKNDFFRRF :::::::.:::::::::::::::::.::::::::: ::.:::::::::::::::::: : CCDS11 MVHCAGCKRPILDRFLLNVLDRAWHVKCVQCCECKCNLTEKCFSREGKLYCKNDFFRCF 10 20 30 40 50 70 80 90 100 110 120 pF1KB7 GTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMVCNKQLSTGEELYVIDENKFVCKDDYL ::::::::::::::::::.::::::::::::::.::::::::::::.:::::::::.::: CCDS11 GTKCAGCAQGISPSDLVRRARSKVFHLNCFTCMMCNKQLSTGEELYIIDENKFVCKEDYL 60 70 80 90 100 110 130 140 150 160 170 pF1KB7 SSSSL-KEGSLNSVSSCTDRSLSPDLQDALQDDPKETDNSTSSDKETANNENEEQNSGTK :.::. ::.::.:... .: ::::: :: ::: :...... ::::...:::..:: :.: CCDS11 SNSSVAKENSLHSATTGSDPSLSPDSQDPSQDDAKDSESANVSDKEAGSNENDDQNLGAK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB7 RRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB7 QLSALGARRHAFFRSPRRMRPLGGRLDESEMLGSTPYTYYGDYQGDYYAPGSNYDFFAHG :::::::::::::::::::::: ::. .:.. . :...:::::..::.::.::::: .: CCDS11 QLSALGARRHAFFRSPRRMRPLVDRLEPGELIPNGPFSFYGDYQSEYYGPGGNYDFFPQG 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB7 PPS-QAQSPADSSFLAASGPGSTPLGALEPPLAGPH-AADNPRFTDMISHP--DTPSPEP ::: :::.:.: :. .:::..::::.:: :: : : ... ::::...:: :.::::: CCDS11 PPSSQAQTPVDLPFVPSSGPSGTPLGGLEHPLPGHHPSSEAQRFTDILAHPPGDSPSPEP 300 310 320 330 340 350 360 370 380 390 400 pF1KB7 GLPGTLHPMPGEVFSGGPSPPFP---MSGTSGYSGPLSHPNPELNEAAVW .::: :: : .::: :::::: ..: ..:.. :::: ::.:::::: CCDS11 SLPGPLHSMSAEVF--GPSPPFSSLSVNGGASYGNHLSHP-PEMNEAAVW 360 370 380 390 400 >>CCDS1338.1 LHX4 gene_id:89884|Hs108|chr1 (390 aa) initn: 891 init1: 565 opt: 608 Z-score: 352.1 bits: 74.0 E(32554): 2.7e-13 Smith-Waterman score: 836; 37.1% identity (61.0% similar) in 420 aa overlap (4-398:29-384) 10 20 30 pF1KB7 MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCEC .::::.. :::.:.:.:::: :: .:..: .: CCDS13 MMQSATVPAEGAVKGLPEMLGVPMQQIPQCAGCNQHILDKFILKVLDRHWHSSCLKCADC 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB7 KTNLSEKCFSREGKLYCKNDFFRRFGTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMVC . .:...:::: :..:::.:::.::::::..: ::: :...::::.. :.::.::.:..: CCDS13 QMQLADRCFSRAGSVYCKEDFFKRFGTKCTACQQGIPPTQVVRKAQDFVYHLHCFACIIC 70 80 90 100 110 120 100 110 120 130 140 150 pF1KB7 NKQLSTGEELYVIDENKFVCKDDYLSSSSLKEGSLNSVSSCTDRSLSPDLQDALQDDPKE :.::.::.:.:.......:::.:: CCDS13 NRQLATGDEFYLMEDGRLVCKEDY------------------------------------ 130 140 160 170 180 190 200 210 pF1KB7 TDNSTSSDKETANNENEEQNSGTKRRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQ :::. .:.....:.:: ::::: :::::::: :. .:::.::.::::.. CCDS13 ---------ETAK-QNDDSEAGAKR--PRTTITAKQLETLKNAYKNSPKPARHVREQLSS 150 160 170 180 190 220 230 240 250 260 pF1KB7 ETGLNMRVIQVWFQNRRSKERRMKQLSALGARRHAFFRSPRRMRPLGGR----------L ::::.:::.::::::::.::.:.:. .: : :..: .: : . . . CCDS13 ETGLDMRVVQVWFQNRRAKEKRLKK-DAGRHRWGQFYKSVKRSRGSSKQEKESSAEDCGV 200 210 220 230 240 250 270 280 290 300 310 pF1KB7 DESEM----------LGSTPYTY--YGDYQGDYYAPGSNYDFFAHGPPSQAQSPADSS-F ..::. :: : : :: : :: : : .. :. :.: . CCDS13 SDSELSFREDQILSELGHTNRIYGNVGDVTGGQLMNGS---FSMDGTGQSYQDLRDGSPY 260 270 280 290 300 320 330 340 350 360 370 pF1KB7 LAASGPGS-TPLGALEPPLAG-PHAADNPRFTDMISHPDTPSPEPGLPGTLHPMPGEVFS ..:.: . : . : : : ...:. .:.: :. ::. : . CCDS13 GIPQSPSSISSLPSHAPLLNGLDYTVDSN--LGIIAHAG-----QGVSQTLRAM-----A 310 320 330 340 350 380 390 400 pF1KB7 GGPSPPFPMSGTSGYSGPLSHPNPELNEAAVW :::. . ... :: . :. :.: CCDS13 GGPTSDISTGSSVGYPDFPTSPGSWLDEMDHPPF 360 370 380 390 >>CCDS6994.1 LHX3 gene_id:8022|Hs108|chr9 (397 aa) initn: 934 init1: 549 opt: 556 Z-score: 324.0 bits: 68.8 E(32554): 1e-11 Smith-Waterman score: 862; 38.7% identity (61.3% similar) in 419 aa overlap (5-398:31-391) 10 20 30 pF1KB7 MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCE ::::.. :::::.:..::: :: ::..: . CCDS69 MLLETGLERDRARPGAAAVCTLGGTREIPLCAGCDQHILDRFILKALDRHWHSKCLKCSD 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB7 CKTNLSEKCFSREGKLYCKNDFFRRFGTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMV :.: :.:.:::: ..:::.:::.:::::::.: :: :...::.:.. :.::.::.:.: CCDS69 CHTPLAERCFSRGESVYCKDDFFKRFGTKCAACQLGIPPTQVVRRAQDFVYHLHCFACVV 70 80 90 100 110 120 100 110 120 130 140 150 pF1KB7 CNKQLSTGEELYVIDENKFVCKDDYLSSSSLKEGSLNSVSSCTDRSLSPDLQDALQDDPK :..::.::.:.:.......::: :: CCDS69 CKRQLATGDEFYLMEDSRLVCKADY----------------------------------- 130 140 160 170 180 190 200 210 pF1KB7 ETDNSTSSDKETANNENEEQNSGTKRRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLA :::.... : .: .: ::::: ::::::::.:. ..:::.::.::::. CCDS69 ----------ETAKQREAE---ATAKR-PRTTITAKQLETLKSAYNTSPKPARHVREQLS 150 160 170 180 190 220 230 240 250 260 270 pF1KB7 QETGLNMRVIQVWFQNRRSKERRMKQLSALGARRHAFFRSPRRMRPLGGRLDES---EML .::::.:::.::::::::.::.:.:. .: : .::. .: : :.. :.. : CCDS69 SETGLDMRVVQVWFQNRRAKEKRLKK-DAGRQRWGQYFRNMKRSRG-GSKSDKDSVQEGQ 200 210 220 230 240 280 290 300 310 pF1KB7 GSTPYTYYGDYQGDYYAPGSNYDFFAHGPPSQA---QSPADSSFLAASG----------- : . . : . .: . . : :.:: : : ..: : CCDS69 DSDAEVSFPDEPSLAEMGPANGLYGSLGEPTQALGRPSGALGNFSLEHGGLAGPEQYREL 250 260 270 280 290 300 320 330 340 350 360 370 pF1KB7 -PGSTPLGALEPPLAGPHAADNPR-FTDMISHPDT-----PSPEPGLPGTLHPMPGEVFS ::: : : . : :.:.. .:. . . . .::: :: :: : : : .:.. CCDS69 RPGS-PYG-VPPSPAAPQSLPGPQPLLSSLVYPDTSLGLVPSGAPGGP----P-PMRVLA 310 320 330 340 350 360 380 390 400 pF1KB7 G-GPSPPFPMSGTSGYSGPLSHPNPELNEAAVW : ::: . ....:: . : :.: CCDS69 GNGPSSDLSTGSSGGYPDFPASPASWLDEVDHAQF 370 380 390 >>CCDS6995.1 LHX3 gene_id:8022|Hs108|chr9 (402 aa) initn: 934 init1: 549 opt: 556 Z-score: 323.9 bits: 68.8 E(32554): 1e-11 Smith-Waterman score: 862; 38.7% identity (61.3% similar) in 419 aa overlap (5-398:36-396) 10 20 30 pF1KB7 MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCE ::::.. :::::.:..::: :: ::..: . CCDS69 ELGPARESAGGDLLLALLARRADLRREIPLCAGCDQHILDRFILKALDRHWHSKCLKCSD 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB7 CKTNLSEKCFSREGKLYCKNDFFRRFGTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMV :.: :.:.:::: ..:::.:::.:::::::.: :: :...::.:.. :.::.::.:.: CCDS69 CHTPLAERCFSRGESVYCKDDFFKRFGTKCAACQLGIPPTQVVRRAQDFVYHLHCFACVV 70 80 90 100 110 120 100 110 120 130 140 150 pF1KB7 CNKQLSTGEELYVIDENKFVCKDDYLSSSSLKEGSLNSVSSCTDRSLSPDLQDALQDDPK :..::.::.:.:.......::: :: CCDS69 CKRQLATGDEFYLMEDSRLVCKADY----------------------------------- 130 140 150 160 170 180 190 200 210 pF1KB7 ETDNSTSSDKETANNENEEQNSGTKRRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLA :::.... : .: .: ::::: ::::::::.:. ..:::.::.::::. CCDS69 ----------ETAKQREAE---ATAKR-PRTTITAKQLETLKSAYNTSPKPARHVREQLS 160 170 180 190 220 230 240 250 260 270 pF1KB7 QETGLNMRVIQVWFQNRRSKERRMKQLSALGARRHAFFRSPRRMRPLGGRLDES---EML .::::.:::.::::::::.::.:.:. .: : .::. .: : :.. :.. : CCDS69 SETGLDMRVVQVWFQNRRAKEKRLKK-DAGRQRWGQYFRNMKRSRG-GSKSDKDSVQEGQ 200 210 220 230 240 250 280 290 300 310 pF1KB7 GSTPYTYYGDYQGDYYAPGSNYDFFAHGPPSQA---QSPADSSFLAASG----------- : . . : . .: . . : :.:: : : ..: : CCDS69 DSDAEVSFPDEPSLAEMGPANGLYGSLGEPTQALGRPSGALGNFSLEHGGLAGPEQYREL 260 270 280 290 300 310 320 330 340 350 360 370 pF1KB7 -PGSTPLGALEPPLAGPHAADNPR-FTDMISHPDT-----PSPEPGLPGTLHPMPGEVFS ::: : : . : :.:.. .:. . . . .::: :: :: : : : .:.. CCDS69 RPGS-PYG-VPPSPAAPQSLPGPQPLLSSLVYPDTSLGLVPSGAPGGP----P-PMRVLA 320 330 340 350 360 380 390 400 pF1KB7 G-GPSPPFPMSGTSGYSGPLSHPNPELNEAAVW : ::: . ....:: . : :.: CCDS69 GNGPSSDLSTGSSGGYPDFPASPASWLDEVDHAQF 370 380 390 400 402 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 04:05:34 2016 done: Sat Nov 5 04:05:35 2016 Total Scan time: 3.520 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]