FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7611, 302 aa 1>>>pF1KB7611 302 - 302 aa - 302 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.9189+/-0.000867; mu= 1.8630+/- 0.053 mean_var=274.5364+/-57.084, 0's: 0 Z-trim(116.8): 172 B-trim: 960 in 1/50 Lambda= 0.077406 statistics sampled from 17257 (17449) to 17257 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.831), E-opt: 0.2 (0.536), width: 16 Scan time: 2.470 The best scores are: opt bits E(32554) CCDS7532.1 PITX3 gene_id:5309|Hs108|chr10 ( 302) 2058 242.1 3.8e-64 CCDS3693.1 PITX2 gene_id:5308|Hs108|chr4 ( 271) 1011 125.2 5.6e-29 CCDS3692.1 PITX2 gene_id:5308|Hs108|chr4 ( 317) 1010 125.1 6.7e-29 CCDS3694.1 PITX2 gene_id:5308|Hs108|chr4 ( 324) 1008 124.9 8e-29 CCDS4182.1 PITX1 gene_id:5307|Hs108|chr5 ( 314) 801 101.8 7.1e-22 >>CCDS7532.1 PITX3 gene_id:5309|Hs108|chr10 (302 aa) initn: 2058 init1: 2058 opt: 2058 Z-score: 1265.1 bits: 242.1 E(32554): 3.8e-64 Smith-Waterman score: 2058; 100.0% identity (100.0% similar) in 302 aa overlap (1-302:1-302) 10 20 30 40 50 60 pF1KB7 MEFGLLSEAEARSPALSLSDAGTPHPQLPEHGCKGQEHSDSEKASASLPGGSPEDGSLKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 MEFGLLSEAEARSPALSLSDAGTPHPQLPEHGCKGQEHSDSEKASASLPGGSPEDGSLKK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 KQRRQRTHFTSQQLQELEATFQRNRYPDMSTREEIAVWTNLTEARVRVWFKNRRAKWRKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 KQRRQRTHFTSQQLQELEATFQRNRYPDMSTREEIAVWTNLTEARVRVWFKNRRAKWRKR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 ERSQQAELCKGSFAAPLGGLVPPYEEVYPGYSYGNWPPKALAPPLAAKTFPFAFNSVNVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 ERSQQAELCKGSFAAPLGGLVPPYEEVYPGYSYGNWPPKALAPPLAAKTFPFAFNSVNVG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 PLASQPVFSPPSSIAASMVPSAAAAPGTVPGPGALQGLGGGPPGLAPAAVSSGAVSCPYA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 PLASQPVFSPPSSIAASMVPSAAAAPGTVPGPGALQGLGGGPPGLAPAAVSSGAVSCPYA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 SAAAAAAAAASSPYVYRDPCNSSLASLRLKAKQHASFSYPAVHGPPPAANLSPCQYAVER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 SAAAAAAAAASSPYVYRDPCNSSLASLRLKAKQHASFSYPAVHGPPPAANLSPCQYAVER 250 260 270 280 290 300 pF1KB7 PV :: CCDS75 PV >>CCDS3693.1 PITX2 gene_id:5308|Hs108|chr4 (271 aa) initn: 1012 init1: 712 opt: 1011 Z-score: 633.8 bits: 125.2 E(32554): 5.6e-29 Smith-Waterman score: 1011; 61.0% identity (79.8% similar) in 277 aa overlap (33-302:12-271) 10 20 30 40 50 60 pF1KB7 FGLLSEAEARSPALSLSDAGTPHPQLPEHGCKGQEHSDSEKASASLPGGSPEDGSLKKKQ : :.. :.... :. :: : ::.: CCDS36 METNCRKLVSACVQLEKDKSQQGKNEDVGA--EDPSKKKRQ 10 20 30 70 80 90 100 110 120 pF1KB7 RRQRTHFTSQQLQELEATFQRNRYPDMSTREEIAVWTNLTEARVRVWFKNRRAKWRKRER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS36 RRQRTHFTSQQLQELEATFQRNRYPDMSTREEIAVWTNLTEARVRVWFKNRRAKWRKRER 40 50 60 70 80 90 130 140 150 160 170 180 pF1KB7 SQQAELCKGSFAAPLGGLVPPYEEVYPGYSYGNWPPKAL-APPLAAKTFPFAFNSVNVGP .:::::::..:. ..::. ::...::::::.:: :.: . :..:.::: :::.::.: CCDS36 NQQAELCKNGFGPQFNGLMQPYDDMYPGYSYNNWAAKGLTSASLSTKSFPF-FNSMNVNP 100 110 120 130 140 150 190 200 210 220 230 pF1KB7 LASQPVFSPPSSIAASMVPSAAAAPGTVPG-PGA-LQGLGG----GPPGLAPAAVSSGAV :.:: .::::.::. :: :.. .:..: : ::. :..:.. . :.: .:: . : CCDS36 LSSQSMFSPPNSIS-SMSMSSSMVPSAVTGVPGSSLNSLNNLNNLSSPSLN-SAVPTPA- 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB7 SCPYASAAAAAAAAASSPYVYRDPCNSSLASLRLKAKQHASFSYPAVHGPPPAANLSPCQ :::: . :::::: :::::::::::::::.::.: .:..: :.::: :: CCDS36 -CPYAPP--------TPPYVYRDTCNSSLASLRLKAKQHSSFGYASVQNP--ASNLSACQ 220 230 240 250 260 300 pF1KB7 YAVERPV :::.::: CCDS36 YAVDRPV 270 >>CCDS3692.1 PITX2 gene_id:5308|Hs108|chr4 (317 aa) initn: 1012 init1: 712 opt: 1010 Z-score: 632.3 bits: 125.1 E(32554): 6.7e-29 Smith-Waterman score: 1010; 61.1% identity (80.4% similar) in 275 aa overlap (35-302:59-317) 10 20 30 40 50 60 pF1KB7 LLSEAEARSPALSLSDAGTPHPQLPEHGCKGQEHSDSEKASASLPGGSPEDGSLKKKQRR : ...:. . . . :. :: : ::.::: CCDS36 DSEIKKVEFTDSPESRKEAASSKFFPRQHPGANEKDKSQQGKNEDVGA-EDPSKKKRQRR 30 40 50 60 70 80 70 80 90 100 110 120 pF1KB7 QRTHFTSQQLQELEATFQRNRYPDMSTREEIAVWTNLTEARVRVWFKNRRAKWRKRERSQ ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::.: CCDS36 QRTHFTSQQLQELEATFQRNRYPDMSTREEIAVWTNLTEARVRVWFKNRRAKWRKRERNQ 90 100 110 120 130 140 130 140 150 160 170 180 pF1KB7 QAELCKGSFAAPLGGLVPPYEEVYPGYSYGNWPPKAL-APPLAAKTFPFAFNSVNVGPLA ::::::..:. ..::. ::...::::::.:: :.: . :..:.::: :::.::.::. CCDS36 QAELCKNGFGPQFNGLMQPYDDMYPGYSYNNWAAKGLTSASLSTKSFPF-FNSMNVNPLS 150 160 170 180 190 200 190 200 210 220 230 pF1KB7 SQPVFSPPSSIAASMVPSAAAAPGTVPG-PGA-LQGLGG----GPPGLAPAAVSSGAVSC :: .::::.::. :: :.. .:..: : ::. :..:.. . :.: .:: . : : CCDS36 SQSMFSPPNSIS-SMSMSSSMVPSAVTGVPGSSLNSLNNLNNLSSPSLN-SAVPTPA--C 210 220 230 240 250 260 240 250 260 270 280 290 pF1KB7 PYASAAAAAAAAASSPYVYRDPCNSSLASLRLKAKQHASFSYPAVHGPPPAANLSPCQYA ::: . :::::: :::::::::::::::.::.: .:..: :.::: :::: CCDS36 PYAPP--------TPPYVYRDTCNSSLASLRLKAKQHSSFGYASVQNP--ASNLSACQYA 270 280 290 300 310 300 pF1KB7 VERPV :.::: CCDS36 VDRPV >>CCDS3694.1 PITX2 gene_id:5308|Hs108|chr4 (324 aa) initn: 932 init1: 712 opt: 1008 Z-score: 631.0 bits: 124.9 E(32554): 8e-29 Smith-Waterman score: 1013; 56.9% identity (77.6% similar) in 304 aa overlap (6-302:47-324) 10 20 30 pF1KB7 MEFGLLSEAEARSPALSLSDAGTPHPQLPEHGCKG :. .. : . ..::...:. ... .: CCDS36 TKLSAVSSSSCHHPQPLAMASVLAPGQPRSLDSSKHRLEVHTISDTSSPEAAEKDKSQQG 20 30 40 50 60 70 40 50 60 70 80 90 pF1KB7 QEHSDSEKASASLPGGSPEDGSLKKKQRRQRTHFTSQQLQELEATFQRNRYPDMSTREEI . .: ..: :: : ::.:::::::::::::::::::::::::::::::::: CCDS36 K----NEDVGA-------EDPSKKKRQRRQRTHFTSQQLQELEATFQRNRYPDMSTREEI 80 90 100 110 120 100 110 120 130 140 150 pF1KB7 AVWTNLTEARVRVWFKNRRAKWRKRERSQQAELCKGSFAAPLGGLVPPYEEVYPGYSYGN :::::::::::::::::::::::::::.:::::::..:. ..::. ::...::::::.: CCDS36 AVWTNLTEARVRVWFKNRRAKWRKRERNQQAELCKNGFGPQFNGLMQPYDDMYPGYSYNN 130 140 150 160 170 180 160 170 180 190 200 210 pF1KB7 WPPKAL-APPLAAKTFPFAFNSVNVGPLASQPVFSPPSSIAASMVPSAAAAPGTVPG-PG : :.: . :..:.::: :::.::.::.:: .::::.::. :: :.. .:..: : :: CCDS36 WAAKGLTSASLSTKSFPF-FNSMNVNPLSSQSMFSPPNSIS-SMSMSSSMVPSAVTGVPG 190 200 210 220 230 240 220 230 240 250 260 pF1KB7 A-LQGLGG----GPPGLAPAAVSSGAVSCPYASAAAAAAAAASSPYVYRDPCNSSLASLR . :..:.. . :.: .:: . : :::: . :::::: ::::::::: CCDS36 SSLNSLNNLNNLSSPSLN-SAVPTPA--CPYAPP--------TPPYVYRDTCNSSLASLR 250 260 270 280 290 270 280 290 300 pF1KB7 LKAKQHASFSYPAVHGPPPAANLSPCQYAVERPV ::::::.::.: .:..: :.::: :::::.::: CCDS36 LKAKQHSSFGYASVQNP--ASNLSACQYAVDRPV 300 310 320 >>CCDS4182.1 PITX1 gene_id:5307|Hs108|chr5 (314 aa) initn: 841 init1: 558 opt: 801 Z-score: 506.2 bits: 101.8 E(32554): 7.1e-22 Smith-Waterman score: 969; 56.3% identity (75.3% similar) in 300 aa overlap (3-296:31-312) 10 20 30 pF1KB7 MEFGLLSEAEARSPALSLSDAGTPHPQLPEHG : : :. : : : : . . .:::. CCDS41 MDAFKGGMSLERLPEGLRPPPPPPHDMGPAFHLARPADPREP-LENSASESSDTELPEKE 10 20 30 40 50 40 50 60 70 80 90 pF1KB7 CKGQEHSDSEKASASLPG-GSPEDGSLKKKQRRQRTHFTSQQLQELEATFQRNRYPDMST .: : . : ..:. : :. .: . :::::::::::::::::::::::::::::::: CCDS41 -RGGEPKGPEDSGAGGTGCGGADDPAKKKKQRRQRTHFTSQQLQELEATFQRNRYPDMSM 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB7 REEIAVWTNLTEARVRVWFKNRRAKWRKRERSQQAELCKGSFAAPLGGLVPPYEEVYP-G :::::::::::: ::::::::::::::::::.:: .::::... ..::: :::.:: : CCDS41 REEIAVWTNLTEPRVRVWFKNRRAKWRKRERNQQLDLCKGGYVPQFSGLVQPYEDVYAAG 120 130 140 150 160 170 160 170 180 190 200 pF1KB7 YSYGNWPPKALAP-PLAAKTFPFAFNSVNVGPLASQPVFSPPSSIAASMVPSAAAAPGTV :::.:: :.::: ::..:.: : :::.. ::.:: .:: ::::.. .::. . ::.: CCDS41 YSYNNWAAKSLAPAPLSTKSFTF-FNSMS--PLSSQSMFSAPSSISSMTMPSSMG-PGAV 180 190 200 210 220 230 210 220 230 240 250 260 pF1KB7 PG-PGA-LQGLGGGPPGLAPAAVSSGAVSCPYASAAAAAAAAASSPY-VYRDPCNSSLAS :: :.. :..... . .:.: :: :::.. : ::: :::: ::::::: CCDS41 PGMPNSGLNNINNLTGSSLNSAMSPGA--CPYGTPA--------SPYSVYRDTCNSSLAS 240 250 260 270 280 270 280 290 300 pF1KB7 LRLKAKQHASFSYPAVHGPPPAANLSPCQYAVERPV ::::.:::.::.: ...: ::..:. ::: CCDS41 LRLKSKQHSSFGYGGLQG--PASGLNACQYNS 290 300 310 302 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 08:57:22 2016 done: Fri Nov 4 08:57:22 2016 Total Scan time: 2.470 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]