FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9704, 332 aa 1>>>pF1KB9704 332 - 332 aa - 332 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.2531+/-0.000446; mu= 11.0846+/- 0.028 mean_var=308.8802+/-63.958, 0's: 0 Z-trim(120.5): 117 B-trim: 917 in 2/53 Lambda= 0.072976 statistics sampled from 35757 (35893) to 35757 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.755), E-opt: 0.2 (0.421), width: 16 Scan time: 8.380 The best scores are: opt bits E(85289) NP_005404 (OMIM: 157170,269160,603714) homeobox pr ( 332) 2259 251.1 2.5e-66 NP_031400 (OMIM: 206900,212550,606326) homeobox pr ( 246) 1354 155.6 1e-37 NP_058628 (OMIM: 604994) homeobox protein SIX2 [Ho ( 291) 965 114.7 2.4e-25 XP_005264157 (OMIM: 604994) PREDICTED: homeobox pr ( 293) 955 113.7 4.9e-25 NP_005973 (OMIM: 113650,601205,605192,608389) home ( 284) 934 111.5 2.3e-24 XP_016877091 (OMIM: 113650,601205,605192,608389) P ( 173) 804 97.4 2.3e-20 XP_005267816 (OMIM: 606342) PREDICTED: homeobox pr ( 773) 740 91.7 5.4e-18 NP_059116 (OMIM: 606342) homeobox protein SIX4 [Ho ( 781) 740 91.7 5.4e-18 NP_787071 (OMIM: 600963,610896) homeobox protein S ( 739) 729 90.5 1.2e-17 >>NP_005404 (OMIM: 157170,269160,603714) homeobox protei (332 aa) initn: 2259 init1: 2259 opt: 2259 Z-score: 1311.8 bits: 251.1 E(85289): 2.5e-66 Smith-Waterman score: 2259; 99.7% identity (99.7% similar) in 332 aa overlap (1-332:1-332) 10 20 30 40 50 60 pF1KB9 MVFRSPLDLYSSHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_005 MVFRSPLDLYSSHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 GAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_005 GAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 ACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_005 ACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 RGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKCELA :::::::::::::::::::::::::::::::::::::::::::::::::::::::: ::: NP_005 RGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKRELA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 QATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGCPTHGSAESPSTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_005 QATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGCPTHGSAESPSTA 250 260 270 280 290 300 310 320 330 pF1KB9 ASPTTSVSSLTERADTGTSILSVTSSDSECDV :::::::::::::::::::::::::::::::: NP_005 ASPTTSVSSLTERADTGTSILSVTSSDSECDV 310 320 330 >>NP_031400 (OMIM: 206900,212550,606326) homeobox protei (246 aa) initn: 1375 init1: 1268 opt: 1354 Z-score: 798.1 bits: 155.6 E(85289): 1e-37 Smith-Waterman score: 1354; 78.3% identity (90.9% similar) in 254 aa overlap (79-332:1-246) 50 60 70 80 90 100 pF1KB9 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL ::::: :::::.:::.:::::::.::.::: NP_031 MFQLPILNFSPQQVAGVCETLEESGDVERL 10 20 30 110 120 130 140 150 160 pF1KB9 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM :::::::::::.::::.::.::.:::::.:::: ::.:.:::::::::::::::.::::. NP_031 GRFLWSLPVAPAACEALNKNESVLRARAIVAFHGGNYRELYHILENHKFTKESHAKLQAL 40 50 60 70 80 90 170 180 190 200 210 220 pF1KB9 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD :::::::::::::::::::::::::::::::::::::::::::::::::: ::::::::: NP_031 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRHLLREWYLQD 100 110 120 130 140 150 230 240 250 260 270 280 pF1KB9 PYPNPSKKCELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGC :::::::: ::::::::::::::::::::::::::::::::::.:... .. :.: : NP_031 PYPNPSKKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQQQVLSQGSGRALRAEG- 160 170 180 190 200 290 300 310 320 330 pF1KB9 PTHGSAESPSTAASPTTSVSSLTERADTGTSILSVTSSDSECDV :. : ..:.::..:.:: ..:: .:.::::::::. NP_031 --DGTPEVLGVATSPAASLSS-----KAATSAISITSSDSECDI 210 220 230 240 >>NP_058628 (OMIM: 604994) homeobox protein SIX2 [Homo s (291 aa) initn: 962 init1: 793 opt: 965 Z-score: 576.1 bits: 114.7 E(85289): 2.4e-25 Smith-Waterman score: 965; 60.8% identity (83.2% similar) in 232 aa overlap (79-309:1-228) 50 60 70 80 90 100 pF1KB9 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL : .:::..:. :::: :::.:.. :.:::: NP_058 MSMLPTFGFTQEQVACVCEVLQQGGNIERL 10 20 30 110 120 130 140 150 160 pF1KB9 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM :::::::: ::: ..:.::.:.:.:::::: ::::.::.:::.:.:. ..:.::: . NP_058 GRFLWSLP----ACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQL 40 50 60 70 80 170 180 190 200 210 220 pF1KB9 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD ::.::: ::::::::::: : :::::.::::::.:::::. ..::::..::.::::: .. NP_058 WLKAHYIEAEKLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHN 90 100 110 120 130 140 230 240 250 260 270 280 pF1KB9 PYPNPSKKCELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGC :::.: .: :::.::::: :::.::::::::::::: ::.: ... . .. : : NP_058 PYPSPREKRELAEATGLTTTQVSNWFKNRRQRDRAAEAKERENNENSNSNSHNPLNGSGK 150 160 170 180 190 200 290 300 310 320 330 pF1KB9 PTHGSAESPST-AASPTTSVSSLTERADTGTSILSVTSSDSECDV . ::.:. .: ...: : :: NP_058 SVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGLPSLHSLGHPPGPSAVPVPVPGGGGAD 210 220 230 240 250 260 >>XP_005264157 (OMIM: 604994) PREDICTED: homeobox protei (293 aa) initn: 941 init1: 772 opt: 955 Z-score: 570.4 bits: 113.7 E(85289): 4.9e-25 Smith-Waterman score: 955; 60.3% identity (82.5% similar) in 234 aa overlap (79-309:1-230) 50 60 70 80 90 100 pF1KB9 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL : .:::..:. :::: :::.:.. :.:::: XP_005 MSMLPTFGFTQEQVACVCEVLQQGGNIERL 10 20 30 110 120 130 140 150 160 pF1KB9 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM :::::::: ::: ..:.::.:.:.:::::: ::::.::.:::.:.:. ..:.::: . XP_005 GRFLWSLP----ACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQL 40 50 60 70 80 170 180 190 200 210 220 pF1KB9 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD ::.::: ::::::::::: : :::::.::::::.:::::. ..::::..::.::::: .. XP_005 WLKAHYIEAEKLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHN 90 100 110 120 130 140 230 240 250 260 270 280 pF1KB9 PYPNPSKKCELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQ--HQAIGPSGMRSLAEP :::.: .: :::.::::: :::.::::::::::::: ::.: . .. . .. : XP_005 PYPSPREKRELAEATGLTTTQVSNWFKNRRQRDRAAEAKERYEENNENSNSNSHNPLNGS 150 160 170 180 190 200 290 300 310 320 330 pF1KB9 GCPTHGSAESPST-AASPTTSVSSLTERADTGTSILSVTSSDSECDV : . ::.:. .: ...: : :: XP_005 GKSVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGLPSLHSLGHPPGPSAVPVPVPGGGG 210 220 230 240 250 260 >>NP_005973 (OMIM: 113650,601205,605192,608389) homeobox (284 aa) initn: 926 init1: 763 opt: 934 Z-score: 558.6 bits: 111.5 E(85289): 2.3e-24 Smith-Waterman score: 934; 57.8% identity (79.1% similar) in 244 aa overlap (79-317:1-239) 50 60 70 80 90 100 pF1KB9 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL : .::...:. :::: :::.:.. :..::: NP_005 MSMLPSFGFTQEQVACVCEVLQQGGNLERL 10 20 30 110 120 130 140 150 160 pF1KB9 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM :::::::: ::. ..:.::.:.:.:::::: ::::.::.:::.:.:. ..: ::: . NP_005 GRFLWSLP----ACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQL 40 50 60 70 80 170 180 190 200 210 220 pF1KB9 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD ::.::: ::::::::::: : :::::.::::::::::::. ..::::..:..::::: .. NP_005 WLKAHYVEAEKLRGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHN 90 100 110 120 130 140 230 240 250 260 270 280 pF1KB9 PYPNPSKKCELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMR----SLA :::.: .: :::.::::: :::.::::::::::::: ::.: . . . :. . : NP_005 PYPSPREKRELAEATGLTTTQVSNWFKNRRQRDRAAEAKERENTENNNSSSNKQNQLSPL 150 160 170 180 190 200 290 300 310 320 330 pF1KB9 EPGCPTHGSAESP-STAASPTTSVSSLTERADTGTSILSVTSSDSECDV : : : .:.: : :: . : : ... : NP_005 EGGKPLMSSSEEEFSPPQSPDQN-SVLLLQGNMGHARSSNYSLPGLTASQPSHGLQTHQH 210 220 230 240 250 260 NP_005 QLQDSLLGPLTSSLVDLGS 270 280 >>XP_016877091 (OMIM: 113650,601205,605192,608389) PREDI (173 aa) initn: 808 init1: 645 opt: 804 Z-score: 486.6 bits: 97.4 E(85289): 2.3e-20 Smith-Waterman score: 804; 64.9% identity (87.7% similar) in 171 aa overlap (79-249:1-167) 50 60 70 80 90 100 pF1KB9 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL : .::...:. :::: :::.:.. :..::: XP_016 MSMLPSFGFTQEQVACVCEVLQQGGNLERL 10 20 30 110 120 130 140 150 160 pF1KB9 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM :::::::: ::. ..:.::.:.:.:::::: ::::.::.:::.:.:. ..: ::: . XP_016 GRFLWSLP----ACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQL 40 50 60 70 80 170 180 190 200 210 220 pF1KB9 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD ::.::: ::::::::::: : :::::.::::::::::::. ..::::..:..::::: .. XP_016 WLKAHYVEAEKLRGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHN 90 100 110 120 130 140 230 240 250 260 270 280 pF1KB9 PYPNPSKKCELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGC :::.: .: :::.::::: :: XP_016 PYPSPREKRELAEATGLTTTQGEHRKQ 150 160 170 >>XP_005267816 (OMIM: 606342) PREDICTED: homeobox protei (773 aa) initn: 782 init1: 602 opt: 740 Z-score: 444.0 bits: 91.7 E(85289): 5.4e-18 Smith-Waterman score: 745; 44.4% identity (67.6% similar) in 293 aa overlap (42-325:48-318) 20 30 40 50 60 70 pF1KB9 SHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAGGAGGGGGGGSR : :. ... .: :. :..:.:... . XP_005 SEGQEAHREVAGGAAVGLSPPAPAPFPLEPGDAATAAARVSGEEGAVAAAAAGAAADQVQ 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 APPEELSMF--------QLPTLNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPGACE : :. : : : :::..:: :::.:.. :...::.::::::: . XP_005 LHSELLGRHHHAAAAAAQTP-LAFSPDHVACVCEALQQGGNLDRLARFLWSLP----QSD 80 90 100 110 120 130 130 140 150 160 170 180 pF1KB9 AINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKLRGR . .::.:.:::.:::: : . .:: :::.:.: . .: :: .: .:.: :::. ::: XP_005 LLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQQLWYKARYTEAERARGR 140 150 160 170 180 190 190 200 210 220 230 240 pF1KB9 PLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKCELAQAT ::: :::::.:.::::::::::::. ..::::..:. :.: : :. ::.:..: .::. : XP_005 PLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYKQNRYPSPAEKRHLAKIT 200 210 220 230 240 250 250 260 270 280 290 300 pF1KB9 GLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEP-GCPTHGSAESPSTAAS ::. :::.::::::::::: .:: .: .: : : :.:. :. . XP_005 GLSLTQVSNWFKNRRQRDR-------------NPSETQSKSESDGNP---STEDESSKGH 260 270 280 290 310 320 330 pF1KB9 PTTSVSSLTERADTGTSILSVTSSDSECDV : :. .: : . ::..: XP_005 EDLSPHPLSSSSD-GITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPASTSPVF 300 310 320 330 340 350 >>NP_059116 (OMIM: 606342) homeobox protein SIX4 [Homo s (781 aa) initn: 782 init1: 602 opt: 740 Z-score: 444.0 bits: 91.7 E(85289): 5.4e-18 Smith-Waterman score: 745; 44.4% identity (67.6% similar) in 293 aa overlap (42-325:56-326) 20 30 40 50 60 70 pF1KB9 SHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAGGAGGGGGGGSR : :. ... .: :. :..:.:... . NP_059 SEGQEAHREVAGGAAVGLSPPAPAPFPLEPGDAATAAARVSGEEGAVAAAAAGAAADQVQ 30 40 50 60 70 80 80 90 100 110 120 pF1KB9 APPEELSMF--------QLPTLNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPGACE : :. : : : :::..:: :::.:.. :...::.::::::: . NP_059 LHSELLGRHHHAAAAAAQTP-LAFSPDHVACVCEALQQGGNLDRLARFLWSLP----QSD 90 100 110 120 130 140 130 140 150 160 170 180 pF1KB9 AINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKLRGR . .::.:.:::.:::: : . .:: :::.:.: . .: :: .: .:.: :::. ::: NP_059 LLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQQLWYKARYTEAERARGR 150 160 170 180 190 200 190 200 210 220 230 240 pF1KB9 PLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKCELAQAT ::: :::::.:.::::::::::::. ..::::..:. :.: : :. ::.:..: .::. : NP_059 PLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYKQNRYPSPAEKRHLAKIT 210 220 230 240 250 260 250 260 270 280 290 300 pF1KB9 GLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEP-GCPTHGSAESPSTAAS ::. :::.::::::::::: .:: .: .: : : :.:. :. . NP_059 GLSLTQVSNWFKNRRQRDR-------------NPSETQSKSESDGNP---STEDESSKGH 270 280 290 300 310 320 330 pF1KB9 PTTSVSSLTERADTGTSILSVTSSDSECDV : :. .: : . ::..: NP_059 EDLSPHPLSSSSD-GITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPASTSPVF 310 320 330 340 350 360 >>NP_787071 (OMIM: 600963,610896) homeobox protein SIX5 (739 aa) initn: 761 init1: 535 opt: 729 Z-score: 438.0 bits: 90.5 E(85289): 1.2e-17 Smith-Waterman score: 743; 46.2% identity (68.8% similar) in 292 aa overlap (42-330:44-315) 20 30 40 50 60 70 pF1KB9 SHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAGGAGGGGGGGSR : :....:.: ::...:: : :. : :: NP_787 AGGEAVAAAAATEEEEEEARQLLQTLQAAEGEAAAAAGAGAGAAAAGAEGPGSPGVPGS- 20 30 40 50 60 70 80 90 100 110 120 130 pF1KB9 APPEELSMFQLPT-LNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPGACEAINKHES ::: : . :: : ::::::: :::.: ..: ::.::: .:: : : . . NP_787 -PPEAAS--EPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGALPPA----ERLRGSDP 80 90 100 110 120 140 150 160 170 180 190 pF1KB9 ILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKLRGRPLGPVDK .:::::.:::. :.. .::..::.. : :. :: ..:.:.:.:::. ::: :: ::: NP_787 VLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYHEAERARGRALGAVDK 130 140 150 160 170 180 200 210 220 230 240 250 pF1KB9 YRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKCELAQATGLTPTQV ::.:::::::.::::::. ..:::::.:. :. : . ::.:..: .:: :::. ::: NP_787 YRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDEKRRLATLTGLSLTQV 190 200 210 220 230 240 260 270 280 290 300 pF1KB9 GNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGCPT--HGSAESPSTAASPTTSVS .:::::::::::..:. : . .: .. : :: :..:: .. :: NP_787 SNWFKNRRQRDRTGAG---------GGAPCKSESD-GNPTTEDESSRSPEDLERGAAPVS 250 260 270 280 290 310 320 330 pF1KB9 SLTERADTGTSILSVTSSDSECDV . : : :. .:. :. . : NP_787 A--EAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLALGEA 300 310 320 330 340 350 332 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 18:26:05 2016 done: Fri Nov 4 18:26:06 2016 Total Scan time: 8.380 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]