FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9760, 739 aa
1>>>pF1KB9760 739 - 739 aa - 739 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 12.7205+/-0.00042; mu= -12.4819+/- 0.026
mean_var=520.2519+/-106.074, 0's: 0 Z-trim(124.4): 30 B-trim: 0 in 0/60
Lambda= 0.056230
statistics sampled from 45824 (45865) to 45824 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.802), E-opt: 0.2 (0.538), width: 16
Scan time: 13.790
The best scores are: opt bits E(85289)
NP_787071 (OMIM: 600963,610896) homeobox protein S ( 739) 4873 410.3 1.4e-113
XP_005267816 (OMIM: 606342) PREDICTED: homeobox pr ( 773) 1055 100.6 2.6e-20
NP_059116 (OMIM: 606342) homeobox protein SIX4 [Ho ( 781) 1055 100.6 2.6e-20
XP_005264157 (OMIM: 604994) PREDICTED: homeobox pr ( 293) 745 75.0 4.8e-13
NP_058628 (OMIM: 604994) homeobox protein SIX2 [Ho ( 291) 744 75.0 5e-13
NP_005404 (OMIM: 157170,269160,603714) homeobox pr ( 332) 740 74.7 6.9e-13
NP_005973 (OMIM: 113650,601205,605192,608389) home ( 284) 731 73.9 1e-12
NP_031400 (OMIM: 206900,212550,606326) homeobox pr ( 246) 690 70.5 9.2e-12
XP_016877091 (OMIM: 113650,601205,605192,608389) P ( 173) 624 65.0 2.9e-10
>>NP_787071 (OMIM: 600963,610896) homeobox protein SIX5 (739 aa)
initn: 4873 init1: 4873 opt: 4873 Z-score: 2159.9 bits: 410.3 E(85289): 1.4e-113
Smith-Waterman score: 4873; 99.9% identity (100.0% similar) in 739 aa overlap (1-739:1-739)
10 20 30 40 50 60
pF1KB9 MATLPAEPSAGPAAGGEAVAAAAATEEEEEEARQLLQTLQAAEGEAAAAAGAGAGAAAAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_787 MATLPAEPSAGPAAGGEAVAAAAATEEEEEEARQLLQTLQAAEGEAAAAAGAGAGAAAAG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 AEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGALPPAERL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_787 AEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGALPPAERL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 RGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYHEAERARGRAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_787 RGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYHEAERARGRAL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 GAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDEKRRLATLTGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_787 GAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDEKRRLATLTGL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 SLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLERGAAPVSAEAAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_787 SLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLERGAAPVSAEAAA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 QGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLALGEASSLGPLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_787 QGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLALGEASSLGPLL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 LTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKGAQVAAPGPALGEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_787 LTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKGAQVAAPGPALGEE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB9 VLGPLAQVVPGPPTAATFPLPPGPVPAVAAPQVVPLSPPPGYPTGLSPTSPLLNLPQVVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_787 VLGPLAQVVPGPPTAATFPLPPGPVPAVAAPQVVPLSPPPGYPTGLSPTSPLLNLPQVVP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB9 TSQVVTLPQAVGPLQLLAAGPGSPVKVAAAAGPANVHLINSGVGVTALQLPSATAPGNFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_787 TSQVVTLPQAVGPLQLLAAGPGSPVKVAAAAGPANVHLINSGVGVTALQLPSATAPGNFL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB9 LANPVSGSPIVTGVAVQQGKIILTATFPTSMLVSQVLPPAPGLALPLKPETAISVPEGGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_787 LANPVSGSPIVTGVAVQQGKIILTATFPTSMLVSQVLPPAPGLALPLKPETAISVPEGGL
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB9 PVAPSPALPEAHALGTLSAQQPPPAAATTSSTSLPFSPDSPGLLPNFPAPPPEGLMLSPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_787 PVAPSPALPEAHALGTLSAQQPPPAAATTSSTSLPFSPDSPGLLPNFPAPPPEGLMLSPA
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB9 AVPVWSAGLELSAGTEGLLEAEKGLGTQAPHTMLRLPDPDPEGLLLGATAGGEVDEGLEA
::::::::::::::::::::::::::::::::.:::::::::::::::::::::::::::
NP_787 AVPVWSAGLELSAGTEGLLEAEKGLGTQAPHTVLRLPDPDPEGLLLGATAGGEVDEGLEA
670 680 690 700 710 720
730
pF1KB9 EAKVLTQLQSVPVEEPLEL
:::::::::::::::::::
NP_787 EAKVLTQLQSVPVEEPLEL
730
>>XP_005267816 (OMIM: 606342) PREDICTED: homeobox protei (773 aa)
initn: 907 init1: 853 opt: 1055 Z-score: 485.8 bits: 100.6 E(85289): 2.6e-20
Smith-Waterman score: 1099; 35.5% identity (59.1% similar) in 785 aa overlap (10-738:28-771)
10 20 30 40
pF1KB9 MATLPAEPSAGPAAGGEAVAAAAATEEEEEEARQLLQTLQAA
:: :: : . : : : .: ...
XP_005 MIASAADIKQENGMESASEGQEAHREVAGGAAVGLSPPAPAPFPLEPGDAATAAARVSGE
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB9 EGE-AAAAAGAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQA
:: :::::::.: . .: : ::. : : :::..:::::::: :.
XP_005 EGAVAAAAAGAAADQVQLHSELLGR-----HHHAAAAAAQTPLAFSPDHVACVCEALQQG
70 80 90 100 110
110 120 130 140 150 160
pF1KB9 GHAGRLSRFLGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQ
:. ::.::: .:: .. :::.. .:.:::::::..: : ::: .:::. : .:.: .::
XP_005 GNLDRLARFLWSLPQSDLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQ
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB9 DLYLRARYHEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYR
.:. .::: :::::::: ::::::::::.:::::.::::::::::::::.:: ::: :.
XP_005 QLWYKARYTEAERARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYK
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB9 GNRYPTPDEKRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESS
::::.: :::.:: .::::::::::::::::::::. . . ::::::::.::::::
XP_005 QNRYPSPAEKRHLAKITGLSLTQVSNWFKNRRQRDRNPSE--TQSKSESDGNPSTEDESS
240 250 260 270 280 290
290 300 310 320 330
pF1KB9 RSPEDLERGAAPVSAEAAAQGS-------IFLAGTGPPAPCPASSSILVNGSFLAASGSP
.. ::: :... .. : ... : .::..:.:::.. :: ::
XP_005 KGHEDLSPHPLSSSSDGITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPASTSP
300 310 320 330 340 350
340 350 360 370 380
pF1KB9 AVLLNG-----GP--VIINGLALGEASSLGPLLLTGGGGAPPPQPSPQGASETKTSLVLD
:.::: :: ::.::: .:...... :. :: . : .. . . .:
XP_005 -VFLNGNSFIQGPSGVILNGLNVGNTQAVA---LN-----PPKMSSNIVSNGISMTDILG
360 370 380 390 400
390 400 410 420 430 440
pF1KB9 PQTGEVR-LEEAQSEAPETKGAQVAAPGPALGEEVLGPLAQVVPG-PPTAATFPLPPGPV
. .:. .. :: : ..: ... .:.. :.. :: :.. . :
XP_005 STSQDVKEFKVLQSSA---NSATTTSYSPSV------PVS--FPGLIPSTEVKREGIQTV
410 420 430 440 450
450 460 470 480 490 500
pF1KB9 PAVAAPQVVPLSPPPGYPTGLSPTSPLLNLPQVVPTSQVVTLPQAVGPLQLLAAGPGSPV
. . .:: .. : . .. . ....:. .:: .. . .:::: : ::
XP_005 ASQDGGSVVTFTTP----VQINQYG-IVQIPNSGANSQFLNGSIGFSPLQL----P--PV
460 470 480 490 500
510 520 530 540 550
pF1KB9 KVAAAAGPANVHLINSGVGV-----TALQ----LPSATAPGNFLLANPVSGSPIVTGVAV
.:::. : .: .: .. :..: . :. ::. . . : .:. : : .
XP_005 SVAASQGNISVSSSTSDGSTFTSESTTVQQGKVFLSSLAPSAVVYTVPNTGQTI--GSVK
510 520 530 540 550 560
560 570 580 590 600
pF1KB9 QQG---KIILTATFPTSM--LVSQVLPPA--PGLAL-PLKPETAISVPEGGLPVAPSPAL
:.: ..... .:... :. : : .: :: . : .. ..:: :
XP_005 QEGLERSLVFSQLMPVNQNAQVNANLSSENISGSGLHPLASSLVNVSPTHNFSLSPSTLL
570 580 590 600 610 620
610 620 630 640 650 660
pF1KB9 PEAHALGTLSAQQPPPAAATTSSTSLPFSPDSPGLLPNFPAPPPEGLMLSP---AA----
.. .. .:: : ....:: : . . : : . :. : ::
XP_005 NPTELNRDIADSQPMSAPVASKSTVTSVSNTNYATLQNCSLITGQDLLSVPMTQAALGEI
630 640 650 660 670 680
670 680 690 700 710
pF1KB9 VPVW--SAGLELSAGTEGLLEAEKGLGTQAPHTMLR--LPDPDPEG----LLLGATA---
::. ..: : . ... :. : :. .: . : . . .. ..: . .
XP_005 VPTAEDQVGHPSPAVHQDFVQ-EHRLVLQSVANMKENFLSNSESKATSSLMMLDSKSKYV
690 700 710 720 730
720 730
pF1KB9 -GGEVD---EGLEAEAKVLTQLQSVPVEEPLEL
: :: : ::.. : :..::.: ..: ..
XP_005 LDGMVDTVCEDLETDKKELAKLQTVQLDEDMQDL
740 750 760 770
>>NP_059116 (OMIM: 606342) homeobox protein SIX4 [Homo s (781 aa)
initn: 907 init1: 853 opt: 1055 Z-score: 485.7 bits: 100.6 E(85289): 2.6e-20
Smith-Waterman score: 1099; 35.5% identity (59.1% similar) in 785 aa overlap (10-738:36-779)
10 20 30
pF1KB9 MATLPAEPSAGPAAGGEAVAAAAATEEEEEEARQLLQTL
:: :: : . : : : .: .
NP_059 PTGQIASAADIKQENGMESASEGQEAHREVAGGAAVGLSPPAPAPFPLEPGDAATAAARV
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB9 QAAEGE-AAAAAGAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEAL
.. :: :::::::.: . .: : ::. : : :::..::::::::
NP_059 SGEEGAVAAAAAGAAADQVQLHSELLGR-----HHHAAAAAAQTPLAFSPDHVACVCEAL
70 80 90 100 110 120
100 110 120 130 140 150
pF1KB9 LQAGHAGRLSRFLGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHA
:.:. ::.::: .:: .. :::.. .:.:::::::..: : ::: .:::. : .:.:
NP_059 QQGGNLDRLARFLWSLPQSDLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHP
130 140 150 160 170 180
160 170 180 190 200 210
pF1KB9 FLQDLYLRARYHEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKA
.::.:. .::: :::::::: ::::::::::.:::::.::::::::::::::.:: :::
NP_059 LLQQLWYKARYTEAERARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKE
190 200 210 220 230 240
220 230 240 250 260 270
pF1KB9 CYRGNRYPTPDEKRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTED
:. ::::.: :::.:: .::::::::::::::::::::. . . ::::::::.:::
NP_059 LYKQNRYPSPAEKRHLAKITGLSLTQVSNWFKNRRQRDRNPSE--TQSKSESDGNPSTED
250 260 270 280 290
280 290 300 310 320 330
pF1KB9 ESSRSPEDLERGAAPVSAEAAAQGS-------IFLAGTGPPAPCPASSSILVNGSFLAAS
:::.. ::: :... .. : ... : .::..:.:::.. ::
NP_059 ESSKGHEDLSPHPLSSSSDGITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPAS
300 310 320 330 340 350
340 350 360 370 380
pF1KB9 GSPAVLLNG-----GP--VIINGLALGEASSLGPLLLTGGGGAPPPQPSPQGASETKTSL
:: :.::: :: ::.::: .:...... :. :: . : .. . .
NP_059 TSP-VFLNGNSFIQGPSGVILNGLNVGNTQAVA---LN-----PPKMSSNIVSNGISMTD
360 370 380 390 400
390 400 410 420 430 440
pF1KB9 VLDPQTGEVR-LEEAQSEAPETKGAQVAAPGPALGEEVLGPLAQVVPG-PPTAATFPLPP
.: . .:. .. :: : ..: ... .:.. :.. :: :.. .
NP_059 ILGSTSQDVKEFKVLQSSA---NSATTTSYSPSV------PVS--FPGLIPSTEVKREGI
410 420 430 440 450
450 460 470 480 490 500
pF1KB9 GPVPAVAAPQVVPLSPPPGYPTGLSPTSPLLNLPQVVPTSQVVTLPQAVGPLQLLAAGPG
: . . .:: .. : . .. . ....:. .:: .. . .:::: :
NP_059 QTVASQDGGSVVTFTTP----VQINQYG-IVQIPNSGANSQFLNGSIGFSPLQL----P-
460 470 480 490 500
510 520 530 540 550
pF1KB9 SPVKVAAAAGPANVHLINSGVGV-----TALQ----LPSATAPGNFLLANPVSGSPIVTG
::.:::. : .: .: .. :..: . :. ::. . . : .:. : :
NP_059 -PVSVAASQGNISVSSSTSDGSTFTSESTTVQQGKVFLSSLAPSAVVYTVPNTGQTI--G
510 520 530 540 550 560
560 570 580 590 600
pF1KB9 VAVQQG---KIILTATFPTSM--LVSQVLPPA--PGLAL-PLKPETAISVPEGGLPVAPS
. :.: ..... .:... :. : : .: :: . : .. ..::
NP_059 SVKQEGLERSLVFSQLMPVNQNAQVNANLSSENISGSGLHPLASSLVNVSPTHNFSLSPS
570 580 590 600 610 620
610 620 630 640 650 660
pF1KB9 PALPEAHALGTLSAQQPPPAAATTSSTSLPFSPDSPGLLPNFPAPPPEGLMLSP---AA-
: .. .. .:: : ....:: : . . : : . :. : ::
NP_059 TLLNPTELNRDIADSQPMSAPVASKSTVTSVSNTNYATLQNCSLITGQDLLSVPMTQAAL
630 640 650 660 670 680
670 680 690 700 710
pF1KB9 ---VPVW--SAGLELSAGTEGLLEAEKGLGTQAPHTMLR--LPDPDPEG----LLLGATA
::. ..: : . ... :. : :. .: . : . . .. ..: . .
NP_059 GEIVPTAEDQVGHPSPAVHQDFVQ-EHRLVLQSVANMKENFLSNSESKATSSLMMLDSKS
690 700 710 720 730 740
720 730
pF1KB9 ----GGEVD---EGLEAEAKVLTQLQSVPVEEPLEL
: :: : ::.. : :..::.: ..: ..
NP_059 KYVLDGMVDTVCEDLETDKKELAKLQTVQLDEDMQDL
750 760 770 780
>>XP_005264157 (OMIM: 604994) PREDICTED: homeobox protei (293 aa)
initn: 806 init1: 728 opt: 745 Z-score: 355.3 bits: 75.0 E(85289): 4.8e-13
Smith-Waterman score: 774; 44.3% identity (67.4% similar) in 316 aa overlap (81-393:5-288)
60 70 80 90 100 110
pF1KB9 GAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRF
:: . :. ::::::::.: :.:. ::.::
XP_005 MSMLPT-FGFTQEQVACVCEVLQQGGNIERLGRF
10 20 30
120 130 140 150 160 170
pF1KB9 LGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYH
: .:: :.:. .. ::.:.:.:::.::.. :::..:::. : .:: ::.:.:.:.:
XP_005 LWSLPACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQLWLKAHYI
40 50 60 70 80 90
180 190 200 210 220 230
pF1KB9 EAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDE
:::. ::: :::: :::.:.:::::..::::::: :::::.::..:. : : ::.: :
XP_005 EAEKLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHNPYPSPRE
100 110 120 130 140 150
240 250 260 270 280 290
pF1KB9 KRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLERG
::.:: :::. :::::::::::::::. : : . . : . . .:..:
XP_005 KRELAEATGLTTTQVSNWFKNRRQRDRA-----AEAKERYEENNENSNSNSHNP------
160 170 180 190 200
300 310 320 330 340
pF1KB9 AAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGL-A
: :.: . . . .:. .:.:::.::. : . .: .
XP_005 ---------------LNGSGKSVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGLPSLHS
210 220 230 240
350 360 370 380 390 400
pF1KB9 LGE--ASSLGPLLLTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKG
::. . : :. . ::::: : : .: ... .:.:.....
XP_005 LGHPPGPSAVPVPVPGGGGADPLQHH-HGLQDS----ILNPMSANLVDLGS
250 260 270 280 290
410 420 430 440 450 460
pF1KB9 AQVAAPGPALGEEVLGPLAQVVPGPPTAATFPLPPGPVPAVAAPQVVPLSPPPGYPTGLS
>>NP_058628 (OMIM: 604994) homeobox protein SIX2 [Homo s (291 aa)
initn: 808 init1: 730 opt: 744 Z-score: 354.9 bits: 75.0 E(85289): 5e-13
Smith-Waterman score: 767; 44.3% identity (67.7% similar) in 316 aa overlap (81-393:5-286)
60 70 80 90 100 110
pF1KB9 GAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRF
:: . :. ::::::::.: :.:. ::.::
NP_058 MSMLPT-FGFTQEQVACVCEVLQQGGNIERLGRF
10 20 30
120 130 140 150 160 170
pF1KB9 LGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYH
: .:: :.:. .. ::.:.:.:::.::.. :::..:::. : .:: ::.:.:.:.:
NP_058 LWSLPACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQLWLKAHYI
40 50 60 70 80 90
180 190 200 210 220 230
pF1KB9 EAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDE
:::. ::: :::: :::.:.:::::..::::::: :::::.::..:. : : ::.: :
NP_058 EAEKLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHNPYPSPRE
100 110 120 130 140 150
240 250 260 270 280 290
pF1KB9 KRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLERG
::.:: :::. ::::::::::::::: : .: ..: .. . .:..:
NP_058 KRELAEATGLTTTQVSNWFKNRRQRDR------AAEAKERENNENS-NSNSHNP------
160 170 180 190 200
300 310 320 330 340
pF1KB9 AAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGL-A
: :.: . . . .:. .:.:::.::. : . .: .
NP_058 ---------------LNGSGKSVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGLPSLHS
210 220 230 240
350 360 370 380 390 400
pF1KB9 LGE--ASSLGPLLLTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKG
::. . : :. . ::::: : : .: ... .:.:.....
NP_058 LGHPPGPSAVPVPVPGGGGADPLQHH-HGLQDS----ILNPMSANLVDLGS
250 260 270 280 290
410 420 430 440 450 460
pF1KB9 AQVAAPGPALGEEVLGPLAQVVPGPPTAATFPLPPGPVPAVAAPQVVPLSPPPGYPTGLS
>>NP_005404 (OMIM: 157170,269160,603714) homeobox protei (332 aa)
initn: 772 init1: 546 opt: 740 Z-score: 352.4 bits: 74.7 E(85289): 6.9e-13
Smith-Waterman score: 754; 46.6% identity (69.2% similar) in 292 aa overlap (44-315:42-330)
20 30 40 50 60 70
pF1KB9 AGGEAVAAAAATEEEEEEARQLLQTLQAAEGEAAAAAGAGAGAAAAGAEGPGSPGVPGS-
: :....:.: ::...:: : :. : ::
NP_005 SHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAGGAGGGGGGGSR
20 30 40 50 60 70
80 90 100 110 120
pF1KB9 -PPEAAS--EPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGALPPA----ERLRGSDP
::: : . :: : ::::::: :::.: ..: ::.::: .:: : : . .
NP_005 APPEELSMFQLPT-LNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPGACEAINKHES
80 90 100 110 120 130
130 140 150 160 170 180
pF1KB9 VLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYHEAERARGRALGAVDK
.:::::.:::. :.. .::..::.. : :. :: ..:.:.:.:::. ::: :: :::
NP_005 ILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKLRGRPLGPVDK
140 150 160 170 180 190
190 200 210 220 230 240
pF1KB9 YRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDEKRRLATLTGLSLTQV
::.:::::::.::::::. ..:::::.:. :. : . ::.:..::.:: :::. :::
NP_005 YRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKRELAQATGLTPTQV
200 210 220 230 240 250
250 260 270 280 290
pF1KB9 SNWFKNRRQRDRTGAG---------GGAPCKSESD-GNPTTEDESSRSPEDLERGAAPVS
.:::::::::::..:. : . .: .. : :: :..:: .. ::
NP_005 GNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGCPT--HGSAESPSTAASPTTSVS
260 270 280 290 300
300 310 320 330 340 350
pF1KB9 A--EAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLALGEA
. : : :. .:. :. . :
NP_005 SLTERADTGTSILSVTSSDSECDV
310 320 330
>>NP_005973 (OMIM: 113650,601205,605192,608389) homeobox (284 aa)
initn: 745 init1: 719 opt: 731 Z-score: 349.3 bits: 73.9 E(85289): 1e-12
Smith-Waterman score: 743; 48.8% identity (72.4% similar) in 254 aa overlap (80-333:5-244)
50 60 70 80 90 100
pF1KB9 AGAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSR
: : :. ::::::::.: :.:. ::.:
NP_005 MSMLPSFG--FTQEQVACVCEVLQQGGNLERLGR
10 20 30
110 120 130 140 150 160
pF1KB9 FLGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARY
:: .:: ..:. .. ::.:.:.:::.::.. :::..:::. : .: ::.:.:.:.:
NP_005 FLWSLPACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQLWLKAHY
40 50 60 70 80 90
170 180 190 200 210 220
pF1KB9 HEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPD
:::. ::: :::: :::.:.:::::.:::::::: :::::.::..:. : : ::.:
NP_005 VEAEKLRGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHNPYPSPR
100 110 120 130 140 150
230 240 250 260 270 280
pF1KB9 EKRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLER
:::.:: :::. ::::::::::::::: :. . .. ..: ... ... :: ::
NP_005 EKRELAEATGLTTTQVSNWFKNRRQRDR--AAEAKERENTENNNSSSNKQNQLSP--LE-
160 170 180 190 200
290 300 310 320 330 340
pF1KB9 GAAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLA
:. :. . . . : :: .: .:..:.. : .:
NP_005 GGKPLMSSSEEEFS-------PPQSPDQNSVLLLQGNMGHARSSNYSLPGLTASQPSHGL
210 220 230 240 250 260
350 360 370 380 390 400
pF1KB9 LGEASSLGPLLLTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKGAQ
NP_005 QTHQHQLQDSLLGPLTSSLVDLGS
270 280
>>NP_031400 (OMIM: 206900,212550,606326) homeobox protei (246 aa)
initn: 671 init1: 562 opt: 690 Z-score: 332.1 bits: 70.5 E(85289): 9.2e-12
Smith-Waterman score: 694; 51.7% identity (72.4% similar) in 232 aa overlap (84-299:7-231)
60 70 80 90 100 110
pF1KB9 AGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGA
: :::.::: :::.: ..: . ::.::: .
NP_031 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWS
10 20 30
120 130 140 150 160
pF1KB9 LP--PA--ERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARY
:: :: : : .. ::::::.:::. :.: :::..::.. : :: :: :.:.:.:
NP_031 LPVAPAACEALNKNESVLRARAIVAFHGGNYRELYHILENHKFTKESHAKLQALWLEAHY
40 50 60 70 80 90
170 180 190 200 210 220
pF1KB9 HEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPD
.:::. ::: :: :::::.:::::::.::::::. ..:::::.: :. : . ::.:.
NP_031 QEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRHLLREWYLQDPYPNPS
100 110 120 130 140 150
230 240 250 260 270
pF1KB9 EKRRLATLTGLSLTQVSNWFKNRRQRDRTGA------------GGGAPCKSESDGNPTTE
.::.:: :::. :::.:::::::::::..: :.: ..:.::.: .
NP_031 KKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVL
160 170 180 190 200 210
280 290 300 310 320 330
pF1KB9 DESSRSPEDLERGAAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVL
.. :: :: .:..::
NP_031 GVAT-SP------AASLSSKAATSAISITSSDSECDI
220 230 240
>>XP_016877091 (OMIM: 113650,601205,605192,608389) PREDI (173 aa)
initn: 647 init1: 623 opt: 624 Z-score: 305.1 bits: 65.0 E(85289): 2.9e-10
Smith-Waterman score: 624; 57.6% identity (79.4% similar) in 165 aa overlap (80-244:5-167)
50 60 70 80 90 100
pF1KB9 AGAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSR
: : :. ::::::::.: :.:. ::.:
XP_016 MSMLPSFG--FTQEQVACVCEVLQQGGNLERLGR
10 20 30
110 120 130 140 150 160
pF1KB9 FLGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARY
:: .:: ..:. .. ::.:.:.:::.::.. :::..:::. : .: ::.:.:.:.:
XP_016 FLWSLPACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQLWLKAHY
40 50 60 70 80 90
170 180 190 200 210 220
pF1KB9 HEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPD
:::. ::: :::: :::.:.:::::.:::::::: :::::.::..:. : : ::.:
XP_016 VEAEKLRGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHNPYPSPR
100 110 120 130 140 150
230 240 250 260 270 280
pF1KB9 EKRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLER
:::.:: :::. ::
XP_016 EKRELAEATGLTTTQGEHRKQ
160 170
739 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 00:56:14 2016 done: Sat Nov 5 00:56:16 2016
Total Scan time: 13.790 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]