FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9760, 739 aa 1>>>pF1KB9760 739 - 739 aa - 739 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.7205+/-0.00042; mu= -12.4819+/- 0.026 mean_var=520.2519+/-106.074, 0's: 0 Z-trim(124.4): 30 B-trim: 0 in 0/60 Lambda= 0.056230 statistics sampled from 45824 (45865) to 45824 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.802), E-opt: 0.2 (0.538), width: 16 Scan time: 13.790 The best scores are: opt bits E(85289) NP_787071 (OMIM: 600963,610896) homeobox protein S ( 739) 4873 410.3 1.4e-113 XP_005267816 (OMIM: 606342) PREDICTED: homeobox pr ( 773) 1055 100.6 2.6e-20 NP_059116 (OMIM: 606342) homeobox protein SIX4 [Ho ( 781) 1055 100.6 2.6e-20 XP_005264157 (OMIM: 604994) PREDICTED: homeobox pr ( 293) 745 75.0 4.8e-13 NP_058628 (OMIM: 604994) homeobox protein SIX2 [Ho ( 291) 744 75.0 5e-13 NP_005404 (OMIM: 157170,269160,603714) homeobox pr ( 332) 740 74.7 6.9e-13 NP_005973 (OMIM: 113650,601205,605192,608389) home ( 284) 731 73.9 1e-12 NP_031400 (OMIM: 206900,212550,606326) homeobox pr ( 246) 690 70.5 9.2e-12 XP_016877091 (OMIM: 113650,601205,605192,608389) P ( 173) 624 65.0 2.9e-10 >>NP_787071 (OMIM: 600963,610896) homeobox protein SIX5 (739 aa) initn: 4873 init1: 4873 opt: 4873 Z-score: 2159.9 bits: 410.3 E(85289): 1.4e-113 Smith-Waterman score: 4873; 99.9% identity (100.0% similar) in 739 aa overlap (1-739:1-739) 10 20 30 40 50 60 pF1KB9 MATLPAEPSAGPAAGGEAVAAAAATEEEEEEARQLLQTLQAAEGEAAAAAGAGAGAAAAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_787 MATLPAEPSAGPAAGGEAVAAAAATEEEEEEARQLLQTLQAAEGEAAAAAGAGAGAAAAG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 AEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGALPPAERL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_787 AEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGALPPAERL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 RGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYHEAERARGRAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_787 RGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYHEAERARGRAL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 GAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDEKRRLATLTGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_787 GAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDEKRRLATLTGL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 SLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLERGAAPVSAEAAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_787 SLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLERGAAPVSAEAAA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 QGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLALGEASSLGPLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_787 QGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLALGEASSLGPLL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 LTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKGAQVAAPGPALGEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_787 LTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKGAQVAAPGPALGEE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 VLGPLAQVVPGPPTAATFPLPPGPVPAVAAPQVVPLSPPPGYPTGLSPTSPLLNLPQVVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_787 VLGPLAQVVPGPPTAATFPLPPGPVPAVAAPQVVPLSPPPGYPTGLSPTSPLLNLPQVVP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 TSQVVTLPQAVGPLQLLAAGPGSPVKVAAAAGPANVHLINSGVGVTALQLPSATAPGNFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_787 TSQVVTLPQAVGPLQLLAAGPGSPVKVAAAAGPANVHLINSGVGVTALQLPSATAPGNFL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB9 LANPVSGSPIVTGVAVQQGKIILTATFPTSMLVSQVLPPAPGLALPLKPETAISVPEGGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_787 LANPVSGSPIVTGVAVQQGKIILTATFPTSMLVSQVLPPAPGLALPLKPETAISVPEGGL 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB9 PVAPSPALPEAHALGTLSAQQPPPAAATTSSTSLPFSPDSPGLLPNFPAPPPEGLMLSPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_787 PVAPSPALPEAHALGTLSAQQPPPAAATTSSTSLPFSPDSPGLLPNFPAPPPEGLMLSPA 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB9 AVPVWSAGLELSAGTEGLLEAEKGLGTQAPHTMLRLPDPDPEGLLLGATAGGEVDEGLEA ::::::::::::::::::::::::::::::::.::::::::::::::::::::::::::: NP_787 AVPVWSAGLELSAGTEGLLEAEKGLGTQAPHTVLRLPDPDPEGLLLGATAGGEVDEGLEA 670 680 690 700 710 720 730 pF1KB9 EAKVLTQLQSVPVEEPLEL ::::::::::::::::::: NP_787 EAKVLTQLQSVPVEEPLEL 730 >>XP_005267816 (OMIM: 606342) PREDICTED: homeobox protei (773 aa) initn: 907 init1: 853 opt: 1055 Z-score: 485.8 bits: 100.6 E(85289): 2.6e-20 Smith-Waterman score: 1099; 35.5% identity (59.1% similar) in 785 aa overlap (10-738:28-771) 10 20 30 40 pF1KB9 MATLPAEPSAGPAAGGEAVAAAAATEEEEEEARQLLQTLQAA :: :: : . : : : .: ... XP_005 MIASAADIKQENGMESASEGQEAHREVAGGAAVGLSPPAPAPFPLEPGDAATAAARVSGE 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB9 EGE-AAAAAGAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQA :: :::::::.: . .: : ::. : : :::..:::::::: :. XP_005 EGAVAAAAAGAAADQVQLHSELLGR-----HHHAAAAAAQTPLAFSPDHVACVCEALQQG 70 80 90 100 110 110 120 130 140 150 160 pF1KB9 GHAGRLSRFLGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQ :. ::.::: .:: .. :::.. .:.:::::::..: : ::: .:::. : .:.: .:: XP_005 GNLDRLARFLWSLPQSDLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQ 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB9 DLYLRARYHEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYR .:. .::: :::::::: ::::::::::.:::::.::::::::::::::.:: ::: :. XP_005 QLWYKARYTEAERARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYK 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB9 GNRYPTPDEKRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESS ::::.: :::.:: .::::::::::::::::::::. . . ::::::::.:::::: XP_005 QNRYPSPAEKRHLAKITGLSLTQVSNWFKNRRQRDRNPSE--TQSKSESDGNPSTEDESS 240 250 260 270 280 290 290 300 310 320 330 pF1KB9 RSPEDLERGAAPVSAEAAAQGS-------IFLAGTGPPAPCPASSSILVNGSFLAASGSP .. ::: :... .. : ... : .::..:.:::.. :: :: XP_005 KGHEDLSPHPLSSSSDGITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPASTSP 300 310 320 330 340 350 340 350 360 370 380 pF1KB9 AVLLNG-----GP--VIINGLALGEASSLGPLLLTGGGGAPPPQPSPQGASETKTSLVLD :.::: :: ::.::: .:...... :. :: . : .. . . .: XP_005 -VFLNGNSFIQGPSGVILNGLNVGNTQAVA---LN-----PPKMSSNIVSNGISMTDILG 360 370 380 390 400 390 400 410 420 430 440 pF1KB9 PQTGEVR-LEEAQSEAPETKGAQVAAPGPALGEEVLGPLAQVVPG-PPTAATFPLPPGPV . .:. .. :: : ..: ... .:.. :.. :: :.. . : XP_005 STSQDVKEFKVLQSSA---NSATTTSYSPSV------PVS--FPGLIPSTEVKREGIQTV 410 420 430 440 450 450 460 470 480 490 500 pF1KB9 PAVAAPQVVPLSPPPGYPTGLSPTSPLLNLPQVVPTSQVVTLPQAVGPLQLLAAGPGSPV . . .:: .. : . .. . ....:. .:: .. . .:::: : :: XP_005 ASQDGGSVVTFTTP----VQINQYG-IVQIPNSGANSQFLNGSIGFSPLQL----P--PV 460 470 480 490 500 510 520 530 540 550 pF1KB9 KVAAAAGPANVHLINSGVGV-----TALQ----LPSATAPGNFLLANPVSGSPIVTGVAV .:::. : .: .: .. :..: . :. ::. . . : .:. : : . XP_005 SVAASQGNISVSSSTSDGSTFTSESTTVQQGKVFLSSLAPSAVVYTVPNTGQTI--GSVK 510 520 530 540 550 560 560 570 580 590 600 pF1KB9 QQG---KIILTATFPTSM--LVSQVLPPA--PGLAL-PLKPETAISVPEGGLPVAPSPAL :.: ..... .:... :. : : .: :: . : .. ..:: : XP_005 QEGLERSLVFSQLMPVNQNAQVNANLSSENISGSGLHPLASSLVNVSPTHNFSLSPSTLL 570 580 590 600 610 620 610 620 630 640 650 660 pF1KB9 PEAHALGTLSAQQPPPAAATTSSTSLPFSPDSPGLLPNFPAPPPEGLMLSP---AA---- .. .. .:: : ....:: : . . : : . :. : :: XP_005 NPTELNRDIADSQPMSAPVASKSTVTSVSNTNYATLQNCSLITGQDLLSVPMTQAALGEI 630 640 650 660 670 680 670 680 690 700 710 pF1KB9 VPVW--SAGLELSAGTEGLLEAEKGLGTQAPHTMLR--LPDPDPEG----LLLGATA--- ::. ..: : . ... :. : :. .: . : . . .. ..: . . XP_005 VPTAEDQVGHPSPAVHQDFVQ-EHRLVLQSVANMKENFLSNSESKATSSLMMLDSKSKYV 690 700 710 720 730 720 730 pF1KB9 -GGEVD---EGLEAEAKVLTQLQSVPVEEPLEL : :: : ::.. : :..::.: ..: .. XP_005 LDGMVDTVCEDLETDKKELAKLQTVQLDEDMQDL 740 750 760 770 >>NP_059116 (OMIM: 606342) homeobox protein SIX4 [Homo s (781 aa) initn: 907 init1: 853 opt: 1055 Z-score: 485.7 bits: 100.6 E(85289): 2.6e-20 Smith-Waterman score: 1099; 35.5% identity (59.1% similar) in 785 aa overlap (10-738:36-779) 10 20 30 pF1KB9 MATLPAEPSAGPAAGGEAVAAAAATEEEEEEARQLLQTL :: :: : . : : : .: . NP_059 PTGQIASAADIKQENGMESASEGQEAHREVAGGAAVGLSPPAPAPFPLEPGDAATAAARV 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB9 QAAEGE-AAAAAGAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEAL .. :: :::::::.: . .: : ::. : : :::..:::::::: NP_059 SGEEGAVAAAAAGAAADQVQLHSELLGR-----HHHAAAAAAQTPLAFSPDHVACVCEAL 70 80 90 100 110 120 100 110 120 130 140 150 pF1KB9 LQAGHAGRLSRFLGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHA :.:. ::.::: .:: .. :::.. .:.:::::::..: : ::: .:::. : .:.: NP_059 QQGGNLDRLARFLWSLPQSDLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHP 130 140 150 160 170 180 160 170 180 190 200 210 pF1KB9 FLQDLYLRARYHEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKA .::.:. .::: :::::::: ::::::::::.:::::.::::::::::::::.:: ::: NP_059 LLQQLWYKARYTEAERARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKE 190 200 210 220 230 240 220 230 240 250 260 270 pF1KB9 CYRGNRYPTPDEKRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTED :. ::::.: :::.:: .::::::::::::::::::::. . . ::::::::.::: NP_059 LYKQNRYPSPAEKRHLAKITGLSLTQVSNWFKNRRQRDRNPSE--TQSKSESDGNPSTED 250 260 270 280 290 280 290 300 310 320 330 pF1KB9 ESSRSPEDLERGAAPVSAEAAAQGS-------IFLAGTGPPAPCPASSSILVNGSFLAAS :::.. ::: :... .. : ... : .::..:.:::.. :: NP_059 ESSKGHEDLSPHPLSSSSDGITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPAS 300 310 320 330 340 350 340 350 360 370 380 pF1KB9 GSPAVLLNG-----GP--VIINGLALGEASSLGPLLLTGGGGAPPPQPSPQGASETKTSL :: :.::: :: ::.::: .:...... :. :: . : .. . . NP_059 TSP-VFLNGNSFIQGPSGVILNGLNVGNTQAVA---LN-----PPKMSSNIVSNGISMTD 360 370 380 390 400 390 400 410 420 430 440 pF1KB9 VLDPQTGEVR-LEEAQSEAPETKGAQVAAPGPALGEEVLGPLAQVVPG-PPTAATFPLPP .: . .:. .. :: : ..: ... .:.. :.. :: :.. . NP_059 ILGSTSQDVKEFKVLQSSA---NSATTTSYSPSV------PVS--FPGLIPSTEVKREGI 410 420 430 440 450 450 460 470 480 490 500 pF1KB9 GPVPAVAAPQVVPLSPPPGYPTGLSPTSPLLNLPQVVPTSQVVTLPQAVGPLQLLAAGPG : . . .:: .. : . .. . ....:. .:: .. . .:::: : NP_059 QTVASQDGGSVVTFTTP----VQINQYG-IVQIPNSGANSQFLNGSIGFSPLQL----P- 460 470 480 490 500 510 520 530 540 550 pF1KB9 SPVKVAAAAGPANVHLINSGVGV-----TALQ----LPSATAPGNFLLANPVSGSPIVTG ::.:::. : .: .: .. :..: . :. ::. . . : .:. : : NP_059 -PVSVAASQGNISVSSSTSDGSTFTSESTTVQQGKVFLSSLAPSAVVYTVPNTGQTI--G 510 520 530 540 550 560 560 570 580 590 600 pF1KB9 VAVQQG---KIILTATFPTSM--LVSQVLPPA--PGLAL-PLKPETAISVPEGGLPVAPS . :.: ..... .:... :. : : .: :: . : .. ..:: NP_059 SVKQEGLERSLVFSQLMPVNQNAQVNANLSSENISGSGLHPLASSLVNVSPTHNFSLSPS 570 580 590 600 610 620 610 620 630 640 650 660 pF1KB9 PALPEAHALGTLSAQQPPPAAATTSSTSLPFSPDSPGLLPNFPAPPPEGLMLSP---AA- : .. .. .:: : ....:: : . . : : . :. : :: NP_059 TLLNPTELNRDIADSQPMSAPVASKSTVTSVSNTNYATLQNCSLITGQDLLSVPMTQAAL 630 640 650 660 670 680 670 680 690 700 710 pF1KB9 ---VPVW--SAGLELSAGTEGLLEAEKGLGTQAPHTMLR--LPDPDPEG----LLLGATA ::. ..: : . ... :. : :. .: . : . . .. ..: . . NP_059 GEIVPTAEDQVGHPSPAVHQDFVQ-EHRLVLQSVANMKENFLSNSESKATSSLMMLDSKS 690 700 710 720 730 740 720 730 pF1KB9 ----GGEVD---EGLEAEAKVLTQLQSVPVEEPLEL : :: : ::.. : :..::.: ..: .. NP_059 KYVLDGMVDTVCEDLETDKKELAKLQTVQLDEDMQDL 750 760 770 780 >>XP_005264157 (OMIM: 604994) PREDICTED: homeobox protei (293 aa) initn: 806 init1: 728 opt: 745 Z-score: 355.3 bits: 75.0 E(85289): 4.8e-13 Smith-Waterman score: 774; 44.3% identity (67.4% similar) in 316 aa overlap (81-393:5-288) 60 70 80 90 100 110 pF1KB9 GAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRF :: . :. ::::::::.: :.:. ::.:: XP_005 MSMLPT-FGFTQEQVACVCEVLQQGGNIERLGRF 10 20 30 120 130 140 150 160 170 pF1KB9 LGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYH : .:: :.:. .. ::.:.:.:::.::.. :::..:::. : .:: ::.:.:.:.: XP_005 LWSLPACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQLWLKAHYI 40 50 60 70 80 90 180 190 200 210 220 230 pF1KB9 EAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDE :::. ::: :::: :::.:.:::::..::::::: :::::.::..:. : : ::.: : XP_005 EAEKLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHNPYPSPRE 100 110 120 130 140 150 240 250 260 270 280 290 pF1KB9 KRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLERG ::.:: :::. :::::::::::::::. : : . . : . . .:..: XP_005 KRELAEATGLTTTQVSNWFKNRRQRDRA-----AEAKERYEENNENSNSNSHNP------ 160 170 180 190 200 300 310 320 330 340 pF1KB9 AAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGL-A : :.: . . . .:. .:.:::.::. : . .: . XP_005 ---------------LNGSGKSVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGLPSLHS 210 220 230 240 350 360 370 380 390 400 pF1KB9 LGE--ASSLGPLLLTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKG ::. . : :. . ::::: : : .: ... .:.:..... XP_005 LGHPPGPSAVPVPVPGGGGADPLQHH-HGLQDS----ILNPMSANLVDLGS 250 260 270 280 290 410 420 430 440 450 460 pF1KB9 AQVAAPGPALGEEVLGPLAQVVPGPPTAATFPLPPGPVPAVAAPQVVPLSPPPGYPTGLS >>NP_058628 (OMIM: 604994) homeobox protein SIX2 [Homo s (291 aa) initn: 808 init1: 730 opt: 744 Z-score: 354.9 bits: 75.0 E(85289): 5e-13 Smith-Waterman score: 767; 44.3% identity (67.7% similar) in 316 aa overlap (81-393:5-286) 60 70 80 90 100 110 pF1KB9 GAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRF :: . :. ::::::::.: :.:. ::.:: NP_058 MSMLPT-FGFTQEQVACVCEVLQQGGNIERLGRF 10 20 30 120 130 140 150 160 170 pF1KB9 LGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYH : .:: :.:. .. ::.:.:.:::.::.. :::..:::. : .:: ::.:.:.:.: NP_058 LWSLPACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQLWLKAHYI 40 50 60 70 80 90 180 190 200 210 220 230 pF1KB9 EAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDE :::. ::: :::: :::.:.:::::..::::::: :::::.::..:. : : ::.: : NP_058 EAEKLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHNPYPSPRE 100 110 120 130 140 150 240 250 260 270 280 290 pF1KB9 KRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLERG ::.:: :::. ::::::::::::::: : .: ..: .. . .:..: NP_058 KRELAEATGLTTTQVSNWFKNRRQRDR------AAEAKERENNENS-NSNSHNP------ 160 170 180 190 200 300 310 320 330 340 pF1KB9 AAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGL-A : :.: . . . .:. .:.:::.::. : . .: . NP_058 ---------------LNGSGKSVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGLPSLHS 210 220 230 240 350 360 370 380 390 400 pF1KB9 LGE--ASSLGPLLLTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKG ::. . : :. . ::::: : : .: ... .:.:..... NP_058 LGHPPGPSAVPVPVPGGGGADPLQHH-HGLQDS----ILNPMSANLVDLGS 250 260 270 280 290 410 420 430 440 450 460 pF1KB9 AQVAAPGPALGEEVLGPLAQVVPGPPTAATFPLPPGPVPAVAAPQVVPLSPPPGYPTGLS >>NP_005404 (OMIM: 157170,269160,603714) homeobox protei (332 aa) initn: 772 init1: 546 opt: 740 Z-score: 352.4 bits: 74.7 E(85289): 6.9e-13 Smith-Waterman score: 754; 46.6% identity (69.2% similar) in 292 aa overlap (44-315:42-330) 20 30 40 50 60 70 pF1KB9 AGGEAVAAAAATEEEEEEARQLLQTLQAAEGEAAAAAGAGAGAAAAGAEGPGSPGVPGS- : :....:.: ::...:: : :. : :: NP_005 SHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAGGAGGGGGGGSR 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 -PPEAAS--EPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGALPPA----ERLRGSDP ::: : . :: : ::::::: :::.: ..: ::.::: .:: : : . . NP_005 APPEELSMFQLPT-LNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPGACEAINKHES 80 90 100 110 120 130 130 140 150 160 170 180 pF1KB9 VLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYHEAERARGRALGAVDK .:::::.:::. :.. .::..::.. : :. :: ..:.:.:.:::. ::: :: ::: NP_005 ILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKLRGRPLGPVDK 140 150 160 170 180 190 190 200 210 220 230 240 pF1KB9 YRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDEKRRLATLTGLSLTQV ::.:::::::.::::::. ..:::::.:. :. : . ::.:..::.:: :::. ::: NP_005 YRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKRELAQATGLTPTQV 200 210 220 230 240 250 250 260 270 280 290 pF1KB9 SNWFKNRRQRDRTGAG---------GGAPCKSESD-GNPTTEDESSRSPEDLERGAAPVS .:::::::::::..:. : . .: .. : :: :..:: .. :: NP_005 GNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGCPT--HGSAESPSTAASPTTSVS 260 270 280 290 300 300 310 320 330 340 350 pF1KB9 A--EAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLALGEA . : : :. .:. :. . : NP_005 SLTERADTGTSILSVTSSDSECDV 310 320 330 >>NP_005973 (OMIM: 113650,601205,605192,608389) homeobox (284 aa) initn: 745 init1: 719 opt: 731 Z-score: 349.3 bits: 73.9 E(85289): 1e-12 Smith-Waterman score: 743; 48.8% identity (72.4% similar) in 254 aa overlap (80-333:5-244) 50 60 70 80 90 100 pF1KB9 AGAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSR : : :. ::::::::.: :.:. ::.: NP_005 MSMLPSFG--FTQEQVACVCEVLQQGGNLERLGR 10 20 30 110 120 130 140 150 160 pF1KB9 FLGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARY :: .:: ..:. .. ::.:.:.:::.::.. :::..:::. : .: ::.:.:.:.: NP_005 FLWSLPACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQLWLKAHY 40 50 60 70 80 90 170 180 190 200 210 220 pF1KB9 HEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPD :::. ::: :::: :::.:.:::::.:::::::: :::::.::..:. : : ::.: NP_005 VEAEKLRGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHNPYPSPR 100 110 120 130 140 150 230 240 250 260 270 280 pF1KB9 EKRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLER :::.:: :::. ::::::::::::::: :. . .. ..: ... ... :: :: NP_005 EKRELAEATGLTTTQVSNWFKNRRQRDR--AAEAKERENTENNNSSSNKQNQLSP--LE- 160 170 180 190 200 290 300 310 320 330 340 pF1KB9 GAAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLA :. :. . . . : :: .: .:..:.. : .: NP_005 GGKPLMSSSEEEFS-------PPQSPDQNSVLLLQGNMGHARSSNYSLPGLTASQPSHGL 210 220 230 240 250 260 350 360 370 380 390 400 pF1KB9 LGEASSLGPLLLTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKGAQ NP_005 QTHQHQLQDSLLGPLTSSLVDLGS 270 280 >>NP_031400 (OMIM: 206900,212550,606326) homeobox protei (246 aa) initn: 671 init1: 562 opt: 690 Z-score: 332.1 bits: 70.5 E(85289): 9.2e-12 Smith-Waterman score: 694; 51.7% identity (72.4% similar) in 232 aa overlap (84-299:7-231) 60 70 80 90 100 110 pF1KB9 AGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGA : :::.::: :::.: ..: . ::.::: . NP_031 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWS 10 20 30 120 130 140 150 160 pF1KB9 LP--PA--ERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARY :: :: : : .. ::::::.:::. :.: :::..::.. : :: :: :.:.:.: NP_031 LPVAPAACEALNKNESVLRARAIVAFHGGNYRELYHILENHKFTKESHAKLQALWLEAHY 40 50 60 70 80 90 170 180 190 200 210 220 pF1KB9 HEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPD .:::. ::: :: :::::.:::::::.::::::. ..:::::.: :. : . ::.:. NP_031 QEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRHLLREWYLQDPYPNPS 100 110 120 130 140 150 230 240 250 260 270 pF1KB9 EKRRLATLTGLSLTQVSNWFKNRRQRDRTGA------------GGGAPCKSESDGNPTTE .::.:: :::. :::.:::::::::::..: :.: ..:.::.: . NP_031 KKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVL 160 170 180 190 200 210 280 290 300 310 320 330 pF1KB9 DESSRSPEDLERGAAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVL .. :: :: .:..:: NP_031 GVAT-SP------AASLSSKAATSAISITSSDSECDI 220 230 240 >>XP_016877091 (OMIM: 113650,601205,605192,608389) PREDI (173 aa) initn: 647 init1: 623 opt: 624 Z-score: 305.1 bits: 65.0 E(85289): 2.9e-10 Smith-Waterman score: 624; 57.6% identity (79.4% similar) in 165 aa overlap (80-244:5-167) 50 60 70 80 90 100 pF1KB9 AGAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSR : : :. ::::::::.: :.:. ::.: XP_016 MSMLPSFG--FTQEQVACVCEVLQQGGNLERLGR 10 20 30 110 120 130 140 150 160 pF1KB9 FLGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARY :: .:: ..:. .. ::.:.:.:::.::.. :::..:::. : .: ::.:.:.:.: XP_016 FLWSLPACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQLWLKAHY 40 50 60 70 80 90 170 180 190 200 210 220 pF1KB9 HEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPD :::. ::: :::: :::.:.:::::.:::::::: :::::.::..:. : : ::.: XP_016 VEAEKLRGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHNPYPSPR 100 110 120 130 140 150 230 240 250 260 270 280 pF1KB9 EKRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLER :::.:: :::. :: XP_016 EKRELAEATGLTTTQGEHRKQ 160 170 739 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 00:56:14 2016 done: Sat Nov 5 00:56:16 2016 Total Scan time: 13.790 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]