FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0387, 603 aa 1>>>pF1KE0387 603 - 603 aa - 603 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.9500+/-0.000346; mu= 21.3816+/- 0.022 mean_var=68.7034+/-13.904, 0's: 0 Z-trim(115.0): 110 B-trim: 75 in 1/49 Lambda= 0.154734 statistics sampled from 25047 (25168) to 25047 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.661), E-opt: 0.2 (0.295), width: 16 Scan time: 10.720 The best scores are: opt bits E(85289) NP_938080 (OMIM: 608043) polypeptide N-acetylgalac ( 603) 4226 952.6 0 NP_001030017 (OMIM: 615138) polypeptide N-acetylga ( 601) 3146 711.5 2e-204 XP_016863733 (OMIM: 615138) PREDICTED: polypeptide ( 609) 3033 686.3 8e-197 XP_011530295 (OMIM: 615138) PREDICTED: polypeptide ( 522) 2951 667.9 2.3e-191 XP_011530296 (OMIM: 615138) PREDICTED: polypeptide ( 451) 2420 549.3 9.9e-156 XP_011530297 (OMIM: 615138) PREDICTED: polypeptide ( 451) 2420 549.3 9.9e-156 XP_011530298 (OMIM: 615138) PREDICTED: polypeptide ( 451) 2420 549.3 9.9e-156 XP_011530299 (OMIM: 615138) PREDICTED: polypeptide ( 418) 2419 549.1 1.1e-155 XP_016863732 (OMIM: 615138) PREDICTED: polypeptide ( 387) 1973 449.5 9.6e-126 NP_003765 (OMIM: 603565) polypeptide N-acetylgalac ( 578) 1367 314.4 6.9e-85 XP_005258296 (OMIM: 602273) PREDICTED: polypeptide ( 559) 1323 304.5 6.1e-82 NP_065207 (OMIM: 602273) polypeptide N-acetylgalac ( 559) 1323 304.5 6.1e-82 XP_016881181 (OMIM: 602273) PREDICTED: polypeptide ( 559) 1323 304.5 6.1e-82 NP_443149 (OMIM: 608369) polypeptide N-acetylgalac ( 556) 1311 301.9 3.9e-81 XP_016858750 (OMIM: 608369) PREDICTED: polypeptide ( 556) 1311 301.9 3.9e-81 NP_001288556 (OMIM: 608369) polypeptide N-acetylga ( 561) 1311 301.9 3.9e-81 XP_016858749 (OMIM: 608369) PREDICTED: polypeptide ( 561) 1311 301.9 3.9e-81 XP_016858748 (OMIM: 608369) PREDICTED: polypeptide ( 571) 1311 301.9 4e-81 XP_016858747 (OMIM: 608369) PREDICTED: polypeptide ( 571) 1311 301.9 4e-81 XP_011508839 (OMIM: 608369) PREDICTED: polypeptide ( 571) 1311 301.9 4e-81 NP_078918 (OMIM: 608812,610290) polypeptide N-acet ( 581) 1288 296.7 1.4e-79 XP_016876987 (OMIM: 615132) PREDICTED: polypeptide ( 558) 1278 294.5 6.4e-79 NP_001161840 (OMIM: 615132) polypeptide N-acetylga ( 558) 1278 294.5 6.4e-79 XP_011535308 (OMIM: 615132) PREDICTED: polypeptide ( 558) 1278 294.5 6.4e-79 XP_011535307 (OMIM: 615132) PREDICTED: polypeptide ( 558) 1278 294.5 6.4e-79 NP_065743 (OMIM: 615132) polypeptide N-acetylgalac ( 558) 1278 294.5 6.4e-79 NP_001316024 (OMIM: 608225) polypeptide N-acetylga ( 517) 1257 289.8 1.6e-77 NP_001240756 (OMIM: 608225) polypeptide N-acetylga ( 532) 1257 289.8 1.6e-77 NP_001316025 (OMIM: 608225) polypeptide N-acetylga ( 532) 1257 289.8 1.6e-77 NP_078848 (OMIM: 608225) polypeptide N-acetylgalac ( 552) 1257 289.8 1.6e-77 XP_016860395 (OMIM: 608225) PREDICTED: polypeptide ( 563) 1257 289.8 1.7e-77 NP_055383 (OMIM: 615129) polypeptide N-acetylgalac ( 940) 1253 289.1 4.6e-77 XP_016858726 (OMIM: 615129) PREDICTED: polypeptide ( 956) 1253 289.1 4.7e-77 NP_001291443 (OMIM: 615130) polypeptide N-acetylga ( 527) 1246 287.3 8.7e-77 NP_071370 (OMIM: 615130) polypeptide N-acetylgalac ( 608) 1236 285.1 4.6e-76 XP_006716145 (OMIM: 615130) PREDICTED: polypeptide ( 608) 1236 285.1 4.6e-76 XP_006716147 (OMIM: 615130) PREDICTED: polypeptide ( 608) 1236 285.1 4.6e-76 XP_006716146 (OMIM: 615130) PREDICTED: polypeptide ( 608) 1236 285.1 4.6e-76 XP_011535309 (OMIM: 615132) PREDICTED: polypeptide ( 514) 1222 282.0 3.5e-75 NP_473451 (OMIM: 615131) polypeptide N-acetylgalac ( 639) 1220 281.6 5.6e-75 XP_016870622 (OMIM: 608812,610290) PREDICTED: poly ( 497) 1205 278.1 4.7e-74 XP_011517320 (OMIM: 608812,610290) PREDICTED: poly ( 507) 1205 278.2 4.8e-74 NP_009141 (OMIM: 605148) polypeptide N-acetylgalac ( 622) 1188 274.4 7.8e-73 XP_016874234 (OMIM: 605148) PREDICTED: polypeptide ( 622) 1188 274.4 7.8e-73 XP_016874233 (OMIM: 605148) PREDICTED: polypeptide ( 622) 1188 274.4 7.8e-73 XP_006719277 (OMIM: 605148) PREDICTED: polypeptide ( 622) 1188 274.4 7.8e-73 XP_011536124 (OMIM: 605148) PREDICTED: polypeptide ( 622) 1188 274.4 7.8e-73 XP_005268664 (OMIM: 605148) PREDICTED: polypeptide ( 622) 1188 274.4 7.8e-73 XP_011536121 (OMIM: 605148) PREDICTED: polypeptide ( 622) 1188 274.4 7.8e-73 XP_016856452 (OMIM: 602274) PREDICTED: polypeptide ( 636) 1183 273.3 1.7e-72 >>NP_938080 (OMIM: 608043) polypeptide N-acetylgalactosa (603 aa) initn: 4226 init1: 4226 opt: 4226 Z-score: 5094.0 bits: 952.6 E(85289): 0 Smith-Waterman score: 4226; 100.0% identity (100.0% similar) in 603 aa overlap (1-603:1-603) 10 20 30 40 50 60 pF1KE0 MRRKEKRLLQAVALVLAALVLLPNVGLWALYRERQPDGTPGGSGAAVAPAAGQGSHSRQK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_938 MRRKEKRLLQAVALVLAALVLLPNVGLWALYRERQPDGTPGGSGAAVAPAAGQGSHSRQK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 KTFFLGDGQKLKDWHDKEAIRRDAQRVGNGEQGRPYPMTDAERVDQAYRENGFNIYVSDK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_938 KTFFLGDGQKLKDWHDKEAIRRDAQRVGNGEQGRPYPMTDAERVDQAYRENGFNIYVSDK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 ISLNRSLPDIRHPNCNSKRYLETLPNTSIIIPFHNEGWSSLLRTVHSVLNRSPPELVAEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_938 ISLNRSLPDIRHPNCNSKRYLETLPNTSIIIPFHNEGWSSLLRTVHSVLNRSPPELVAEI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 VLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLIRTRMLGASVATGDVITFLDSHC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_938 VLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLIRTRMLGASVATGDVITFLDSHC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 EANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYETQAGDAMRGAFDWEMYYKRIPIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_938 EANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYETQAGDAMRGAFDWEMYYKRIPIP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 PELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGGRM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_938 PELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGGRM 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 EDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWMDEYAEYIYQRRPEYRHLSAGDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_938 EDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWMDEYAEYIYQRRPEYRHLSAGDV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE0 AVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAAAWGEIRNVGTGLCADTKHGALG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_938 AVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAAAWGEIRNVGTGLCADTKHGALG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE0 SPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQHTKKFCFDAISHTSPVTLYDCHS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_938 SPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQHTKKFCFDAISHTSPVTLYDCHS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE0 MKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTCNPSSLTQQWLFEHTNSTVLEKF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_938 MKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTCNPSSLTQQWLFEHTNSTVLEKF 550 560 570 580 590 600 pF1KE0 NRN ::: NP_938 NRN >>NP_001030017 (OMIM: 615138) polypeptide N-acetylgalact (601 aa) initn: 3190 init1: 3033 opt: 3146 Z-score: 3791.0 bits: 711.5 E(85289): 2e-204 Smith-Waterman score: 3146; 71.4% identity (89.4% similar) in 605 aa overlap (1-603:1-598) 10 20 30 40 50 pF1KE0 MRRKEKRLLQAVALVLAALVLLPNVGLWALYRERQ--PDGTPGGSGAAVAPAAGQGSHSR :.::.::.:: . : .::..:::::::.::.... .. :: . . : : :. . NP_001 MKRKQKRFLQMTLLFTVALIFLPNVGLWSLYKDKHLVKSAEPGEQ--QTFPL-GLGDGQF 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 QKKTFFLGDGQKLKDWHDKEAIRRDAQRVGNGEQGRPYPMTDAERVDQAYRENGFNIYVS . : :: . ::::: :.:...:.: :.::.:.:::.:. .. :.:::::::::.:: NP_001 YSWT----DGLRRKDWHDYESIQKEAMRSGKGEHGKPYPLTEEDHDDSAYRENGFNIFVS 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 DKISLNRSLPDIRHPNCNSKRYLETLPNTSIIIPFHNEGWSSLLRTVHSVLNRSPPELVA ..:.:.:::::::: ::. : ::: :::::::::::::::.:::::.::..::.: :.: NP_001 NNIALERSLPDIRHANCKHKMYLERLPNTSIIIPFHNEGWTSLLRTIHSIINRTPGSLIA 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 EIVLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLIRTRMLGASVATGDVITFLDS ::.::::::.::::: ::.::: : .:::.::::::::::::.::::.: :.:.::::: NP_001 EIILVDDFSEREHLKDKLEEYMARFSKVRIVRTKKREGLIRTRLLGASMARGEVLTFLDS 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 HCEANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYETQAGDAMRGAFDWEMYYKRIP :::.:::::::::..:: :.:::::::::::::. : ::.:::::::::::::::::::: NP_001 HCEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEAQAGDAMRGAFDWEMYYKRIP 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE0 IPPELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGG ::::::.::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 IPPELQRADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGG 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE0 RMEDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWMDEYAEYIYQRRPEYRHLSAG .: :.::::::::::::::::::.:.:::::::::::.::::.:::::::::::::::.: NP_001 EMFDVPCSRVGHIYRKYVPYKVPSGTSLARNLKRVAETWMDEFAEYIYQRRPEYRHLSTG 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE0 DVAVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAAAWGEIRNVGTGLCADTKHGA :...::.::..:.::.:::::. .:::.::.::::::: :::::::::...::.:.:::: NP_001 DISAQKELRKQLKCKDFKWFMAAVAWDVPKYYPPVEPPPAAWGEIRNVAANLCVDSKHGA 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE0 LGSPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQHTKKFCFDAISHTSPVTLYDC :. :::. ::. .: .:.. :.::: ::::::::.: ::.:::::::::.:::::::: NP_001 TGTELRLDICVKDGSERTWSHEQLFTFGWREDIRPGEPLHTRKFCFDAISHNSPVTLYDC 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE0 HSMKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTCNPSSLTQQWLFEHTNSTVLE :.::::::: ::::.::.::::.:::::. ....::: :.: : ::::.::: : :::: NP_001 HGMKGNQLWGYRKDRTLFHPVSNSCMDCNPAEKKIFMARCDPLSETQQWIFEHINMTVLE 540 550 560 570 580 590 600 pF1KE0 KFNRN :::.. NP_001 KFNHHANS 600 >>XP_016863733 (OMIM: 615138) PREDICTED: polypeptide N-a (609 aa) initn: 3033 init1: 3033 opt: 3033 Z-score: 3654.6 bits: 686.3 E(85289): 8e-197 Smith-Waterman score: 3046; 72.6% identity (89.0% similar) in 574 aa overlap (42-603:33-606) 20 30 40 50 60 pF1KE0 VALVLAALVLLPNVGLWALYRERQPDGTPGGSGAAVAPA--AGQGSHSRQKKTFFLG--- :.: :. : .: : .:: :: XP_016 TFTSFIVTTSSRWAVYPNPFTSQMRAKFRAGAGHQRNPSISADHGVHELVYQTFPLGLGD 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 -------DGQKLKDWHDKEAIRRDAQRVGNGEQGRPYPMTDAERVDQAYRENGFNIYVSD :: . ::::: :.:...:.: :.::.:.:::.:. .. :.:::::::::.::. XP_016 GQFYSWTDGLRRKDWHDYESIQKEAMRSGKGEHGKPYPLTEEDHDDSAYRENGFNIFVSN 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE0 KISLNRSLPDIRHPNCNSKRYLETLPNTSIIIPFHNEGWSSLLRTVHSVLNRSPPELVAE .:.:.:::::::: ::. : ::: :::::::::::::::.:::::.::..::.: :.:: XP_016 NIALERSLPDIRHANCKHKMYLERLPNTSIIIPFHNEGWTSLLRTIHSIINRTPGSLIAE 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE0 IVLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLIRTRMLGASVATGDVITFLDSH :.::::::.::::: ::.::: : .:::.::::::::::::.::::.: :.:.:::::: XP_016 IILVDDFSEREHLKDKLEEYMARFSKVRIVRTKKREGLIRTRLLGASMARGEVLTFLDSH 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE0 CEANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYETQAGDAMRGAFDWEMYYKRIPI ::.:::::::::..:: :.:::::::::::::. : ::.::::::::::::::::::::: XP_016 CEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEAQAGDAMRGAFDWEMYYKRIPI 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE0 PPELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGGR :::::.:::::::::::::::::::::::::::::::::::::::::::::::::::::. XP_016 PPELQRADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGGE 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE0 MEDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWMDEYAEYIYQRRPEYRHLSAGD : :.::::::::::::::::::.:.:::::::::::.::::.:::::::::::::::.:: XP_016 MFDVPCSRVGHIYRKYVPYKVPSGTSLARNLKRVAETWMDEFAEYIYQRRPEYRHLSTGD 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE0 VAVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAAAWGEIRNVGTGLCADTKHGAL ...::.::..:.::.:::::. .:::.::.::::::: :::::::::...::.:.:::: XP_016 ISAQKELRKQLKCKDFKWFMAAVAWDVPKYYPPVEPPPAAWGEIRNVAANLCVDSKHGAT 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE0 GSPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQHTKKFCFDAISHTSPVTLYDCH :. :::. ::. .: .:.. :.::: ::::::::.: ::.:::::::::.::::::::: XP_016 GTELRLDICVKDGSERTWSHEQLFTFGWREDIRPGEPLHTRKFCFDAISHNSPVTLYDCH 490 500 510 520 530 540 540 550 560 570 580 590 pF1KE0 SMKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTCNPSSLTQQWLFEHTNSTVLEK .::::::: ::::.::.::::.:::::. ....::: :.: : ::::.::: : ::::: XP_016 GMKGNQLWGYRKDRTLFHPVSNSCMDCNPAEKKIFMARCDPLSETQQWIFEHINMTVLEK 550 560 570 580 590 600 600 pF1KE0 FNRN ::.. XP_016 FNHHANS >>XP_011530295 (OMIM: 615138) PREDICTED: polypeptide N-a (522 aa) initn: 2962 init1: 2938 opt: 2951 Z-score: 3556.6 bits: 667.9 E(85289): 2.3e-191 Smith-Waterman score: 2951; 76.6% identity (92.9% similar) in 518 aa overlap (86-603:2-519) 60 70 80 90 100 110 pF1KE0 HSRQKKTFFLGDGQKLKDWHDKEAIRRDAQRVGNGEQGRPYPMTDAERVDQAYRENGFNI : :.::.:.:::.:. .. :.::::::::: XP_011 MRSGKGEHGKPYPLTEEDHDDSAYRENGFNI 10 20 30 120 130 140 150 160 170 pF1KE0 YVSDKISLNRSLPDIRHPNCNSKRYLETLPNTSIIIPFHNEGWSSLLRTVHSVLNRSPPE .::..:.:.:::::::: ::. : ::: :::::::::::::::.:::::.::..::.: XP_011 FVSNNIALERSLPDIRHANCKHKMYLERLPNTSIIIPFHNEGWTSLLRTIHSIINRTPGS 40 50 60 70 80 90 180 190 200 210 220 230 pF1KE0 LVAEIVLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLIRTRMLGASVATGDVITF :.:::.::::::.::::: ::.::: : .:::.::::::::::::.::::.: :.:.:: XP_011 LIAEIILVDDFSEREHLKDKLEEYMARFSKVRIVRTKKREGLIRTRLLGASMARGEVLTF 100 110 120 130 140 150 240 250 260 270 280 290 pF1KE0 LDSHCEANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYETQAGDAMRGAFDWEMYYK ::::::.:::::::::..:: :.:::::::::::::. : ::.::::::::::::::::: XP_011 LDSHCEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEAQAGDAMRGAFDWEMYYK 160 170 180 190 200 210 300 310 320 330 340 350 pF1KE0 RIPIPPELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWM :::::::::.:::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 RIPIPPELQRADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWM 220 230 240 250 260 270 360 370 380 390 400 410 pF1KE0 CGGRMEDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWMDEYAEYIYQRRPEYRHL :::.: :.::::::::::::::::::.:.:::::::::::.::::.:::::::::::::: XP_011 CGGEMFDVPCSRVGHIYRKYVPYKVPSGTSLARNLKRVAETWMDEFAEYIYQRRPEYRHL 280 290 300 310 320 330 420 430 440 450 460 470 pF1KE0 SAGDVAVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAAAWGEIRNVGTGLCADTK :.::...::.::..:.::.:::::. .:::.::.::::::: :::::::::...::.:.: XP_011 STGDISAQKELRKQLKCKDFKWFMAAVAWDVPKYYPPVEPPPAAWGEIRNVAANLCVDSK 340 350 360 370 380 390 480 490 500 510 520 530 pF1KE0 HGALGSPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQHTKKFCFDAISHTSPVTL ::: :. :::. ::. .: .:.. :.::: ::::::::.: ::.:::::::::.::::: XP_011 HGATGTELRLDICVKDGSERTWSHEQLFTFGWREDIRPGEPLHTRKFCFDAISHNSPVTL 400 410 420 430 440 450 540 550 560 570 580 590 pF1KE0 YDCHSMKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTCNPSSLTQQWLFEHTNST ::::.::::::: ::::.::.::::.:::::. ....::: :.: : ::::.::: : : XP_011 YDCHGMKGNQLWGYRKDRTLFHPVSNSCMDCNPAEKKIFMARCDPLSETQQWIFEHINMT 460 470 480 490 500 510 600 pF1KE0 VLEKFNRN ::::::.. XP_011 VLEKFNHHANS 520 >>XP_011530296 (OMIM: 615138) PREDICTED: polypeptide N-a (451 aa) initn: 2443 init1: 2419 opt: 2420 Z-score: 2916.8 bits: 549.3 E(85289): 9.9e-156 Smith-Waterman score: 2420; 78.1% identity (93.3% similar) in 415 aa overlap (189-603:34-448) 160 170 180 190 200 210 pF1KE0 SSLLRTVHSVLNRSPPELVAEIVLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLI .:::: ::.::: : .:::.::::::::: XP_011 GGRASSECKGLLLRLSTKRRNKAENGIRCLQEHLKDKLEEYMARFSKVRIVRTKKREGLI 10 20 30 40 50 60 220 230 240 250 260 270 pF1KE0 RTRMLGASVATGDVITFLDSHCEANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYET :::.::::.: :.:.::::::::.:::::::::..:: :.:::::::::::::. : ::. XP_011 RTRLLGASMARGEVLTFLDSHCEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEA 70 80 90 100 110 120 280 290 300 310 320 330 pF1KE0 QAGDAMRGAFDWEMYYKRIPIPPELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPG ::::::::::::::::::::::::::.::::::::::::::::::::::::::::::::: XP_011 QAGDAMRGAFDWEMYYKRIPIPPELQRADPSDPFESPVMAGGLFAVDRKWFWELGGYDPG 130 140 150 160 170 180 340 350 360 370 380 390 pF1KE0 LEIWGGEQYEISFKVWMCGGRMEDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWM ::::::::::::::::::::.: :.::::::::::::::::::.:.:::::::::::.:: XP_011 LEIWGGEQYEISFKVWMCGGEMFDVPCSRVGHIYRKYVPYKVPSGTSLARNLKRVAETWM 190 200 210 220 230 240 400 410 420 430 440 450 pF1KE0 DEYAEYIYQRRPEYRHLSAGDVAVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAA ::.:::::::::::::::.::...::.::..:.::.:::::. .:::.::.::::::: : XP_011 DEFAEYIYQRRPEYRHLSTGDISAQKELRKQLKCKDFKWFMAAVAWDVPKYYPPVEPPPA 250 260 270 280 290 300 460 470 480 490 500 510 pF1KE0 AWGEIRNVGTGLCADTKHGALGSPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQH ::::::::...::.:.:::: :. :::. ::. .: .:.. :.::: ::::::::.: : XP_011 AWGEIRNVAANLCVDSKHGATGTELRLDICVKDGSERTWSHEQLFTFGWREDIRPGEPLH 310 320 330 340 350 360 520 530 540 550 560 570 pF1KE0 TKKFCFDAISHTSPVTLYDCHSMKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTC :.:::::::::.:::::::::.::::::: ::::.::.::::.:::::. ....::: : XP_011 TRKFCFDAISHNSPVTLYDCHGMKGNQLWGYRKDRTLFHPVSNSCMDCNPAEKKIFMARC 370 380 390 400 410 420 580 590 600 pF1KE0 NPSSLTQQWLFEHTNSTVLEKFNRN .: : ::::.::: : :::::::.. XP_011 DPLSETQQWIFEHINMTVLEKFNHHANS 430 440 450 >>XP_011530297 (OMIM: 615138) PREDICTED: polypeptide N-a (451 aa) initn: 2443 init1: 2419 opt: 2420 Z-score: 2916.8 bits: 549.3 E(85289): 9.9e-156 Smith-Waterman score: 2420; 78.1% identity (93.3% similar) in 415 aa overlap (189-603:34-448) 160 170 180 190 200 210 pF1KE0 SSLLRTVHSVLNRSPPELVAEIVLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLI .:::: ::.::: : .:::.::::::::: XP_011 GGRASSECKGLLLRLSTKRRNKAENGIRCLQEHLKDKLEEYMARFSKVRIVRTKKREGLI 10 20 30 40 50 60 220 230 240 250 260 270 pF1KE0 RTRMLGASVATGDVITFLDSHCEANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYET :::.::::.: :.:.::::::::.:::::::::..:: :.:::::::::::::. : ::. XP_011 RTRLLGASMARGEVLTFLDSHCEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEA 70 80 90 100 110 120 280 290 300 310 320 330 pF1KE0 QAGDAMRGAFDWEMYYKRIPIPPELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPG ::::::::::::::::::::::::::.::::::::::::::::::::::::::::::::: XP_011 QAGDAMRGAFDWEMYYKRIPIPPELQRADPSDPFESPVMAGGLFAVDRKWFWELGGYDPG 130 140 150 160 170 180 340 350 360 370 380 390 pF1KE0 LEIWGGEQYEISFKVWMCGGRMEDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWM ::::::::::::::::::::.: :.::::::::::::::::::.:.:::::::::::.:: XP_011 LEIWGGEQYEISFKVWMCGGEMFDVPCSRVGHIYRKYVPYKVPSGTSLARNLKRVAETWM 190 200 210 220 230 240 400 410 420 430 440 450 pF1KE0 DEYAEYIYQRRPEYRHLSAGDVAVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAA ::.:::::::::::::::.::...::.::..:.::.:::::. .:::.::.::::::: : XP_011 DEFAEYIYQRRPEYRHLSTGDISAQKELRKQLKCKDFKWFMAAVAWDVPKYYPPVEPPPA 250 260 270 280 290 300 460 470 480 490 500 510 pF1KE0 AWGEIRNVGTGLCADTKHGALGSPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQH ::::::::...::.:.:::: :. :::. ::. .: .:.. :.::: ::::::::.: : XP_011 AWGEIRNVAANLCVDSKHGATGTELRLDICVKDGSERTWSHEQLFTFGWREDIRPGEPLH 310 320 330 340 350 360 520 530 540 550 560 570 pF1KE0 TKKFCFDAISHTSPVTLYDCHSMKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTC :.:::::::::.:::::::::.::::::: ::::.::.::::.:::::. ....::: : XP_011 TRKFCFDAISHNSPVTLYDCHGMKGNQLWGYRKDRTLFHPVSNSCMDCNPAEKKIFMARC 370 380 390 400 410 420 580 590 600 pF1KE0 NPSSLTQQWLFEHTNSTVLEKFNRN .: : ::::.::: : :::::::.. XP_011 DPLSETQQWIFEHINMTVLEKFNHHANS 430 440 450 >>XP_011530298 (OMIM: 615138) PREDICTED: polypeptide N-a (451 aa) initn: 2443 init1: 2419 opt: 2420 Z-score: 2916.8 bits: 549.3 E(85289): 9.9e-156 Smith-Waterman score: 2420; 78.1% identity (93.3% similar) in 415 aa overlap (189-603:34-448) 160 170 180 190 200 210 pF1KE0 SSLLRTVHSVLNRSPPELVAEIVLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLI .:::: ::.::: : .:::.::::::::: XP_011 GGRASSECKGLLLRLSTKRRNKAENGIRCLQEHLKDKLEEYMARFSKVRIVRTKKREGLI 10 20 30 40 50 60 220 230 240 250 260 270 pF1KE0 RTRMLGASVATGDVITFLDSHCEANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYET :::.::::.: :.:.::::::::.:::::::::..:: :.:::::::::::::. : ::. XP_011 RTRLLGASMARGEVLTFLDSHCEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEA 70 80 90 100 110 120 280 290 300 310 320 330 pF1KE0 QAGDAMRGAFDWEMYYKRIPIPPELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPG ::::::::::::::::::::::::::.::::::::::::::::::::::::::::::::: XP_011 QAGDAMRGAFDWEMYYKRIPIPPELQRADPSDPFESPVMAGGLFAVDRKWFWELGGYDPG 130 140 150 160 170 180 340 350 360 370 380 390 pF1KE0 LEIWGGEQYEISFKVWMCGGRMEDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWM ::::::::::::::::::::.: :.::::::::::::::::::.:.:::::::::::.:: XP_011 LEIWGGEQYEISFKVWMCGGEMFDVPCSRVGHIYRKYVPYKVPSGTSLARNLKRVAETWM 190 200 210 220 230 240 400 410 420 430 440 450 pF1KE0 DEYAEYIYQRRPEYRHLSAGDVAVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAA ::.:::::::::::::::.::...::.::..:.::.:::::. .:::.::.::::::: : XP_011 DEFAEYIYQRRPEYRHLSTGDISAQKELRKQLKCKDFKWFMAAVAWDVPKYYPPVEPPPA 250 260 270 280 290 300 460 470 480 490 500 510 pF1KE0 AWGEIRNVGTGLCADTKHGALGSPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQH ::::::::...::.:.:::: :. :::. ::. .: .:.. :.::: ::::::::.: : XP_011 AWGEIRNVAANLCVDSKHGATGTELRLDICVKDGSERTWSHEQLFTFGWREDIRPGEPLH 310 320 330 340 350 360 520 530 540 550 560 570 pF1KE0 TKKFCFDAISHTSPVTLYDCHSMKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTC :.:::::::::.:::::::::.::::::: ::::.::.::::.:::::. ....::: : XP_011 TRKFCFDAISHNSPVTLYDCHGMKGNQLWGYRKDRTLFHPVSNSCMDCNPAEKKIFMARC 370 380 390 400 410 420 580 590 600 pF1KE0 NPSSLTQQWLFEHTNSTVLEKFNRN .: : ::::.::: : :::::::.. XP_011 DPLSETQQWIFEHINMTVLEKFNHHANS 430 440 450 >>XP_011530299 (OMIM: 615138) PREDICTED: polypeptide N-a (418 aa) initn: 2443 init1: 2419 opt: 2419 Z-score: 2916.1 bits: 549.1 E(85289): 1.1e-155 Smith-Waterman score: 2419; 78.3% identity (93.2% similar) in 414 aa overlap (190-603:2-415) 160 170 180 190 200 210 pF1KE0 SLLRTVHSVLNRSPPELVAEIVLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLIR :::: ::.::: : .:::.:::::::::: XP_011 MEHLKDKLEEYMARFSKVRIVRTKKREGLIR 10 20 30 220 230 240 250 260 270 pF1KE0 TRMLGASVATGDVITFLDSHCEANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYETQ ::.::::.: :.:.::::::::.:::::::::..:: :.:::::::::::::. : ::.: XP_011 TRLLGASMARGEVLTFLDSHCEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEAQ 40 50 60 70 80 90 280 290 300 310 320 330 pF1KE0 AGDAMRGAFDWEMYYKRIPIPPELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGL :::::::::::::::::::::::::.:::::::::::::::::::::::::::::::::: XP_011 AGDAMRGAFDWEMYYKRIPIPPELQRADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGL 100 110 120 130 140 150 340 350 360 370 380 390 pF1KE0 EIWGGEQYEISFKVWMCGGRMEDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWMD :::::::::::::::::::.: :.::::::::::::::::::.:.:::::::::::.::: XP_011 EIWGGEQYEISFKVWMCGGEMFDVPCSRVGHIYRKYVPYKVPSGTSLARNLKRVAETWMD 160 170 180 190 200 210 400 410 420 430 440 450 pF1KE0 EYAEYIYQRRPEYRHLSAGDVAVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAAA :.:::::::::::::::.::...::.::..:.::.:::::. .:::.::.::::::: :: XP_011 EFAEYIYQRRPEYRHLSTGDISAQKELRKQLKCKDFKWFMAAVAWDVPKYYPPVEPPPAA 220 230 240 250 260 270 460 470 480 490 500 510 pF1KE0 WGEIRNVGTGLCADTKHGALGSPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQHT :::::::...::.:.:::: :. :::. ::. .: .:.. :.::: ::::::::.: :: XP_011 WGEIRNVAANLCVDSKHGATGTELRLDICVKDGSERTWSHEQLFTFGWREDIRPGEPLHT 280 290 300 310 320 330 520 530 540 550 560 570 pF1KE0 KKFCFDAISHTSPVTLYDCHSMKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTCN .:::::::::.:::::::::.::::::: ::::.::.::::.:::::. ....::: :. XP_011 RKFCFDAISHNSPVTLYDCHGMKGNQLWGYRKDRTLFHPVSNSCMDCNPAEKKIFMARCD 340 350 360 370 380 390 580 590 600 pF1KE0 PSSLTQQWLFEHTNSTVLEKFNRN : : ::::.::: : :::::::.. XP_011 PLSETQQWIFEHINMTVLEKFNHHANS 400 410 >>XP_016863732 (OMIM: 615138) PREDICTED: polypeptide N-a (387 aa) initn: 1990 init1: 1860 opt: 1973 Z-score: 2378.5 bits: 449.5 E(85289): 9.6e-126 Smith-Waterman score: 1973; 71.3% identity (88.3% similar) in 394 aa overlap (1-392:1-387) 10 20 30 40 50 pF1KE0 MRRKEKRLLQAVALVLAALVLLPNVGLWALYRERQ--PDGTPGGSGAAVAPAAGQGSHSR :.::.::.:: . : .::..:::::::.::.... .. :: . . : : :. . XP_016 MKRKQKRFLQMTLLFTVALIFLPNVGLWSLYKDKHLVKSAEPGEQ--QTFPL-GLGDGQF 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 QKKTFFLGDGQKLKDWHDKEAIRRDAQRVGNGEQGRPYPMTDAERVDQAYRENGFNIYVS . : :: . ::::: :.:...:.: :.::.:.:::.:. .. :.:::::::::.:: XP_016 YSWT----DGLRRKDWHDYESIQKEAMRSGKGEHGKPYPLTEEDHDDSAYRENGFNIFVS 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 DKISLNRSLPDIRHPNCNSKRYLETLPNTSIIIPFHNEGWSSLLRTVHSVLNRSPPELVA ..:.:.:::::::: ::. : ::: :::::::::::::::.:::::.::..::.: :.: XP_016 NNIALERSLPDIRHANCKHKMYLERLPNTSIIIPFHNEGWTSLLRTIHSIINRTPGSLIA 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 EIVLVDDFSDREHLKKPLEDYMALFPSVRILRTKKREGLIRTRMLGASVATGDVITFLDS ::.::::::.::::: ::.::: : .:::.::::::::::::.::::.: :.:.::::: XP_016 EIILVDDFSEREHLKDKLEEYMARFSKVRIVRTKKREGLIRTRLLGASMARGEVLTFLDS 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 HCEANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYETQAGDAMRGAFDWEMYYKRIP :::.:::::::::..:: :.:::::::::::::. : ::.:::::::::::::::::::: XP_016 HCEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEAQAGDAMRGAFDWEMYYKRIP 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE0 IPPELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGG ::::::.::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 IPPELQRADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGG 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE0 RMEDIPCSRVGHIYRKYVPYKVPAGVSLARNLKRVAEVWMDEYAEYIYQRRPEYRHLSAG .: :.::::::::::::::::::.:.::::. .: XP_016 EMFDVPCSRVGHIYRKYVPYKVPSGTSLARKRNR 360 370 380 420 430 440 450 460 470 pF1KE0 DVAVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAAAWGEIRNVGTGLCADTKHGA >>NP_003765 (OMIM: 603565) polypeptide N-acetylgalactosa (578 aa) initn: 1261 init1: 619 opt: 1367 Z-score: 1645.0 bits: 314.4 E(85289): 6.9e-85 Smith-Waterman score: 1393; 40.1% identity (68.1% similar) in 561 aa overlap (50-590:35-577) 20 30 40 50 60 70 pF1KE0 VLLPNVGLWALYRERQPDGTPGGSGAAVAPAAGQGSHSRQKKTFFLGDGQKLKDWHDKEA .:: : ..:. . :.: :: . .. NP_003 WTWAGKSCLLLAFLTVAYIFVELLVSTFHASAGAG-RARELGSRRLSDLQKNTEDLSRPL 10 20 30 40 50 60 80 90 100 110 120 130 pF1KE0 IRRD-AQRVGNGEQGRPYPMTDAE----RVDQAYRENGFNIYVSDKISLNRSLPDIRHPN .. :. . :: :. . : . .. .. ..:::.::.:::.: . : : . NP_003 YKKPPADSRALGEWGKASKLQLNEDELKQQEELIERYAINIYLSDRISLHRHIEDKRMYE 70 80 90 100 110 120 140 150 160 170 180 190 pF1KE0 CNSKRY-LETLPNTSIIIPFHNEGWSSLLRTVHSVLNRSPPELVAEIVLVDDFSDREHLK :.:... .:::.::.:: :.::.::.::::.::::. :: :. ::.::::.::: .:: NP_003 CKSQKFNYRTLPTTSVIIAFYNEAWSTLLRTIHSVLETSPAVLLKEIILVDDLSDRVYLK 130 140 150 160 170 180 200 210 220 230 240 250 pF1KE0 KPLEDYMALFPSVRILRTKKREGLIRTRMLGASVATGDVITFLDSHCEANVNWLPPLLDR :: :.. . ::..::.:::::.:.:..::. :::::.:::: ::: : .:: :::.: NP_003 TQLETYISNLDRVRLIRTNKREGLVRARLIGATFATGDVLTFLDCHCECNSGWLEPLLER 190 200 210 220 230 240 260 270 280 290 300 310 pF1KE0 IARNRKTIVCPMIDVIDHDDFRYETQAGDAMRGAFDWEMYYKRIPIPPELQKADPS--DP :.:.. ..:::.::.:: . :.. : :. : :.:::.. .. .: . . : :: NP_003 IGRDETAVVCPVIDTIDWNTFEFYMQIGEPMIGGFDWRLTFQWHSVPKQERDRRISRIDP 250 260 270 280 290 300 320 330 340 350 360 370 pF1KE0 FESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVWMCGGRMEDIPCSRVGHI ..::.::::::::..:.: :: :: :.:.::::. :.::.::.:::..: :::.:::. NP_003 IRSPTMAGGLFAVSKKYFQYLGTYDTGMEVWGGENLELSFRVWQCGGKLEIHPCSHVGHV 310 320 330 340 350 360 380 390 400 410 420 430 pF1KE0 YRKYVPYKVPAGVSLARNLKRVAEVWMDEYAEYIYQRRPEYRHLSAGDVAVQKKLRSSLN . : .:: : .. .: :.:::::::: :..:.: : :. . ::.. .: :: : NP_003 FPKRAPYARP---NFLQNTARAAEVWMDEYKEHFYNRNPPARKEAYGDISERKLLRERLR 370 380 390 400 410 420 440 450 460 470 480 pF1KE0 CKSFKWFMTKIAWDLPKFYPPVEPPAAAW-GEIRNVG-TGLCADTK---HGALGSPLRLE :::: :.. .. .:... : . : .: : ::. : .. : : . .. :. : : NP_003 CKSFDWYLKNV---FPNLHVPEDRP--GWHGAIRSRGISSECLDYNSPDNNPTGANLSLF 430 440 450 460 470 490 500 510 520 530 540 pF1KE0 GCVRGRGEAAWNNMQVFTFTWREDIRPGDPQHTKKFCFDAISHTSPVTLYDCHS----MK :: .:.: . : : .: ..:: .. . ..: .. . . : . .: . . NP_003 GC-HGQG-----GNQFFEYTSNKEIRFNS---VTELCAEVPEQKNYVGMQNCPKDGFPVP 480 490 500 510 520 550 560 570 580 590 pF1KE0 GNQLWKYRKDKTLYHPVSGSCMDC---SESDHRIFMNTCNPSSLTQQWLFEHTNSTVLEK .: .:....: :..:: :: :.. :. . : ::. . .: : :: NP_003 ANIIWHFKEDGTIFHPHSGLCLSAYRTPEGRPDVQMRTCDALDKNQIWSFEK 530 540 550 560 570 600 pF1KE0 FNRN 603 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 12:55:47 2016 done: Thu Nov 3 12:55:49 2016 Total Scan time: 10.720 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]