FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1130, 542 aa 1>>>pF1KSDA1130 542 - 542 aa - 542 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4773+/-0.000865; mu= 17.8228+/- 0.052 mean_var=73.8378+/-14.999, 0's: 0 Z-trim(106.7): 32 B-trim: 0 in 0/51 Lambda= 0.149257 statistics sampled from 9113 (9144) to 9113 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.652), E-opt: 0.2 (0.281), width: 16 Scan time: 3.340 The best scores are: opt bits E(32554) CCDS32107.1 GALNT16 gene_id:57452|Hs108|chr14 ( 558) 3489 760.9 0 CCDS58705.1 GALNT14 gene_id:79623|Hs108|chr2 ( 532) 1996 439.4 5.1e-123 CCDS1773.2 GALNT14 gene_id:79623|Hs108|chr2 ( 552) 1996 439.4 5.3e-123 CCDS58706.1 GALNT14 gene_id:79623|Hs108|chr2 ( 557) 1822 401.9 1e-111 CCDS1582.1 GALNT2 gene_id:2590|Hs108|chr1 ( 571) 1775 391.8 1.2e-108 CCDS5930.1 GALNT11 gene_id:63917|Hs108|chr7 ( 608) 1300 289.5 7.5e-78 CCDS2199.1 GALNT13 gene_id:114805|Hs108|chr2 ( 556) 1253 279.4 7.7e-75 CCDS77472.1 GALNT13 gene_id:114805|Hs108|chr2 ( 561) 1253 279.4 7.8e-75 CCDS4325.1 GALNT10 gene_id:55568|Hs108|chr5 ( 603) 1231 274.7 2.2e-73 CCDS11915.1 GALNT1 gene_id:2589|Hs108|chr18 ( 559) 1230 274.4 2.4e-73 CCDS34104.1 GALNTL6 gene_id:442117|Hs108|chr4 ( 601) 1218 271.9 1.5e-72 CCDS53817.1 GALNT4 gene_id:8693|Hs108|chr12 ( 578) 1204 268.8 1.2e-71 CCDS55860.1 GALNT4 gene_id:100528030|Hs108|chr12 ( 575) 1197 267.3 3.4e-71 CCDS6737.1 GALNT12 gene_id:79695|Hs108|chr9 ( 581) 1184 264.5 2.4e-70 CCDS8813.1 GALNT6 gene_id:11226|Hs108|chr12 ( 622) 1140 255.1 1.8e-67 CCDS2203.1 GALNT5 gene_id:11227|Hs108|chr2 ( 940) 1136 254.3 4.6e-67 CCDS2226.1 GALNT3 gene_id:2591|Hs108|chr2 ( 633) 1133 253.6 5.2e-67 CCDS81755.1 GALNT9 gene_id:50614|Hs108|chr12 ( 603) 1040 233.5 5.3e-61 CCDS5929.1 GALNTL5 gene_id:168391|Hs108|chr7 ( 443) 1005 225.9 7.6e-59 CCDS82742.1 GALNT15 gene_id:117248|Hs108|chr3 ( 617) 966 217.6 3.4e-56 CCDS33711.1 GALNT15 gene_id:117248|Hs108|chr3 ( 639) 966 217.6 3.5e-56 CCDS5540.1 WBSCR17 gene_id:64409|Hs108|chr7 ( 598) 955 215.2 1.7e-55 CCDS7807.1 GALNT18 gene_id:374378|Hs108|chr11 ( 607) 938 211.6 2.2e-54 CCDS3815.1 GALNT7 gene_id:51809|Hs108|chr4 ( 657) 751 171.3 3.1e-42 CCDS8533.1 GALNT8 gene_id:26290|Hs108|chr12 ( 637) 728 166.4 9.3e-41 CCDS41866.1 GALNT9 gene_id:50614|Hs108|chr12 ( 237) 335 81.5 1.2e-15 >>CCDS32107.1 GALNT16 gene_id:57452|Hs108|chr14 (558 aa) initn: 3489 init1: 3489 opt: 3489 Z-score: 4059.2 bits: 760.9 E(32554): 0 Smith-Waterman score: 3489; 100.0% identity (100.0% similar) in 513 aa overlap (1-513:1-513) 10 20 30 40 50 60 pF1KSD MRKIRANAIAILTVAWILGTFYYLWQDNRAHAASSGGRGAQRAGRRSEQLREDRTIPLIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MRKIRANAIAILTVAWILGTFYYLWQDNRAHAASSGGRGAQRAGRRSEQLREDRTIPLIV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD TGTPSKGFDEKAYLSAKQLKAGEDPYRQHAFNQLESDKLSPDRPIRDTRHYSCPSVSYSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 TGTPSKGFDEKAYLSAKQLKAGEDPYRQHAFNQLESDKLSPDRPIRDTRHYSCPSVSYSS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD DLPATSVIITFHNEARSTLLRTVKSVLNRTPANLIQEIILVDDFSSDPEDCLLLTRIPKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DLPATSVIITFHNEARSTLLRTVKSVLNRTPANLIQEIILVDDFSSDPEDCLLLTRIPKV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD KCLRNDRREGLIRSRVRGADVAAATVLTFLDSHCEVNTEWLPPMLQRVKEDHTRVVSPII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 KCLRNDRREGLIRSRVRGADVAAATVLTFLDSHCEVNTEWLPPMLQRVKEDHTRVVSPII 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD DVISLDNFAYLAASADLRGGFDWSLHFKWEQIPLEQKMTRTDPTRPIRTPVIAGGIFVID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DVISLDNFAYLAASADLRGGFDWSLHFKWEQIPLEQKMTRTDPTRPIRTPVIAGGIFVID 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD KSWFNHLGKYDAQMDIWGGENFELSFRVWMCGGSLEIVPCSRVGHVFRKRHPYNFPEGNA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 KSWFNHLGKYDAQMDIWGGENFELSFRVWMCGGSLEIVPCSRVGHVFRKRHPYNFPEGNA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD LTYIRNTKRTAEVWMDEYKQYYYEARPSAIGKAFGSVATRIEQRKKMNCKSFRWYLENVY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LTYIRNTKRTAEVWMDEYKQYYYEARPSAIGKAFGSVATRIEQRKKMNCKSFRWYLENVY 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD PELTVPVKEALPGIIKQGVNCLESQGQNTAGDFLLGMGICRGSAKNPQPAQAWLFSDHLI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PELTVPVKEALPGIIKQGVNCLESQGQNTAGDFLLGMGICRGSAKNPQPAQAWLFSDHLI 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD QQQGKCLAATSTLMSSPGSPVILQMCNPREGKQVSLLASGPEAQQPEGPCLRVADLGRRA ::::::::::::::::::::::::::::::::: CCDS32 QQQGKCLAATSTLMSSPGSPVILQMCNPREGKQKWRRKGSFIQHSVSGLCLETKPAQLVT 490 500 510 520 530 540 pF1KSD PD CCDS32 SKCQADAQAQQWQLLPHT 550 >>CCDS58705.1 GALNT14 gene_id:79623|Hs108|chr2 (532 aa) initn: 1971 init1: 1868 opt: 1996 Z-score: 2322.0 bits: 439.4 E(32554): 5.1e-123 Smith-Waterman score: 1996; 61.6% identity (83.0% similar) in 448 aa overlap (68-513:36-480) 40 50 60 70 80 90 pF1KSD RGAQRAGRRSEQLREDRTIPLIVTGTPSKGFDEKAYLSAKQLKAGEDPYRQHAFNQLESD :::. ::.::. ..:.:::. .:::: ::. CCDS58 SLARSSVPFADSGLSSSQPSDADWDDLWDQFDERRYLNAKKWRVGDDPYKLYAFNQRESE 10 20 30 40 50 60 100 110 120 130 140 150 pF1KSD KLSPDRPIRDTRHYSCPSVSYSSDLPATSVIITFHNEARSTLLRTVKSVLNRTPANLIQE ..: .: : :::: : . : .::: ::.:::::::::::::::..:::::::..::.: CCDS58 RISSNRAIPDTRHLRCTLLVYCTDLPPTSIIITFHNEARSTLLRTIRSVLNRTPTHLIRE 70 80 90 100 110 120 160 170 180 190 200 210 pF1KSD IILVDDFSSDPEDCLLLTRIPKVKCLRNDRREGLIRSRVRGADVAAATVLTFLDSHCEVN ::::::::.::.:: : ..::::::::..:.::.:::.::::.: .:.::::::::::: CCDS58 IILVDDFSNDPDDCKQLIKLPKVKCLRNNERQGLVRSRIRGADIAQGTTLTFLDSHCEVN 130 140 150 160 170 180 220 230 240 250 260 270 pF1KSD TEWLPPMLQRVKEDHTRVVSPIIDVISLDNFAYLAASADLRGGFDWSLHFKWEQIPLEQK .:: :.:.:::::.:::: :.::.:.::.:.:. ....:::::::::::.:::. ::: CCDS58 RDWLQPLLHRVKEDYTRVVCPVIDIINLDTFTYIESASELRGGFDWSLHFQWEQLSPEQK 190 200 210 220 230 240 280 290 300 310 320 330 pF1KSD MTRTDPTRPIRTPVIAGGIFVIDKSWFNHLGKYDAQMDIWGGENFELSFRVWMCGGSLEI : :::.:::::.::::.:::::.::..::::: .::::::::::.::::::::::::: CCDS58 ARRLDPTEPIRTPIIAGGLFVIDKAWFDYLGKYDMDMDIWGGENFEISFRVWMCGGSLEI 250 260 270 280 290 300 340 350 360 370 380 390 pF1KSD VPCSRVGHVFRKRHPYNFPEGNALTYIRNTKRTAEVWMDEYKQYYYEARPSAIGKAFGSV ::::::::::::.::: ::.::: :::.:::::::::::::::::: ::: :. . ::.: CCDS58 VPCSRVGHVFRKKHPYVFPDGNANTYIKNTKRTAEVWMDEYKQYYYAARPFALERPFGNV 310 320 330 340 350 360 400 410 420 430 440 450 pF1KSD ATRIEQRKKMNCKSFRWYLENVYPELTVPVKEALP-GIIKQGVNCLESQGQNTAGDFLLG .:.. ::.. :.::.:::::.::::..: . .. : :.: .::::: ::. : CCDS58 ESRLDLRKNLRCQSFKWYLENIYPELSIPKESSIQKGNIRQRQKCLESQRQNNQETPNLK 370 380 390 400 410 420 460 470 480 490 500 510 pF1KSD MGICRGSAKNPQPAQAWLFS-DHLIQQQGKCLAATSTLMSSPGSPVILQMCNPREGKQVS .. : . .:.: :. . : :. ::.. . . ::.::.: .:. . .: CCDS58 LSPCAKVKGEDAKSQVWAFTYTQQILQEELCLSVITLF---PGAPVVLVLCKNGDDRQQW 430 440 450 460 470 480 520 530 540 pF1KSD LLASGPEAQQPEGPCLRVADLGRRAPD CCDS58 TKTGSHIEHIASHLCLDTDMFGDGTENGKEIVVNPCESSLMSQHWDMVSS 490 500 510 520 530 >>CCDS1773.2 GALNT14 gene_id:79623|Hs108|chr2 (552 aa) initn: 1971 init1: 1868 opt: 1996 Z-score: 2321.8 bits: 439.4 E(32554): 5.3e-123 Smith-Waterman score: 1996; 61.6% identity (83.0% similar) in 448 aa overlap (68-513:56-500) 40 50 60 70 80 90 pF1KSD RGAQRAGRRSEQLREDRTIPLIVTGTPSKGFDEKAYLSAKQLKAGEDPYRQHAFNQLESD :::. ::.::. ..:.:::. .:::: ::. CCDS17 VTKRKLEVPTGPEVQTPKPSDADWDDLWDQFDERRYLNAKKWRVGDDPYKLYAFNQRESE 30 40 50 60 70 80 100 110 120 130 140 150 pF1KSD KLSPDRPIRDTRHYSCPSVSYSSDLPATSVIITFHNEARSTLLRTVKSVLNRTPANLIQE ..: .: : :::: : . : .::: ::.:::::::::::::::..:::::::..::.: CCDS17 RISSNRAIPDTRHLRCTLLVYCTDLPPTSIIITFHNEARSTLLRTIRSVLNRTPTHLIRE 90 100 110 120 130 140 160 170 180 190 200 210 pF1KSD IILVDDFSSDPEDCLLLTRIPKVKCLRNDRREGLIRSRVRGADVAAATVLTFLDSHCEVN ::::::::.::.:: : ..::::::::..:.::.:::.::::.: .:.::::::::::: CCDS17 IILVDDFSNDPDDCKQLIKLPKVKCLRNNERQGLVRSRIRGADIAQGTTLTFLDSHCEVN 150 160 170 180 190 200 220 230 240 250 260 270 pF1KSD TEWLPPMLQRVKEDHTRVVSPIIDVISLDNFAYLAASADLRGGFDWSLHFKWEQIPLEQK .:: :.:.:::::.:::: :.::.:.::.:.:. ....:::::::::::.:::. ::: CCDS17 RDWLQPLLHRVKEDYTRVVCPVIDIINLDTFTYIESASELRGGFDWSLHFQWEQLSPEQK 210 220 230 240 250 260 280 290 300 310 320 330 pF1KSD MTRTDPTRPIRTPVIAGGIFVIDKSWFNHLGKYDAQMDIWGGENFELSFRVWMCGGSLEI : :::.:::::.::::.:::::.::..::::: .::::::::::.::::::::::::: CCDS17 ARRLDPTEPIRTPIIAGGLFVIDKAWFDYLGKYDMDMDIWGGENFEISFRVWMCGGSLEI 270 280 290 300 310 320 340 350 360 370 380 390 pF1KSD VPCSRVGHVFRKRHPYNFPEGNALTYIRNTKRTAEVWMDEYKQYYYEARPSAIGKAFGSV ::::::::::::.::: ::.::: :::.:::::::::::::::::: ::: :. . ::.: CCDS17 VPCSRVGHVFRKKHPYVFPDGNANTYIKNTKRTAEVWMDEYKQYYYAARPFALERPFGNV 330 340 350 360 370 380 400 410 420 430 440 450 pF1KSD ATRIEQRKKMNCKSFRWYLENVYPELTVPVKEALP-GIIKQGVNCLESQGQNTAGDFLLG .:.. ::.. :.::.:::::.::::..: . .. : :.: .::::: ::. : CCDS17 ESRLDLRKNLRCQSFKWYLENIYPELSIPKESSIQKGNIRQRQKCLESQRQNNQETPNLK 390 400 410 420 430 440 460 470 480 490 500 510 pF1KSD MGICRGSAKNPQPAQAWLFS-DHLIQQQGKCLAATSTLMSSPGSPVILQMCNPREGKQVS .. : . .:.: :. . : :. ::.. . . ::.::.: .:. . .: CCDS17 LSPCAKVKGEDAKSQVWAFTYTQQILQEELCLSVITLF---PGAPVVLVLCKNGDDRQQW 450 460 470 480 490 500 520 530 540 pF1KSD LLASGPEAQQPEGPCLRVADLGRRAPD CCDS17 TKTGSHIEHIASHLCLDTDMFGDGTENGKEIVVNPCESSLMSQHWDMVSS 510 520 530 540 550 >>CCDS58706.1 GALNT14 gene_id:79623|Hs108|chr2 (557 aa) initn: 1804 init1: 1677 opt: 1822 Z-score: 2119.2 bits: 401.9 E(32554): 1e-111 Smith-Waterman score: 1822; 62.5% identity (83.4% similar) in 403 aa overlap (113-513:106-505) 90 100 110 120 130 140 pF1KSD EDPYRQHAFNQLESDKLSPDRPIRDTRHYSCPSVSYSSDLPATSVIITFHNEARSTLLRT : . : .::: ::.::::::::::::::: CCDS58 TGGHLAVCHFPCLLQEAQFHLQTQVFLQVRCTLLVYCTDLPPTSIIITFHNEARSTLLRT 80 90 100 110 120 130 150 160 170 180 190 200 pF1KSD VKSVLNRTPANLIQEIILVDDFSSDPEDCLLLTRIPKVKCLRNDRREGLIRSRVRGADVA ..:::::::..::.:::::::::.::.:: : ..::::::::..:.::.:::.::::.: CCDS58 IRSVLNRTPTHLIREIILVDDFSNDPDDCKQLIKLPKVKCLRNNERQGLVRSRIRGADIA 140 150 160 170 180 190 210 220 230 240 250 260 pF1KSD AATVLTFLDSHCEVNTEWLPPMLQRVKEDHTRVVSPIIDVISLDNFAYLAASADLRGGFD .:.::::::::::: .:: :.:.:::::.:::: :.::.:.::.:.:. ....:::::: CCDS58 QGTTLTFLDSHCEVNRDWLQPLLHRVKEDYTRVVCPVIDIINLDTFTYIESASELRGGFD 200 210 220 230 240 250 270 280 290 300 310 320 pF1KSD WSLHFKWEQIPLEQKMTRTDPTRPIRTPVIAGGIFVIDKSWFNHLGKYDAQMDIWGGENF :::::.:::. ::: : :::.:::::.::::.:::::.::..::::: .::::::::: CCDS58 WSLHFQWEQLSPEQKARRLDPTEPIRTPIIAGGLFVIDKAWFDYLGKYDMDMDIWGGENF 260 270 280 290 300 310 330 340 350 360 370 380 pF1KSD ELSFRVWMCGGSLEIVPCSRVGHVFRKRHPYNFPEGNALTYIRNTKRTAEVWMDEYKQYY :.:::::::::::::::::::::::::.::: ::.::: :::.::::::::::::::::: CCDS58 EISFRVWMCGGSLEIVPCSRVGHVFRKKHPYVFPDGNANTYIKNTKRTAEVWMDEYKQYY 320 330 340 350 360 370 390 400 410 420 430 440 pF1KSD YEARPSAIGKAFGSVATRIEQRKKMNCKSFRWYLENVYPELTVPVKEALP-GIIKQGVNC : ::: :. . ::.: .:.. ::.. :.::.:::::.::::..: . .. : :.: .: CCDS58 YAARPFALERPFGNVESRLDLRKNLRCQSFKWYLENIYPELSIPKESSIQKGNIRQRQKC 380 390 400 410 420 430 450 460 470 480 490 500 pF1KSD LESQGQNTAGDFLLGMGICRGSAKNPQPAQAWLFS-DHLIQQQGKCLAATSTLMSSPGSP :::: ::. : .. : . .:.: :. . : :. ::.. . . ::.: CCDS58 LESQRQNNQETPNLKLSPCAKVKGEDAKSQVWAFTYTQQILQEELCLSVITLF---PGAP 440 450 460 470 480 490 510 520 530 540 pF1KSD VILQMCNPREGKQVSLLASGPEAQQPEGPCLRVADLGRRAPD :.: .:. . .: CCDS58 VVLVLCKNGDDRQQWTKTGSHIEHIASHLCLDTDMFGDGTENGKEIVVNPCESSLMSQHW 500 510 520 530 540 550 >>CCDS1582.1 GALNT2 gene_id:2590|Hs108|chr1 (571 aa) initn: 1067 init1: 921 opt: 1775 Z-score: 2064.4 bits: 391.8 E(32554): 1.2e-108 Smith-Waterman score: 1807; 51.5% identity (76.6% similar) in 530 aa overlap (1-513:1-520) 10 20 30 40 50 pF1KSD MRKIRANAIAILTVAWILGTFYYLWQDNRAHAASSGGRGAQRAGRRSE--QLRE------ ::. :. . .. :.:: ::... . . :...: :: : .: ... CCDS15 MRR-RSRMLLCFAFLWVLGIAYYMYSGGGSALAGGAGGGAGRKEDWNEIDPIKKKDLHHS 10 20 30 40 50 60 70 80 90 100 pF1KSD --DRTIPLIVTGTPSK----GFDEKAYLSAKQLKAGEDPYRQHAFNQLESDKLSPDRPIR .. . : :.: :...::... ....:.::: .. :::.::::: :: : CCDS15 NGEEKAQSMETLPPGKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIP 60 70 80 90 100 110 110 120 130 140 150 160 pF1KSD DTRHYSCPSVSYSSDLPATSVIITFHNEARSTLLRTVKSVLNRTPANLIQEIILVDDFSS :::: .: .. :::::::.:::::::::.::::: :::...: .::.:::::::.:. CCDS15 DTRHDQCQRKQWRVDLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSN 120 130 140 150 160 170 170 180 190 200 210 220 pF1KSD DPEDCLLLTRIPKVKCLRNDRREGLIRSRVRGADVAAATVLTFLDSHCEVNTEWLPPMLQ :::: :: .: ::. :::::::::.::::::::.: : :::::::::: : .:: :.:. CCDS15 DPEDGALLGKIEKVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLE 180 190 200 210 220 230 230 240 250 260 270 280 pF1KSD RVKEDHTRVVSPIIDVISLDNFAYLAASADLRGGFDWSLHFKWEQIPLEQKMTRT-DPTR :: ::.:::::::::::..::: :..:::::.:::::.: :::. . ::. .: .:. CCDS15 RVAEDRTRVVSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVA 240 250 260 270 280 290 290 300 310 320 330 340 pF1KSD PIRTPVIAGGIFVIDKSWFNHLGKYDAQMDIWGGENFELSFRVWMCGGSLEIVPCSRVGH ::.::.::::.::.:: .:..::::: .::.:::::.:.:::::.:::::::.::::::: CCDS15 PIKTPMIAGGLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGH 300 310 320 330 340 350 350 360 370 380 390 400 pF1KSD VFRKRHPYNFPEGNALTYIRNTKRTAEVWMDEYKQYYYEARPSAIGKAFGSVATRIEQRK ::::.:::.:: :.. .. :::.:.:::::::::..:: : ::: . .:.. .:.: :: CCDS15 VFRKQHPYTFPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRK 360 370 380 390 400 410 410 420 430 440 450 460 pF1KSD KMNCKSFRWYLENVYPELTVPVKEALP-GIIKQGVNCLESQGQNTAGDFLLGMGICRGSA :..:: :.:::::::::: :: .. . : ..::.:::.. :. . : ..:. :.... CCDS15 KLSCKPFKWYLENVYPELRVPDHQDIAFGALQQGTNCLDTLGHFADG--VVGVYECHNAG 420 430 440 450 460 470 470 480 490 500 510 520 pF1KSD KNPQPAQAW-LFSDHLIQQQGKCLAATSTLMSSPGSPVILQMCNPREGKQVSLLASGPEA : : : : ... .... ::.... .::: . :: : ...: CCDS15 GN----QEWALTKEKSVKHMDLCLTVVDR---APGSLIKLQGCRENDSRQKWEQIEGNSK 480 490 500 510 520 530 530 540 pF1KSD QQPEGPCLRVADLGRRAPD CCDS15 LRHVGSNLCLDSRTAKSGGLSVEVCGPALSQQWKFTLNLQQ 540 550 560 570 >>CCDS5930.1 GALNT11 gene_id:63917|Hs108|chr7 (608 aa) initn: 1006 init1: 503 opt: 1300 Z-score: 1511.2 bits: 289.5 E(32554): 7.5e-78 Smith-Waterman score: 1365; 44.3% identity (70.7% similar) in 485 aa overlap (86-539:114-588) 60 70 80 90 100 110 pF1KSD IPLIVTGTPSKGFDEKAYLSAKQLKAGEDPYRQHAFNQLESDKLSPDRPIRDTRHYSCPS :..::::.: ::.:. : . :::. .: CCDS59 VEDPEEGHLKFSSELGMIFNERDQELRDLGYQKHAFNMLISDRLGYHRDVPDTRNAACKE 90 100 110 120 130 140 120 130 140 150 160 170 pF1KSD VSYSSDLPATSVIITFHNEARSTLLRTVKSVLNRTPANLIQEIILVDDFSSDPEDC---- : ::::.::.: :.::: :.:::::.::..::::.:..::::::: .:: .: CCDS59 KFYPPDLPAASVVICFYNEAFSALLRTVHSVIDRTPAHLLHEIILVDD-DSDFDDLKGEL 150 160 170 180 190 200 180 190 200 210 220 pF1KSD --LLLTRIP-KVKCLRNDRREGLIRSRVRGADVAAATVLTFLDSHCEVNTEWLPPMLQRV . .: :.: .:: .::::::.:. :: :.. ::.:::::::::. :: :.: . CCDS59 DEYVQKYLPGKIKVIRNTKREGLIRGRMIGAAHATGEVLVFLDSHCEVNVMWLQPLLAAI 210 220 230 240 250 260 230 240 250 260 270 280 pF1KSD KEDHTRVVSPIIDVISLDNFAYLAASADLRGGFDWSLHFKWEQIPLEQKMTRTDPTRPIR .::. :: :.::.:: :..:: ..: .::::.:.:::::. .:: . : ::. CCDS59 REDRHTVVCPVIDIISADTLAY-SSSPVVRGGFNWGLHFKWDLVPLSELGRAEGATAPIK 270 280 290 300 310 320 290 300 310 320 330 340 pF1KSD TPVIAGGIFVIDKSWFNHLGKYDAQMDIWGGENFELSFRVWMCGGSLEIVPCSRVGHVFR .:..:::.:......:..::.::. ::::::::.:.:::.:::::.: :.:::::::.:: CCDS59 SPTMAGGLFAMNRQYFHELGQYDSGMDIWGGENLEISFRIWMCGGKLFIIPCSRVGHIFR 330 340 350 360 370 380 350 360 370 380 390 400 pF1KSD KRHPYNFPEGNALTYIRNTKRTAEVWMDEYKQYYYEARPSAIGKAFGSVATRIEQRKKMN ::.::. :::. :. .:. : :.::.::::. :. ::. :..:... :.: :::.. CCDS59 KRRPYGSPEGQD-TMTHNSLRLAHVWLDEYKEQYFSLRPDLKTKSYGNISERVELRKKLG 390 400 410 420 430 440 410 420 430 440 pF1KSD CKSFRWYLENVYPELTV------PVKEAL-------PGIIKQGV-------NCLESQGQN ::::.:::.:::::. . : . . : ....: .:: .::. CCDS59 CKSFKWYLDNVYPEMQISGSHAKPQQPIFVNRGPKRPKVLQRGRLYHLQTNKCLVAQGRP 450 460 470 480 490 500 450 460 470 480 490 500 pF1KSD TAGDFLLGMGICRGSAKNPQPAQAWLFSDH--LIQQQGKCLAATSTLMSSPGSPVILQMC . :. . : : .: : :..... :. .. :: . : :.: : ... : CCDS59 SQKGGLVVLKACDYS----DPNQIWIYNEEHELVLNSLLCLDMSETRSSDP--PRLMK-C 510 520 530 540 550 510 520 530 540 pF1KSD NPREGKQVSLLASGPEAQQPE-GPCLRVAD-LGRRAPD . :.: .... . : : :::..: ::.. CCDS59 HGSGGSQQWTFGKNNRLYQVSVGQCLRAVDPLGQKGSVAMAICDGSSSQQWHLEG 560 570 580 590 600 >>CCDS2199.1 GALNT13 gene_id:114805|Hs108|chr2 (556 aa) initn: 1183 init1: 600 opt: 1253 Z-score: 1457.1 bits: 279.4 E(32554): 7.7e-75 Smith-Waterman score: 1254; 42.8% identity (68.6% similar) in 488 aa overlap (46-514:33-504) 20 30 40 50 60 70 pF1KSD WILGTFYYLWQDNRAHAASSGGRGAQRAGRRSEQLREDRTIPLI--VTGTPSKGFDE--K . .. .: .: . : . ..: : : CCDS21 RFVYCKVVLATSLMWVLVDVFLLLYFSECNKCDDKKERSLLPALRAVISRNQEGPGEMGK 10 20 30 40 50 60 80 90 100 110 120 pF1KSD AYLSAK--QLKAGEDPYRQHAFNQLESDKLSPDRPIRDTRHYSCPSVSYSSDLPATSVII : : : : : : .. . :: . :: .. .: . :.: .: . : ..:: :::.: CCDS21 AVLIPKDDQEKMKEL-FKINQFNLMASDLIALNRSLPDVRLEGCKTKVYPDELPNTSVVI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD TFHNEARSTLLRTVKSVLNRTPANLIQEIILVDDFSSDPEDCLLLT--------RIPKVK .::::: ::::::: ::.::.: :..:.::::: : .: : :: ..: :: CCDS21 VFHNEAWSTLLRTVYSVINRSPHYLLSEVILVDDAS--ERDFLKLTLENYVKNLEVP-VK 130 140 150 160 170 190 200 210 220 230 240 pF1KSD CLRNDRREGLIRSRVRGADVAAATVLTFLDSHCEVNTEWLPPMLQRVKEDHTRVVSPIID .: ..: ::::.:.::: .. . :.::::.::: . :: :.: :.:::. :: :::: CCDS21 IIRMEERSGLIRARLRGAAASKGQVITFLDAHCECTLGWLEPLLARIKEDRKTVVCPIID 180 190 200 210 220 230 250 260 270 280 290 pF1KSD VISLDNFAYLAASADLRGGFDWSLHFKWEQIPLEQKMTRT--DPTRPIRTPVIAGGIFVI ::: :.: :.:.: :::.:.:.:.: .: ...: : : : :.:::..:::.: : CCDS21 VISDDTFEYMAGSDMTYGGFNWKLNFRWYPVP-QREMDRRKGDRTLPVRTPTMAGGLFSI 240 250 260 270 280 290 300 310 320 330 340 350 pF1KSD DKSWFNHLGKYDAQMDIWGGENFELSFRVWMCGGSLEIVPCSRVGHVFRKRHPYNFPEGN :...:...: ::: ::::::::.:.:::.:.:::::::: ::.::::::: ::.:: :. CCDS21 DRNYFEEIGTYDAGMDIWGGENLEMSFRIWQCGGSLEIVTCSHVGHVFRKATPYTFPGGT 300 310 320 330 340 350 360 370 380 390 400 410 pF1KSD ALTYIRNTKRTAEVWMDEYKQYYYEARPSAIGKAFGSVATRIEQRKKMNCKSFRWYLENV . . .:..: :::::::.:...: :... .:.:..: :....:: : :::::. CCDS21 GHVINKNNRRLAEVWMDEFKDFFYIISPGVVKVDYGDVSVRKTLRENLKCKPFSWYLENI 360 370 380 390 400 410 420 430 440 450 460 470 pF1KSD YPELTVPVKEALPGIIK--QGVNCLESQGQNTAGDFLLGMGICRGSAKNPQPAQAWLFS- ::. .: . : :. . .::...:.. . .:. :.: . : :.. .. CCDS21 YPDSQIPRRYYSLGEIRNVETNQCLDNMGRKE--NEKVGIFNCHGMGGN----QVFSYTA 420 430 440 450 460 470 480 490 500 510 520 530 pF1KSD DHLIQQQGKCLAATSTLMSSPGSPVILQMCNPREGKQVSLLASGPEAQQPEGPCLRVADL :. :. . :: .: ..:::. :. .:.:. CCDS21 DKEIRTDDLCLD-----VSRLNGPVIMLKCHHMRGNQLWEYDAERLTLRHVNSNQCLDEP 480 490 500 510 520 540 pF1KSD GRRAPD CCDS21 SEEDKMVPTMQDCSGSRSQQWLLRNMTLGT 530 540 550 >>CCDS77472.1 GALNT13 gene_id:114805|Hs108|chr2 (561 aa) initn: 1183 init1: 600 opt: 1253 Z-score: 1457.0 bits: 279.4 E(32554): 7.8e-75 Smith-Waterman score: 1254; 42.8% identity (68.6% similar) in 488 aa overlap (46-514:33-504) 20 30 40 50 60 70 pF1KSD WILGTFYYLWQDNRAHAASSGGRGAQRAGRRSEQLREDRTIPLI--VTGTPSKGFDE--K . .. .: .: . : . ..: : : CCDS77 RFVYCKVVLATSLMWVLVDVFLLLYFSECNKCDDKKERSLLPALRAVISRNQEGPGEMGK 10 20 30 40 50 60 80 90 100 110 120 pF1KSD AYLSAK--QLKAGEDPYRQHAFNQLESDKLSPDRPIRDTRHYSCPSVSYSSDLPATSVII : : : : : : .. . :: . :: .. .: . :.: .: . : ..:: :::.: CCDS77 AVLIPKDDQEKMKEL-FKINQFNLMASDLIALNRSLPDVRLEGCKTKVYPDELPNTSVVI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD TFHNEARSTLLRTVKSVLNRTPANLIQEIILVDDFSSDPEDCLLLT--------RIPKVK .::::: ::::::: ::.::.: :..:.::::: : .: : :: ..: :: CCDS77 VFHNEAWSTLLRTVYSVINRSPHYLLSEVILVDDAS--ERDFLKLTLENYVKNLEVP-VK 130 140 150 160 170 190 200 210 220 230 240 pF1KSD CLRNDRREGLIRSRVRGADVAAATVLTFLDSHCEVNTEWLPPMLQRVKEDHTRVVSPIID .: ..: ::::.:.::: .. . :.::::.::: . :: :.: :.:::. :: :::: CCDS77 IIRMEERSGLIRARLRGAAASKGQVITFLDAHCECTLGWLEPLLARIKEDRKTVVCPIID 180 190 200 210 220 230 250 260 270 280 290 pF1KSD VISLDNFAYLAASADLRGGFDWSLHFKWEQIPLEQKMTRT--DPTRPIRTPVIAGGIFVI ::: :.: :.:.: :::.:.:.:.: .: ...: : : : :.:::..:::.: : CCDS77 VISDDTFEYMAGSDMTYGGFNWKLNFRWYPVP-QREMDRRKGDRTLPVRTPTMAGGLFSI 240 250 260 270 280 290 300 310 320 330 340 350 pF1KSD DKSWFNHLGKYDAQMDIWGGENFELSFRVWMCGGSLEIVPCSRVGHVFRKRHPYNFPEGN :...:...: ::: ::::::::.:.:::.:.:::::::: ::.::::::: ::.:: :. CCDS77 DRNYFEEIGTYDAGMDIWGGENLEMSFRIWQCGGSLEIVTCSHVGHVFRKATPYTFPGGT 300 310 320 330 340 350 360 370 380 390 400 410 pF1KSD ALTYIRNTKRTAEVWMDEYKQYYYEARPSAIGKAFGSVATRIEQRKKMNCKSFRWYLENV . . .:..: :::::::.:...: :... .:.:..: :....:: : :::::. CCDS77 GHVINKNNRRLAEVWMDEFKDFFYIISPGVVKVDYGDVSVRKTLRENLKCKPFSWYLENI 360 370 380 390 400 410 420 430 440 450 460 470 pF1KSD YPELTVPVKEALPGIIK--QGVNCLESQGQNTAGDFLLGMGICRGSAKNPQPAQAWLFS- ::. .: . : :. . .::...:.. . .:. :.: . : :.. .. CCDS77 YPDSQIPRRYYSLGEIRNVETNQCLDNMGRKE--NEKVGIFNCHGMGGN----QVFSYTA 420 430 440 450 460 470 480 490 500 510 520 530 pF1KSD DHLIQQQGKCLAATSTLMSSPGSPVILQMCNPREGKQVSLLASGPEAQQPEGPCLRVADL :. :. . :: .: ..:::. :. .:.:. CCDS77 DKEIRTDDLCLD-----VSRLNGPVIMLKCHHMRGNQLWEYDAESCLSVNKVADGSQHPT 480 490 500 510 520 540 pF1KSD GRRAPD CCDS77 VETCNDSTLQKWLLRNYTRMEIFRNIFGNSTDYIL 530 540 550 560 >>CCDS4325.1 GALNT10 gene_id:55568|Hs108|chr5 (603 aa) initn: 1210 init1: 407 opt: 1231 Z-score: 1430.9 bits: 274.7 E(32554): 2.2e-73 Smith-Waterman score: 1249; 38.7% identity (65.8% similar) in 571 aa overlap (8-539:11-572) 10 20 30 40 50 pF1KSD MRKIRANAIAILTVAWILGTFYYLWQ--DNRAHAASSGGRGAQ---RAGRRSEQLRE :.:.. .: .: :: .: .. :: :: ::. :.. :. CCDS43 MRRKEKRLLQAVALVLAALVLLPNVGLWALYRERQPDGTPGGSGAAVAPAAGQGSHS-RQ 10 20 30 40 50 60 70 80 90 pF1KSD DRTIPLIVTGTPSKGFDEKAYL--SAKQLKAGED--PY------------RQHAFNQLES .:. .. : : . .: . .:... ::. :: :...:: : CCDS43 KKTF-FLGDGQKLKDWHDKEAIRRDAQRVGNGEQGRPYPMTDAERVDQAYRENGFNIYVS 60 70 80 90 100 110 100 110 120 130 140 150 pF1KSD DKLSPDRPIRDTRHYSCPSVSYSSDLPATSVIITFHNEARSTLLRTVKSVLNRTPANLIQ ::.: .: . : :: .: : : :: ::.:: ::::. :.:::::.:::::.: .:. CCDS43 DKISLNRSLPDIRHPNCNSKRYLETLPNTSIIIPFHNEGWSSLLRTVHSVLNRSPPELVA 120 130 140 150 160 170 160 170 180 190 200 210 pF1KSD EIILVDDFSS-----DP-EDCLLLTRIPKVKCLRNDRREGLIRSRVRGADVAAATVLTFL ::.::::::. : :: . : .:.:. ::. .::::::.:. ::.::.. :.::: CCDS43 EIVLVDDFSDREHLKKPLEDYMAL--FPSVRILRTKKREGLIRTRMLGASVATGDVITFL 180 190 200 210 220 230 220 230 240 250 260 pF1KSD DSHCEVNTEWLPPMLQRVKEDHTRVVSPIIDVISLDNFAYLAASAD-LRGGFDWSLHFKW :::::.:..::::.:.:. ... .: :.::::. :.: : . ..: .::.::: ...: CCDS43 DSHCEANVNWLPPLLDRIARNRKTIVCPMIDVIDHDDFRYETQAGDAMRGAFDWEMYYK- 240 250 260 270 280 290 270 280 290 300 310 320 pF1KSD EQIPLEQKMTRTDPTRPIRTPVIAGGIFVIDKSWFNHLGKYDAQMDIWGGENFELSFRVW .::. .. ..::. :...::.:::.:..:..:: .:: :: ..:::::..:.::.:: CCDS43 -RIPIPPELQKADPSDPFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEISFKVW 300 310 320 330 340 350 330 340 350 360 370 380 pF1KSD MCGGSLEIVPCSRVGHVFRKRHPYNFPEGNALTYIRNTKRTAEVWMDEYKQYYYEARPSA :::: .: .:::::::..:: ::. : : .:. :: ::.:::::::: .: :. :: CCDS43 MCGGRMEDIPCSRVGHIYRKYVPYKVPAGVSLA--RNLKRVAEVWMDEYAEYIYQRRPEY 360 370 380 390 400 410 390 400 410 420 430 440 pF1KSD IGKAFGSVATRIEQRKKMNCKSFRWYLENV---YPELTVPVKE--ALPGIIKQ-GVN-CL . :.::.. . :...:::::.:.. .. :.. ::. : : :.. :.. : CCDS43 RHLSAGDVAVQKKLRSSLNCKSFKWFMTKIAWDLPKFYPPVEPPAAAWGEIRNVGTGLCA 420 430 440 450 460 470 450 460 470 480 490 pF1KSD ESQGQNTAGDFLLGMGICRGSAKNP-QPAQAWLFSDHLIQQQGKCLAATSTLMS--SPGS ... ... :. : : :: .. . :.. :. . . : . . .. : : CCDS43 DTK-HGALGSPLRLEGCVRGRGEAAWNNMQVFTFTWREDIRPGDPQHTKKFCFDAISHTS 480 490 500 510 520 530 500 510 520 530 540 pF1KSD PVILQMCNPREGKQVSLLASGPEAQQP-EGPCLRVADLGRRAPD :: : :. .:.:. . .: : :. .. .: CCDS43 PVTLYDCHSMKGNQLWKYRKDKTLYHPVSGSCMDCSESDHRIFMNTCNPSSLTQQWLFEH 540 550 560 570 580 590 CCDS43 TNSTVLEKFNRN 600 >>CCDS11915.1 GALNT1 gene_id:2589|Hs108|chr18 (559 aa) initn: 1185 init1: 601 opt: 1230 Z-score: 1430.3 bits: 274.4 E(32554): 2.4e-73 Smith-Waterman score: 1230; 38.2% identity (67.7% similar) in 526 aa overlap (1-514:1-505) 10 20 30 40 50 pF1KSD MRKIRANAIAILT-VAWILGTFYYLWQDNRAHAASSGGRGAQRAGRRSEQLREDRTIPLI :::. ... : . :.: .. : .. . . . . :: : ... . : CCDS11 MRKFAYCKVVLATSLIWVLLDMFLLLYFSECNKCDEKKERGLPAGDVLEPVQKPHEGPGE 10 20 30 40 50 60 60 70 80 90 100 110 pF1KSD VTGTPSKGFDEKAYLSAKQLKAGEDPYRQHAFNQLESDKLSPDRPIRDTRHYSCPSVSYS . : : . . .. . .. .. . :: . :. .. .: . :.: .: . : CCDS11 M-GKP-------VVIPKEDQEKMKEMFKINQFNLMASEMIALNRSLPDVRLEGCKTKVYP 70 80 90 100 110 120 130 140 150 160 170 pF1KSD SDLPATSVIITFHNEARSTLLRTVKSVLNRTPANLIQEIILVDD-----FSSDP-EDCLL ..::.:::.:.::::: :::::::.::.::.: ..:.::.:::: : . : :. . CCDS11 DNLPTTSVVIVFHNEAWSTLLRTVHSVINRSPRHMIEEIVLVDDASERDFLKRPLESYVK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD LTRIPKVKCLRNDRREGLIRSRVRGADVAAATVLTFLDSHCEVNTEWLPPMLQRVKEDHT ..: :. .: ..: ::::.:..:: :. . :.::::.::: .. :: :.: :.:.:. CCDS11 KLKVP-VHVIRMEQRSGLIRARLKGAAVSKGQVITFLDAHCECTVGWLEPLLARIKHDRR 180 190 200 210 220 230 240 250 260 270 280 290 pF1KSD RVVSPIIDVISLDNFAYLAASADLRGGFDWSLHFKWEQIPLEQKMTRT--DPTRPIRTPV :: ::::::: :.: :.:.: :::.:.:.:.: .: ...: : : : :.:::. CCDS11 TVVCPIIDVISDDTFEYMAGSDMTYGGFNWKLNFRWYPVP-QREMDRRKGDRTLPVRTPT 240 250 260 270 280 290 300 310 320 330 340 350 pF1KSD IAGGIFVIDKSWFNHLGKYDAQMDIWGGENFELSFRVWMCGGSLEIVPCSRVGHVFRKRH .:::.: ::...:...: ::: ::::::::.:.:::.:.:::.:::: ::.::::::: CCDS11 MAGGLFSIDRDYFQEIGTYDAGMDIWGGENLEISFRIWQCGGTLEIVTCSHVGHVFRKAT 300 310 320 330 340 350 360 370 380 390 400 410 pF1KSD PYNFPEGNALTYIRNTKRTAEVWMDEYKQYYYEARPSAIGKAFGSVATRIEQRKKMNCKS ::.:: :.. .:..: :::::::.:...: :.. .:....:. :.:..:: CCDS11 PYTFPGGTGQIINKNNRRLAEVWMDEFKNFFYIISPGVTKVDYGDISSRVGLRHKLQCKP 360 370 380 390 400 410 420 430 440 450 460 pF1KSD FRWYLENVYPELTVPVKEALPGIIK--QGVNCLESQGQNTAGDFLLGMGICRGSAKNPQP : :::::.::. .: . : :. . .::...... . .:. :.: . : CCDS11 FSWYLENIYPDSQIPRHYFSLGEIRNVETNQCLDNMARKE--NEKVGIFNCHGMGGN--- 420 430 440 450 460 470 480 490 500 510 520 pF1KSD AQAWLFS-DHLIQQQGKCLAATSTLMSSPGSPVILQMCNPREGKQVSLLASGPEAQQPEG :.. .. .. :. . :: .:. ..:: . :. .:.:. CCDS11 -QVFSYTANKEIRTDDLCLD-----VSKLNGPVTMLKCHHLKGNQLWEYDPVKLTLQHVN 470 480 490 500 510 530 540 pF1KSD PCLRVADLGRRAPD CCDS11 SNQCLDKATEEDSQVPSIRDCNGSRSQQWLLRNVTLPEIF 520 530 540 550 542 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 05:05:37 2016 done: Thu Nov 3 05:05:38 2016 Total Scan time: 3.340 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]