FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8376, 626 aa 1>>>pF1KB8376 626 - 626 aa - 626 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.5891+/-0.00115; mu= 12.9515+/- 0.068 mean_var=155.5657+/-32.934, 0's: 0 Z-trim(106.2): 173 B-trim: 8 in 3/48 Lambda= 0.102829 statistics sampled from 8662 (8873) to 8662 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.634), E-opt: 0.2 (0.273), width: 16 Scan time: 3.010 The best scores are: opt bits E(32554) CCDS12455.1 MAG gene_id:4099|Hs108|chr19 ( 626) 4208 637.3 1.8e-182 CCDS56090.1 MAG gene_id:4099|Hs108|chr19 ( 601) 4022 609.7 3.5e-174 CCDS12456.1 MAG gene_id:4099|Hs108|chr19 ( 582) 3869 587.0 2.3e-167 CCDS13060.1 SIGLEC1 gene_id:6614|Hs108|chr20 (1709) 578 99.3 4.5e-20 CCDS54247.1 CD22 gene_id:933|Hs108|chr19 ( 751) 471 83.0 1.5e-15 CCDS12457.1 CD22 gene_id:933|Hs108|chr19 ( 847) 471 83.1 1.7e-15 CCDS54249.1 CD22 gene_id:933|Hs108|chr19 ( 670) 413 74.4 5.6e-13 CCDS54248.1 CD22 gene_id:933|Hs108|chr19 ( 759) 407 73.5 1.1e-12 CCDS12825.1 SIGLEC9 gene_id:27180|Hs108|chr19 ( 463) 395 71.5 2.8e-12 CCDS56100.1 SIGLEC9 gene_id:27180|Hs108|chr19 ( 479) 395 71.5 2.8e-12 >>CCDS12455.1 MAG gene_id:4099|Hs108|chr19 (626 aa) initn: 4208 init1: 4208 opt: 4208 Z-score: 3389.5 bits: 637.3 E(32554): 1.8e-182 Smith-Waterman score: 4208; 100.0% identity (100.0% similar) in 626 aa overlap (1-626:1-626) 10 20 30 40 50 60 pF1KB8 MIFLTALPLFWIMISASRGGHWGAWMPSSISAFEGTCVSIPCRFDFPDELRPAVVHGVWY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MIFLTALPLFWIMISASRGGHWGAWMPSSISAFEGTCVSIPCRFDFPDELRPAVVHGVWY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 FNSPYPKNYPPVVFKSRTQVVHESFQGRSRLLGDLGLRNCTLLLSNVSPELGGKYYFRGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 FNSPYPKNYPPVVFKSRTQVVHESFQGRSRLLGDLGLRNCTLLLSNVSPELGGKYYFRGD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 LGGYNQYTFSEHSVLDIVNTPNIVVPPEVVAGTEVEVSCMVPDNCPELRPELSWLGHEGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LGGYNQYTFSEHSVLDIVNTPNIVVPPEVVAGTEVEVSCMVPDNCPELRPELSWLGHEGL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 GEPAVLGRLREDEGTWVQVSLLHFVPTREANGHRLGCQASFPNTTLQFEGYASMDVKYPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GEPAVLGRLREDEGTWVQVSLLHFVPTREANGHRLGCQASFPNTTLQFEGYASMDVKYPP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 VIVEMNSSVEAIEGSHVSLLCGADSNPPPLLTWMRDGTVLREAVAESLLLELEEVTPAED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VIVEMNSSVEAIEGSHVSLLCGADSNPPPLLTWMRDGTVLREAVAESLLLELEEVTPAED 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 GVYACLAENAYGQDNRTVGLSVMYAPWKPTVNGTMVAVEGETVSILCSTQSNPDPILTIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GVYACLAENAYGQDNRTVGLSVMYAPWKPTVNGTMVAVEGETVSILCSTQSNPDPILTIF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 KEKQILSTVIYESELQLELPAVSPEDDGEYWCVAENQYGQRATAFNLSVEFAPVLLLESH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KEKQILSTVIYESELQLELPAVSPEDDGEYWCVAENQYGQRATAFNLSVEFAPVLLLESH 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB8 CAAARDTVQCLCVVKSNPEPSVAFELPSRNVTVNESEREFVYSERSGLVLTSILTLRGQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 CAAARDTVQCLCVVKSNPEPSVAFELPSRNVTVNESEREFVYSERSGLVLTSILTLRGQA 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB8 QAPPRVICTARNLYGAKSLELPFQGAHRLMWAKIGPVGAVVAFAILIAIVCYITQTRRKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 QAPPRVICTARNLYGAKSLELPFQGAHRLMWAKIGPVGAVVAFAILIAIVCYITQTRRKK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB8 NVTESPSFSAGDNPPVLFSSDFRISGAPEKYESERRLGSERRLLGLRGEPPELDLSYSHS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 NVTESPSFSAGDNPPVLFSSDFRISGAPEKYESERRLGSERRLLGLRGEPPELDLSYSHS 550 560 570 580 590 600 610 620 pF1KB8 DLGKRPTKDSYTLTEELAEYAEIRVK :::::::::::::::::::::::::: CCDS12 DLGKRPTKDSYTLTEELAEYAEIRVK 610 620 >>CCDS56090.1 MAG gene_id:4099|Hs108|chr19 (601 aa) initn: 4022 init1: 4022 opt: 4022 Z-score: 3240.6 bits: 609.7 E(32554): 3.5e-174 Smith-Waterman score: 4022; 100.0% identity (100.0% similar) in 601 aa overlap (26-626:1-601) 10 20 30 40 50 60 pF1KB8 MIFLTALPLFWIMISASRGGHWGAWMPSSISAFEGTCVSIPCRFDFPDELRPAVVHGVWY ::::::::::::::::::::::::::::::::::: CCDS56 MPSSISAFEGTCVSIPCRFDFPDELRPAVVHGVWY 10 20 30 70 80 90 100 110 120 pF1KB8 FNSPYPKNYPPVVFKSRTQVVHESFQGRSRLLGDLGLRNCTLLLSNVSPELGGKYYFRGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 FNSPYPKNYPPVVFKSRTQVVHESFQGRSRLLGDLGLRNCTLLLSNVSPELGGKYYFRGD 40 50 60 70 80 90 130 140 150 160 170 180 pF1KB8 LGGYNQYTFSEHSVLDIVNTPNIVVPPEVVAGTEVEVSCMVPDNCPELRPELSWLGHEGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 LGGYNQYTFSEHSVLDIVNTPNIVVPPEVVAGTEVEVSCMVPDNCPELRPELSWLGHEGL 100 110 120 130 140 150 190 200 210 220 230 240 pF1KB8 GEPAVLGRLREDEGTWVQVSLLHFVPTREANGHRLGCQASFPNTTLQFEGYASMDVKYPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 GEPAVLGRLREDEGTWVQVSLLHFVPTREANGHRLGCQASFPNTTLQFEGYASMDVKYPP 160 170 180 190 200 210 250 260 270 280 290 300 pF1KB8 VIVEMNSSVEAIEGSHVSLLCGADSNPPPLLTWMRDGTVLREAVAESLLLELEEVTPAED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 VIVEMNSSVEAIEGSHVSLLCGADSNPPPLLTWMRDGTVLREAVAESLLLELEEVTPAED 220 230 240 250 260 270 310 320 330 340 350 360 pF1KB8 GVYACLAENAYGQDNRTVGLSVMYAPWKPTVNGTMVAVEGETVSILCSTQSNPDPILTIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 GVYACLAENAYGQDNRTVGLSVMYAPWKPTVNGTMVAVEGETVSILCSTQSNPDPILTIF 280 290 300 310 320 330 370 380 390 400 410 420 pF1KB8 KEKQILSTVIYESELQLELPAVSPEDDGEYWCVAENQYGQRATAFNLSVEFAPVLLLESH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 KEKQILSTVIYESELQLELPAVSPEDDGEYWCVAENQYGQRATAFNLSVEFAPVLLLESH 340 350 360 370 380 390 430 440 450 460 470 480 pF1KB8 CAAARDTVQCLCVVKSNPEPSVAFELPSRNVTVNESEREFVYSERSGLVLTSILTLRGQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 CAAARDTVQCLCVVKSNPEPSVAFELPSRNVTVNESEREFVYSERSGLVLTSILTLRGQA 400 410 420 430 440 450 490 500 510 520 530 540 pF1KB8 QAPPRVICTARNLYGAKSLELPFQGAHRLMWAKIGPVGAVVAFAILIAIVCYITQTRRKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 QAPPRVICTARNLYGAKSLELPFQGAHRLMWAKIGPVGAVVAFAILIAIVCYITQTRRKK 460 470 480 490 500 510 550 560 570 580 590 600 pF1KB8 NVTESPSFSAGDNPPVLFSSDFRISGAPEKYESERRLGSERRLLGLRGEPPELDLSYSHS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 NVTESPSFSAGDNPPVLFSSDFRISGAPEKYESERRLGSERRLLGLRGEPPELDLSYSHS 520 530 540 550 560 570 610 620 pF1KB8 DLGKRPTKDSYTLTEELAEYAEIRVK :::::::::::::::::::::::::: CCDS56 DLGKRPTKDSYTLTEELAEYAEIRVK 580 590 600 >>CCDS12456.1 MAG gene_id:4099|Hs108|chr19 (582 aa) initn: 4035 init1: 3869 opt: 3869 Z-score: 3118.1 bits: 587.0 E(32554): 2.3e-167 Smith-Waterman score: 3869; 99.8% identity (100.0% similar) in 574 aa overlap (1-574:1-574) 10 20 30 40 50 60 pF1KB8 MIFLTALPLFWIMISASRGGHWGAWMPSSISAFEGTCVSIPCRFDFPDELRPAVVHGVWY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MIFLTALPLFWIMISASRGGHWGAWMPSSISAFEGTCVSIPCRFDFPDELRPAVVHGVWY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 FNSPYPKNYPPVVFKSRTQVVHESFQGRSRLLGDLGLRNCTLLLSNVSPELGGKYYFRGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 FNSPYPKNYPPVVFKSRTQVVHESFQGRSRLLGDLGLRNCTLLLSNVSPELGGKYYFRGD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 LGGYNQYTFSEHSVLDIVNTPNIVVPPEVVAGTEVEVSCMVPDNCPELRPELSWLGHEGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LGGYNQYTFSEHSVLDIVNTPNIVVPPEVVAGTEVEVSCMVPDNCPELRPELSWLGHEGL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 GEPAVLGRLREDEGTWVQVSLLHFVPTREANGHRLGCQASFPNTTLQFEGYASMDVKYPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GEPAVLGRLREDEGTWVQVSLLHFVPTREANGHRLGCQASFPNTTLQFEGYASMDVKYPP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 VIVEMNSSVEAIEGSHVSLLCGADSNPPPLLTWMRDGTVLREAVAESLLLELEEVTPAED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VIVEMNSSVEAIEGSHVSLLCGADSNPPPLLTWMRDGTVLREAVAESLLLELEEVTPAED 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 GVYACLAENAYGQDNRTVGLSVMYAPWKPTVNGTMVAVEGETVSILCSTQSNPDPILTIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GVYACLAENAYGQDNRTVGLSVMYAPWKPTVNGTMVAVEGETVSILCSTQSNPDPILTIF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 KEKQILSTVIYESELQLELPAVSPEDDGEYWCVAENQYGQRATAFNLSVEFAPVLLLESH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KEKQILSTVIYESELQLELPAVSPEDDGEYWCVAENQYGQRATAFNLSVEFAPVLLLESH 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB8 CAAARDTVQCLCVVKSNPEPSVAFELPSRNVTVNESEREFVYSERSGLVLTSILTLRGQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 CAAARDTVQCLCVVKSNPEPSVAFELPSRNVTVNESEREFVYSERSGLVLTSILTLRGQA 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB8 QAPPRVICTARNLYGAKSLELPFQGAHRLMWAKIGPVGAVVAFAILIAIVCYITQTRRKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 QAPPRVICTARNLYGAKSLELPFQGAHRLMWAKIGPVGAVVAFAILIAIVCYITQTRRKK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB8 NVTESPSFSAGDNPPVLFSSDFRISGAPEKYESERRLGSERRLLGLRGEPPELDLSYSHS :::::::::::::::::::::::::::::::::. CCDS12 NVTESPSFSAGDNPPVLFSSDFRISGAPEKYESKEVSTLESH 550 560 570 580 610 620 pF1KB8 DLGKRPTKDSYTLTEELAEYAEIRVK >>CCDS13060.1 SIGLEC1 gene_id:6614|Hs108|chr20 (1709 aa) initn: 342 init1: 105 opt: 578 Z-score: 473.8 bits: 99.3 E(32554): 4.5e-20 Smith-Waterman score: 578; 26.1% identity (60.2% similar) in 540 aa overlap (1-521:1-522) 10 20 30 40 50 pF1KB8 MIFLTALPLFWIMISASRGGHWGAWMPSSISAFEGTCVSIPCRFDFPDELR-PAVVHGVW : :: : :. .. :.... ::. :..... .:.:. ::: :.:: ... : . ..: CCDS13 MGFLPKLLLLASFFPAGQAS-WGVSSPQDVQGVKGSCLLIPCIFSFPADVEVPDGITAIW 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 YFNSPYPKNYPPVVFKSRTQVVHESFQGRSRLLGDLGLRNCTLLLSNVSPELGGKYYFRG :.. : . : .. ..:. :.::....:. : :.:::....:: .:.: :: CCDS13 YYD--YSGQRQVVSHSADPKLVEARFRGRTEFMGNPEHRVCNLLLKDLQPEDSGSYNFRF 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 DLGGYNQYTFSEHSVLDIVN---TPNIVVPPEVVAGTEVEVSCMVPDNCPELRPELSWLG ... :... . ... ... .:.:. : :.. ::::. .: .: : . . .:.: : CCDS13 EISEVNRWSDVKGTLVTVTEEPRVPTIASPVELLEGTEVDFNCSTPYVCLQEQVRLQWQG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 HEGLGEPAVLGRLREDEGTWVQVSLLHFVPTREANGHRLGCQASFPNTTLQFEGYASMDV .. . .. : :. .. ::.. . . .:. : :: : : : : . ..: CCDS13 QDPARSVTFNSQKFEPTGVG-HLETLHMAMSWQDHGRILRCQLSVANHRAQSEIH--LQV 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 KYPPVIVEM---NSSVEAIEGSHVSLLCGADSNPPPL--LTWMRDGTVLREAVAESLLLE :: : :.. :. . . : :.: : ..:. : . . :..::. :. ... .:. CCDS13 KYAPKGVKILLSPSGRNILPGELVTLTCQVNSSYPAVSSIKWLKDGVRLQ---TKTGVLH 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 LEEVTPAEDGVYACLAENAYGQD-NRTVGLSVMYAPWKPTVNGTMVAVEGETVSILCSTQ : ... .. :::.: :::. :. . ..: ...: . . : . .:..::...:.: CCDS13 LPQAAWSDAGVYTCQAENGVGSLVSPPISLHIFMAEVQVSPAGPI--LENQTVTLVCNTP 300 310 320 330 340 360 370 380 390 400 pF1KB8 SN-PDPILTIFKEKQILSTVIYESELQLELPAVSPEDDGEYWCVAENQYG-QRATAFNLS .. :. . . ....: . :.:.: .. : : :.: ..: .: .:. .. CCDS13 NEAPSDLRYSWYKNHVLLEDAHSHTLRLHL--ATRADTGFYFCEVQNVHGSERSGPVSVV 350 360 370 380 390 400 410 420 430 440 450 460 pF1KB8 VEFAPVL-LLESHCAAARDTVQCL-CVVKSNPEPSVAFELPSRNV--TVNESEREFVYSE :. :. .: . . : : : : :.: .... .. . : ..:.. .: CCDS13 VNHPPLTPVLTAFLETQAGLVGILHCSVVSEPLATLVLSHGGHILASTSGDSDHSPRFSG 410 420 430 440 450 460 470 480 490 500 510 520 pF1KB8 RSGLVLTSI-LTLRGQAQAPP-RVICTARNLYGAKSLELPFQG-AHRLMWAKIGPVGAVV :: .:. : .: .. . :.: : : . : :.. : ::. :.:.. :: CCDS13 TSG--PNSLRLEIRDLEETDSGEYKCSATNSLGNATSTLDFHANAARLL---ISPAAEVV 470 480 490 500 510 520 530 540 550 560 570 580 pF1KB8 AFAILIAIVCYITQTRRKKNVTESPSFSAGDNPPVLFSSDFRISGAPEKYESERRLGSER CCDS13 EGQAVTLSCRSGLSPTPDARFSWYLNGALLHEGPGSSLLLPAASSTDAGSYHCRARDGHS 530 540 550 560 570 580 >>CCDS54247.1 CD22 gene_id:933|Hs108|chr19 (751 aa) initn: 318 init1: 118 opt: 471 Z-score: 392.4 bits: 83.0 E(32554): 1.5e-15 Smith-Waterman score: 475; 28.4% identity (54.2% similar) in 472 aa overlap (3-451:7-469) 10 20 30 40 50 pF1KB8 MIFLTALPLFWIMISASRGGHWGAWMPSSISAFEGTCVSIPCRFDFPD-ELRPAVV .: : : .. .: : ..: : .. :.::.:: ::: . : .:. .. CCDS54 MHLLGPWLLLLVLEYLAFSDS--SKWVFEHPETLYAWEGACVWIPCTYRALDGDLESFIL 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 HGVWYFNSPYPKNYPPVVFKSRTQVVHESFQGRSRLLGDLGLRNCTLLLSNVSPELGGKY .:. : ...: . : : : ..::: . .:::: . : . .:. CCDS54 FHNPEYNKNTSKFDGTRLYESTKDGKVPSEQKRVQFLGDKN-KNCTLSIHPVHLNDSGQL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 YFRGDLGGYNQYTFSEHSVLDIVNTPNIVVPPEVVAGTEVEVSCMVPDNCPELRPELSWL .: . . . . .: . :.: .:::. . :: ..:.. .: .:.:: CCDS54 GLRMESKTEKWMERIHLNVSERPFPPHIQLPPEIQESQEVTLTCLLNFSCYGYPIQLQWL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 GHEG--LGEPAVLGRLREDEGTWVQVSLLHFVPTREANGHRLGCQASFPNTTLQFEGYAS :: . . :: . ...... : :.: : .:. . :: . . . . .. CCDS54 -LEGVPMRQAAVTSTSLTIKSVFTR-SELKFSPQWSHHGKIVTCQLQDADGKFLSNDTVQ 180 190 200 210 220 230 240 250 260 270 280 pF1KB8 MDVKYPPVIVEMNSSVEAI--EGSHVSLLCGADSNPPPLLT--WMRDGTVLREAVAESLL ..::. : . . .:: ::. :.. : ..:. : : :..::: :.. ... CCDS54 LNVKHTPKLEIKVTPSDAIVREGDSVTMTCEVSSSNPEYTTVSWLKDGTSLKKQ--NTFT 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB8 LELEEVTPAEDGVYACLAENAYGQD-NRTVGLSVMYAPWKPTVNGTMV-AVEGETVSILC :.:.::: ..: : : . : : .. : :.:.::: ::. :::: : .:: CCDS54 LNLREVTKDQSGKYCCQVSNDVGPGRSEEVFLQVQYAPEPSTVQILHSPAVEGSQVEFLC 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB8 STQSNPDPILTIFKEKQILSTVIYESELQLELPAVSPEDDGEYWCVAENQYG--QRATAF . .:: : : . . . . ..: ....: . : : : ::::: : ::. . CCDS54 MSLANPLP--TNYTWYHNGKEMQGRTEEKVHIPKILPWHAGTYSCVAENILGTGQRGPGA 360 370 380 390 400 410 410 420 430 440 450 pF1KB8 NLSVEFAP--VLLLESHCAAAR--DTVQCLCVVKS-NP-------EPSVAFELPSRNVTV .:.:.. : : . .. : ::: : .: :: .: :.: :: .: CCDS54 ELDVQYPPKKVTTVIQNPMPIREGDTVTLSCNYNSSNPSVTRYEWKPHGAWEEPSLGVLK 420 430 440 450 460 470 460 470 480 490 500 510 pF1KB8 NESEREFVYSERSGLVLTSILTLRGQAQAPPRVICTARNLYGAKSLELPFQGAHRLMWAK CCDS54 IQNVGWDNTTIACAACNSWCSWASPVALNVQYAPRDVRVRKIKPLSEIHSGNSVSLQCDF 480 490 500 510 520 530 >>CCDS12457.1 CD22 gene_id:933|Hs108|chr19 (847 aa) initn: 306 init1: 118 opt: 471 Z-score: 391.8 bits: 83.1 E(32554): 1.7e-15 Smith-Waterman score: 475; 28.4% identity (54.2% similar) in 472 aa overlap (3-451:7-469) 10 20 30 40 50 pF1KB8 MIFLTALPLFWIMISASRGGHWGAWMPSSISAFEGTCVSIPCRFDFPD-ELRPAVV .: : : .. .: : ..: : .. :.::.:: ::: . : .:. .. CCDS12 MHLLGPWLLLLVLEYLAFSDS--SKWVFEHPETLYAWEGACVWIPCTYRALDGDLESFIL 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 HGVWYFNSPYPKNYPPVVFKSRTQVVHESFQGRSRLLGDLGLRNCTLLLSNVSPELGGKY .:. : ...: . : : : ..::: . .:::: . : . .:. CCDS12 FHNPEYNKNTSKFDGTRLYESTKDGKVPSEQKRVQFLGDKN-KNCTLSIHPVHLNDSGQL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 YFRGDLGGYNQYTFSEHSVLDIVNTPNIVVPPEVVAGTEVEVSCMVPDNCPELRPELSWL .: . . . . .: . :.: .:::. . :: ..:.. .: .:.:: CCDS12 GLRMESKTEKWMERIHLNVSERPFPPHIQLPPEIQESQEVTLTCLLNFSCYGYPIQLQWL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 GHEG--LGEPAVLGRLREDEGTWVQVSLLHFVPTREANGHRLGCQASFPNTTLQFEGYAS :: . . :: . ...... : :.: : .:. . :: . . . . .. CCDS12 -LEGVPMRQAAVTSTSLTIKSVFTR-SELKFSPQWSHHGKIVTCQLQDADGKFLSNDTVQ 180 190 200 210 220 230 240 250 260 270 280 pF1KB8 MDVKYPPVIVEMNSSVEAI--EGSHVSLLCGADSNPPPLLT--WMRDGTVLREAVAESLL ..::. : . . .:: ::. :.. : ..:. : : :..::: :.. ... CCDS12 LNVKHTPKLEIKVTPSDAIVREGDSVTMTCEVSSSNPEYTTVSWLKDGTSLKKQ--NTFT 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB8 LELEEVTPAEDGVYACLAENAYGQD-NRTVGLSVMYAPWKPTVNGTMV-AVEGETVSILC :.:.::: ..: : : . : : .. : :.:.::: ::. :::: : .:: CCDS12 LNLREVTKDQSGKYCCQVSNDVGPGRSEEVFLQVQYAPEPSTVQILHSPAVEGSQVEFLC 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB8 STQSNPDPILTIFKEKQILSTVIYESELQLELPAVSPEDDGEYWCVAENQYG--QRATAF . .:: : : . . . . ..: ....: . : : : ::::: : ::. . CCDS12 MSLANPLP--TNYTWYHNGKEMQGRTEEKVHIPKILPWHAGTYSCVAENILGTGQRGPGA 360 370 380 390 400 410 410 420 430 440 450 pF1KB8 NLSVEFAP--VLLLESHCAAAR--DTVQCLCVVKS-NP-------EPSVAFELPSRNVTV .:.:.. : : . .. : ::: : .: :: .: :.: :: .: CCDS12 ELDVQYPPKKVTTVIQNPMPIREGDTVTLSCNYNSSNPSVTRYEWKPHGAWEEPSLGVLK 420 430 440 450 460 470 460 470 480 490 500 510 pF1KB8 NESEREFVYSERSGLVLTSILTLRGQAQAPPRVICTARNLYGAKSLELPFQGAHRLMWAK CCDS12 IQNVGWDNTTIACAACNSWCSWASPVALNVQYAPRDVRVRKIKPLSEIHSGNSVSLQCDF 480 490 500 510 520 530 >>CCDS54249.1 CD22 gene_id:933|Hs108|chr19 (670 aa) initn: 197 init1: 146 opt: 413 Z-score: 346.5 bits: 74.4 E(32554): 5.6e-13 Smith-Waterman score: 426; 23.8% identity (52.1% similar) in 634 aa overlap (3-609:7-612) 10 20 30 40 50 pF1KB8 MIFLTALPLFWIMISASRGGHWGAWMPSSISAFEGTCVSIPCRFDFPD-ELRPAVV .: : : .. .: : ..: : .. :.::.:: ::: . : .:. .. CCDS54 MHLLGPWLLLLVLEYLAFSDS--SKWVFEHPETLYAWEGACVWIPCTYRALDGDLESFIL 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 HGVWYFNSPYPKNYPPVVFKSRTQVVHESFQGRSRLLGDLGLRNCTLLLSNVSPELGGKY .:. : ...: . : : : ..::: . .:::: . : . .:. CCDS54 FHNPEYNKNTSKFDGTRLYESTKDGKVPSEQKRVQFLGDKN-KNCTLSIHPVHLNDSGQL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 YFRGDLGGYNQYTFSEHSVLDIVNTPNIVVPPEVVAGTEVEVSCMVPDNCPELRPELSWL .: . . . . .: . :.: .:::. . :: ..:.. .: .:.:: CCDS54 GLRMESKTEKWMERIHLNVSERPFPPHIQLPPEIQESQEVTLTCLLNFSCYGYPIQLQWL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 GHEG--LGEPAVLGRLREDEGTWVQVSLLHFVPTREANGHRLGCQASFPNTTLQFEGYAS :: . . :: . ...... : :.: : .:. . :: . . . . .. CCDS54 -LEGVPMRQAAVTSTSLTIKSVFTR-SELKFSPQWSHHGKIVTCQLQDADGKFLSNDTVQ 180 190 200 210 220 230 240 250 260 270 280 pF1KB8 MDVKYPP--VIVEMNSSVEAIEGSHVSLLCGADSNPPPLLT--WMRDGTVLREAVAESLL ..::.:: : . ... . ::. :.: :. .:. : . : :. . ... . CCDS54 LNVKHPPKKVTTVIQNPMPIREGDTVTLSCNYNSSNPSVTRYEWKPHGAWEEPSLG---V 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB8 LELEEVTPAEDGVYACLAENAYGQDNRTVGLSVMYAPWKPTVNGTMVAVE---GETVSIL :....: .. . :: : :.. . :.:.:.::: : : :..::. CCDS54 LKIQNVG-WDNTTIACAACNSWCSWASPVALNVQYAPRDVRVRKIKPLSEIHSGNSVSLQ 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB8 CSTQSNPDPILTIFKEKQILSTVIYESELQLELPAVSPEDDGEYWCVAENQYGQRAT-AF :. .:. . .: :: . . .: ::.. ..:::: : : : ..:. :: :. :. CCDS54 CDFSSSHPKEVQFFWEK---NGRLLGKESQLNFDSISPEDAGSYSCWVNNSIGQTASKAW 360 370 380 390 400 410 420 430 440 450 pF1KB8 NLSVEFAPVLLLESHCAAAR----DTVQCLCVVKSNPEPS--VAFELPSRNVTVNESER- .: : .:: : : . . .. : .:: : . :. .... . .. CCDS54 TLEVLYAPRRLRVSMSPGDQVMEGKSATLTCESDANPPVSHYTWFDWNNQSLPYHSQKLR 410 420 430 440 450 460 460 470 480 490 500 510 pF1KB8 -EFVYSERSGLVLTSILTLRGQAQAPPRVICTARNLYGAKSLELPFQGAHRLMWAKIGPV : : ..:: . . :....: . : :. ... ..:. : CCDS54 LEPVKVQHSGAYWCQGTNSVGKGRSP---LSTLTVYYSPETI------GRRVA------V 470 480 490 500 510 520 530 540 550 560 570 pF1KB8 GAVVAFAILIAIVCYITQTRRKKNVTESPSFSAGDNPPVLFSSDFRISGAPEKYESERRL : .:::: .: . :: : . . ... ... .: . .. :: . :. . : CCDS54 GLGSCLAILILAICGLKLQRRWKRTQSQQGLQENSSGQSFFVRNKKVRRAPLS-EGPHSL 520 530 540 550 560 570 580 590 600 610 620 pF1KB8 GSERRLL--GLRGEP---PELDLSYS---HSDLGKRPTKDSYTLTEELAEYAEIRVK : .. :. ::... . .:. .:: : CCDS54 GCYNPMMEDGISYTTLRFPEMNIPRTGDAESSEMQRPPPDCDDTVTYSALHKRQVGDYEN 580 590 600 610 620 630 CCDS54 VIPDFPEDEGIHYSELIQFGVGERPQAQENVDYVILKH 640 650 660 670 >>CCDS54248.1 CD22 gene_id:933|Hs108|chr19 (759 aa) initn: 259 init1: 118 opt: 407 Z-score: 341.0 bits: 73.5 E(32554): 1.1e-12 Smith-Waterman score: 407; 27.0% identity (55.5% similar) in 422 aa overlap (3-413:7-417) 10 20 30 40 50 pF1KB8 MIFLTALPLFWIMISASRGGHWGAWMPSSISAFEGTCVSIPCRFDFPD-ELRPAVV .: : : .. .: : ..: : .. :.::.:: ::: . : .:. .. CCDS54 MHLLGPWLLLLVLEYLAFSDS--SKWVFEHPETLYAWEGACVWIPCTYRALDGDLESFIL 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 HGVWYFNSPYPKNYPPVVFKSRTQVVHESFQGRSRLLGDLGLRNCTLLLSNVSPELGGKY .:. : ...: . : : : ..::: . .:::: . : . .:. CCDS54 FHNPEYNKNTSKFDGTRLYESTKDGKVPSEQKRVQFLGDKN-KNCTLSIHPVHLNDSGQL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 YFRGDLGGYNQYTFSEHSVLDIVNTPNIVVPPEVVAGTEVEVSCMVPDNCPELRPELSWL .: . . . . .: . :.: .:::. . :: ..:.. .: .:.:: CCDS54 GLRMESKTEKWMERIHLNVSERPFPPHIQLPPEIQESQEVTLTCLLNFSCYGYPIQLQWL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 GHEG--LGEPAVLGRLREDEGTWVQVSLLHFVPTREANGHRLGCQASFPNTTLQFEGYAS :: . . :: . ...... : :.: : .:. . :: . . . . .. CCDS54 -LEGVPMRQAAVTSTSLTIKSVFTR-SELKFSPQWSHHGKIVTCQLQDADGKFLSNDTVQ 180 190 200 210 220 230 240 250 260 270 280 pF1KB8 MDVKYPPVIVEMNSSVEAI--EGSHVSLLCGADSNPPPLLT--WMRDGTVLREAVAESLL ..::. : . . .:: ::. :.. : ..:. : : :..::: :.. ... CCDS54 LNVKHTPKLEIKVTPSDAIVREGDSVTMTCEVSSSNPEYTTVSWLKDGTSLKK--QNTFT 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB8 LELEEVTPAEDGVYACLAENAYGQD-NRTVGLSVMYAPWKPT--VNGTMVAVEGETVSIL :.:.::: ..: : : . : : .. : :.:.: : : : ... : ::.::.. CCDS54 LNLREVTKDQSGKYCCQVSNDVGPGRSEEVFLQVQYPPKKVTTVIQNPMPIREGDTVTLS 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB8 CSTQSNPDPILTIFKEKQILSTVIYESELQ-LELPAVSPEDDGEYWCVAENQYGQRATAF :. .:. .: .: .. : . : : :.. :. :. :.: :.. . :. CCDS54 CNYNSS-NPSVTRYEWKP--HGAWEEPSLGVLKIQNVG-WDNTTIACAACNSWCSWASPV 360 370 380 390 400 410 420 430 440 450 460 pF1KB8 NLSVEFAPVLLLESHCAAARDTVQCLCVVKSNPEPSVAFELPSRNVTVNESEREFVYSER :.:..:: CCDS54 ALNVQYAPRDVRVRKIKPLSEIHSGNSVSLQCDFSSSHPKEVQFFWEKNGRLLGKESQLN 410 420 430 440 450 460 >>CCDS12825.1 SIGLEC9 gene_id:27180|Hs108|chr19 (463 aa) initn: 353 init1: 140 opt: 395 Z-score: 334.0 bits: 71.5 E(32554): 2.8e-12 Smith-Waterman score: 446; 27.2% identity (56.8% similar) in 375 aa overlap (2-348:1-362) 10 20 30 40 50 pF1KB8 MIFLTALPLFWIMISASRGGHWGAWMPSSISAFEGTCVSIPCRFDFPDE--LRPA-VVHG ..: :::.: : : ::... :: :: .:: :..:.. . :. :::: CCDS12 MLLLLLPLLWGRERAEGQTSKLLTMQSSVTVQEGLCVHVPCSFSYPSHGWIYPGPVVHG 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 VWYFNSPYPKNYPPVVFKSRTQVVHESFQGRSRLLGDLGLRNCTLLLSNVSPELGGKYYF :. .. . ::. .. ...: : . : .:::: .:::: . .. .:.:.: CCDS12 YWFREGANTDQDAPVATNNPARAVWEETRDRFHLLGDPHTKNCTLSIRDARRSDAGRYFF 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 RGDLGGYNQYTFSEH----SVLDIVNTPNIVVPPEVVAGTEVEVSCMVPDNCPELRPEL- : . :. ......: .: ... :::..: . .: ...: :: : . : . CCDS12 RMEKGSI-KWNYKHHRLSVNVTALTHRPNILIPGTLESGCPQNLTCSVPWACEQGTPPMI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 SWLGHEGLGEPAVLGRLREDEGTWVQVSLLHFVPTREANGHRLGCQASFPNTTLQFEGYA ::.: . .. : : .: .. :.: ..: . .: : ::..::.... . . CCDS12 SWIG-------TSVSPL--DPST-TRSSVLTLIPQPQDHGTSLTCQVTFPGASVTTNKTV 180 190 200 210 220 240 250 260 270 pF1KB8 SMDVKYPPVIVEMN---------------SSVEAIEGSHVSLLCGAD---SNPPPLLT-- ..:.::: . :. ::. ::. . :.:..: :::: :. CCDS12 HLNVSYPPQNLTMTVFQGDGTVSTVLGNGSSLSLPEGQSLRLVCAVDAVDSNPPARLSLS 230 240 250 260 270 280 280 290 300 310 320 330 pF1KB8 WMRDGTVLREAVAESLLLELEEVTPAEDGVYACLAENAYGQDNRTVGLSVMYAPWKPTVN : : :. .. .::: : . . ..: :.: :... ...:.. . ... CCDS12 W-RGLTLCPSQPSNPGVLELPWVHLRDAAEFTCRAQNPLGSQQVYLNVSLQSKATSGVTQ 290 300 310 320 330 340 340 350 360 370 380 390 pF1KB8 GTMVAVEGETVSILCSTQSNPDPILTIFKEKQILSTVIYESELQLELPAVSPEDDGEYWC : .:. : :. .. : CCDS12 G-VVGGAGATALVFLSFCVIFVVVRSCRKKSARPAAGVGDTGIEDANAVRGSASQGPLTE 350 360 370 380 390 400 >>CCDS56100.1 SIGLEC9 gene_id:27180|Hs108|chr19 (479 aa) initn: 353 init1: 140 opt: 395 Z-score: 333.8 bits: 71.5 E(32554): 2.8e-12 Smith-Waterman score: 446; 27.2% identity (56.8% similar) in 375 aa overlap (2-348:1-362) 10 20 30 40 50 pF1KB8 MIFLTALPLFWIMISASRGGHWGAWMPSSISAFEGTCVSIPCRFDFPDE--LRPA-VVHG ..: :::.: : : ::... :: :: .:: :..:.. . :. :::: CCDS56 MLLLLLPLLWGRERAEGQTSKLLTMQSSVTVQEGLCVHVPCSFSYPSHGWIYPGPVVHG 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 VWYFNSPYPKNYPPVVFKSRTQVVHESFQGRSRLLGDLGLRNCTLLLSNVSPELGGKYYF :. .. . ::. .. ...: : . : .:::: .:::: . .. .:.:.: CCDS56 YWFREGANTDQDAPVATNNPARAVWEETRDRFHLLGDPHTKNCTLSIRDARRSDAGRYFF 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 RGDLGGYNQYTFSEH----SVLDIVNTPNIVVPPEVVAGTEVEVSCMVPDNCPELRPEL- : . :. ......: .: ... :::..: . .: ...: :: : . : . CCDS56 RMEKGSI-KWNYKHHRLSVNVTALTHRPNILIPGTLESGCPQNLTCSVPWACEQGTPPMI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 SWLGHEGLGEPAVLGRLREDEGTWVQVSLLHFVPTREANGHRLGCQASFPNTTLQFEGYA ::.: . .. : : .: .. :.: ..: . .: : ::..::.... . . CCDS56 SWIG-------TSVSPL--DPST-TRSSVLTLIPQPQDHGTSLTCQVTFPGASVTTNKTV 180 190 200 210 220 240 250 260 270 pF1KB8 SMDVKYPPVIVEMN---------------SSVEAIEGSHVSLLCGAD---SNPPPLLT-- ..:.::: . :. ::. ::. . :.:..: :::: :. CCDS56 HLNVSYPPQNLTMTVFQGDGTVSTVLGNGSSLSLPEGQSLRLVCAVDAVDSNPPARLSLS 230 240 250 260 270 280 280 290 300 310 320 330 pF1KB8 WMRDGTVLREAVAESLLLELEEVTPAEDGVYACLAENAYGQDNRTVGLSVMYAPWKPTVN : : :. .. .::: : . . ..: :.: :... ...:.. . ... CCDS56 W-RGLTLCPSQPSNPGVLELPWVHLRDAAEFTCRAQNPLGSQQVYLNVSLQSKATSGVTQ 290 300 310 320 330 340 340 350 360 370 380 390 pF1KB8 GTMVAVEGETVSILCSTQSNPDPILTIFKEKQILSTVIYESELQLELPAVSPEDDGEYWC : .:. : :. .. : CCDS56 G-VVGGAGATALVFLSFCVIFVVVRSCRKKSARPAAGVGDTGIEDANAVRGSASQILNHF 350 360 370 380 390 400 626 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 12:22:31 2016 done: Fri Nov 4 12:22:31 2016 Total Scan time: 3.010 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]