FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5565, 737 aa 1>>>pF1KB5565 737 - 737 aa - 737 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.1957+/-0.00105; mu= 19.8911+/- 0.063 mean_var=58.8864+/-11.996, 0's: 0 Z-trim(101.7): 26 B-trim: 0 in 0/51 Lambda= 0.167135 statistics sampled from 6624 (6639) to 6624 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.555), E-opt: 0.2 (0.204), width: 16 Scan time: 2.890 The best scores are: opt bits E(32554) CCDS3131.1 PLOD2 gene_id:5352|Hs108|chr3 ( 737) 5083 1234.7 0 CCDS3132.1 PLOD2 gene_id:5352|Hs108|chr3 ( 758) 3408 830.9 0 CCDS5715.1 PLOD3 gene_id:8985|Hs108|chr7 ( 738) 3173 774.2 0 CCDS142.1 PLOD1 gene_id:5351|Hs108|chr1 ( 727) 3165 772.3 0 CCDS1360.1 COLGALT2 gene_id:23127|Hs108|chr1 ( 626) 304 82.4 2.4e-15 CCDS12363.1 COLGALT1 gene_id:79709|Hs108|chr19 ( 622) 242 67.4 7.5e-11 >>CCDS3131.1 PLOD2 gene_id:5352|Hs108|chr3 (737 aa) initn: 5083 init1: 5083 opt: 5083 Z-score: 6615.7 bits: 1234.7 E(32554): 0 Smith-Waterman score: 5083; 100.0% identity (100.0% similar) in 737 aa overlap (1-737:1-737) 10 20 30 40 50 60 pF1KB5 MGGCTVKPQLLLLALVLHPWNPCLGADSEKPSSIPTDKLLVITVATKESDGFHRFMQSAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MGGCTVKPQLLLLALVLHPWNPCLGADSEKPSSIPTDKLLVITVATKESDGFHRFMQSAK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 YFNYTVKVLGQGEEWRGGDGINSIGGGQKVRLMKEVMEHYADQDDLVVMFTECFDVIFAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 YFNYTVKVLGQGEEWRGGDGINSIGGGQKVRLMKEVMEHYADQDDLVVMFTECFDVIFAG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 GPEEVLKKFQKANHKVVFAADGILWPDKRLADKYPVVHIGKRYLNSGGFIGYAPYVNRIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GPEEVLKKFQKANHKVVFAADGILWPDKRLADKYPVVHIGKRYLNSGGFIGYAPYVNRIV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 QQWNLQDNDDDQLFYTKVYIDPLKREAINITLDHKCKIFQTLNGAVDEVVLKFENGKARA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 QQWNLQDNDDDQLFYTKVYIDPLKREAINITLDHKCKIFQTLNGAVDEVVLKFENGKARA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 KNTFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPNVSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KNTFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPNVSI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 GVFIEQPTPFLPRFLDILLTLDYPKEALKLFIHNKEVYHEKDIKVFFDKAKHEIKTIKIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GVFIEQPTPFLPRFLDILLTLDYPKEALKLFIHNKEVYHEKDIKVFFDKAKHEIKTIKIV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 GPEENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPLVTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GPEENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPLVTR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 HGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMNERN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 HGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMNERN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB5 YFVRDKLDPDMALCRNAREMGVFMYISNRHEFGRLLSTANYNTSHYNNDLWQIFENPVDW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 YFVRDKLDPDMALCRNAREMGVFMYISNRHEFGRLLSTANYNTSHYNNDLWQIFENPVDW 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB5 KEKYINRDYSKIFTENIVEQPCPDVFWFPIFSEKACDELVEEMEHYGKWSGGKHHDSRIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KEKYINRDYSKIFTENIVEQPCPDVFWFPIFSEKACDELVEEMEHYGKWSGGKHHDSRIS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB5 GGYENVPTDDIHMKQVDLENVWLHFIREFIAPVTLKVFAGYYTKGFALLNFVVKYSPERQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GGYENVPTDDIHMKQVDLENVWLHFIREFIAPVTLKVFAGYYTKGFALLNFVVKYSPERQ 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB5 RSLRPHHDASTFTINIALNNVGEDFQGGGCKFLRYNCSIESPRKGWSFMHPGRLTHLHEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RSLRPHHDASTFTINIALNNVGEDFQGGGCKFLRYNCSIESPRKGWSFMHPGRLTHLHEG 670 680 690 700 710 720 730 pF1KB5 LPVKNGTRYIAVSFIDP ::::::::::::::::: CCDS31 LPVKNGTRYIAVSFIDP 730 >>CCDS3132.1 PLOD2 gene_id:5352|Hs108|chr3 (758 aa) initn: 5069 init1: 3408 opt: 3408 Z-score: 4432.7 bits: 830.9 E(32554): 0 Smith-Waterman score: 5031; 97.2% identity (97.2% similar) in 758 aa overlap (1-737:1-758) 10 20 30 40 50 60 pF1KB5 MGGCTVKPQLLLLALVLHPWNPCLGADSEKPSSIPTDKLLVITVATKESDGFHRFMQSAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MGGCTVKPQLLLLALVLHPWNPCLGADSEKPSSIPTDKLLVITVATKESDGFHRFMQSAK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 YFNYTVKVLGQGEEWRGGDGINSIGGGQKVRLMKEVMEHYADQDDLVVMFTECFDVIFAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 YFNYTVKVLGQGEEWRGGDGINSIGGGQKVRLMKEVMEHYADQDDLVVMFTECFDVIFAG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 GPEEVLKKFQKANHKVVFAADGILWPDKRLADKYPVVHIGKRYLNSGGFIGYAPYVNRIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GPEEVLKKFQKANHKVVFAADGILWPDKRLADKYPVVHIGKRYLNSGGFIGYAPYVNRIV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 QQWNLQDNDDDQLFYTKVYIDPLKREAINITLDHKCKIFQTLNGAVDEVVLKFENGKARA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 QQWNLQDNDDDQLFYTKVYIDPLKREAINITLDHKCKIFQTLNGAVDEVVLKFENGKARA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 KNTFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPNVSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KNTFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPNVSI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 GVFIEQPTPFLPRFLDILLTLDYPKEALKLFIHNKEVYHEKDIKVFFDKAKHEIKTIKIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GVFIEQPTPFLPRFLDILLTLDYPKEALKLFIHNKEVYHEKDIKVFFDKAKHEIKTIKIV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 GPEENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPLVTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GPEENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPLVTR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 HGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMNERN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 HGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMNERN 430 440 450 460 470 480 490 500 510 pF1KB5 YFVRDKLDPDMALCRNAREM---------------------GVFMYISNRHEFGRLLSTA :::::::::::::::::::: ::::::::::::::::::: CCDS31 YFVRDKLDPDMALCRNAREMTLQREKDSPTPETFQMLSPPKGVFMYISNRHEFGRLLSTA 490 500 510 520 530 540 520 530 540 550 560 570 pF1KB5 NYNTSHYNNDLWQIFENPVDWKEKYINRDYSKIFTENIVEQPCPDVFWFPIFSEKACDEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 NYNTSHYNNDLWQIFENPVDWKEKYINRDYSKIFTENIVEQPCPDVFWFPIFSEKACDEL 550 560 570 580 590 600 580 590 600 610 620 630 pF1KB5 VEEMEHYGKWSGGKHHDSRISGGYENVPTDDIHMKQVDLENVWLHFIREFIAPVTLKVFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 VEEMEHYGKWSGGKHHDSRISGGYENVPTDDIHMKQVDLENVWLHFIREFIAPVTLKVFA 610 620 630 640 650 660 640 650 660 670 680 690 pF1KB5 GYYTKGFALLNFVVKYSPERQRSLRPHHDASTFTINIALNNVGEDFQGGGCKFLRYNCSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GYYTKGFALLNFVVKYSPERQRSLRPHHDASTFTINIALNNVGEDFQGGGCKFLRYNCSI 670 680 690 700 710 720 700 710 720 730 pF1KB5 ESPRKGWSFMHPGRLTHLHEGLPVKNGTRYIAVSFIDP :::::::::::::::::::::::::::::::::::::: CCDS31 ESPRKGWSFMHPGRLTHLHEGLPVKNGTRYIAVSFIDP 730 740 750 >>CCDS5715.1 PLOD3 gene_id:8985|Hs108|chr7 (738 aa) initn: 3163 init1: 2219 opt: 3173 Z-score: 4126.6 bits: 774.2 E(32554): 0 Smith-Waterman score: 3173; 58.6% identity (84.9% similar) in 734 aa overlap (8-737:8-738) 10 20 30 40 50 pF1KB5 MGGCTVKPQLLLLALVLHPWNPCLGADSEKPSS---IPTDKLLVITVATKESDGFHRFMQ :..::: .: : : .: :..: . . .::::::::: :..:. ::.. CCDS57 MTSSGPGPRFLLLLPLLLP--PAASA-SDRPRGRDPVNPEKLLVITVATAETEGYLRFLR 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 SAKYFNYTVKVLGQGEEWRGGDGINSIGGGQKVRLMKEVMEHYADQDDLVVMFTECFDVI ::..:::::..:: :::::::: ..::::::: .:. ::.:::..:...::.. .::: CCDS57 SAEFFNYTVRTLGLGEEWRGGDVARTVGGGQKVRWLKKEMEKYADREDMIIMFVDSYDVI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 FAGGPEEVLKKFQKANHKVVFAADGILWPDKRLADKYPVVHIGKRYLNSGGFIGYAPYVN .::.: :.:::: ... ...:.:... ::. ::..:: : :::.::::::::.: .. CCDS57 LAGSPTELLKKFVQSGSRLLFSAESFCWPEWGLAEQYPEVGTGKRFLNSGGFIGFATTIH 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 RIVQQWNLQDNDDDQLFYTKVYIDPLKREAINITLDHKCKIFQTLNGAVDEVVLKFENGK .::.::. .:.::::::::..:.:: :: ....:::: .:::.::::.:::::::. .. CCDS57 QIVRQWKYKDDDDDQLFYTRLYLDPGLREKLSLNLDHKSRIFQNLNGALDEVVLKFDRNR 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB5 ARAKNTFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPN .: .:. :.:::....::::::. :::.::::::.:: ..:: .:. : : . . : CCDS57 VRIRNVAYDTLPIVVHGNGPTKLQLNYLGNYVPNGWTPEGGCGFCNQDRRTLPGGQPPPR 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB5 VSIGVFIEQPTPFLPRFLDILLTLDYPKEALKLFIHNKEVYHEKDIKVFFDKAKHEIKTI : ..::.:::::::::::. :: :::: . . ::.::.::.:: : . . . ..... CCDS57 VFLAVFVEQPTPFLPRFLQRLLLLDYPPDRVTLFLHNNEVFHEPHIADSWPQLQDHFSAV 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB5 KIVGPEENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPL :.::::: :: .:::.:.::.:::: .:..:::.:::.:::: .::.::::.:::.:::. CCDS57 KLVGPEEALSPGEARDMAMDLCRQDPECEFYFSLDADAVLTNLQTLRILIEENRKVIAPM 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB5 VTRHGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMN ..:::::::::::::::: :::::::::..:: .:::::::::....:.:.: ::: :. CCDS57 LSRHGKLWSNFWGALSPDEYYARSEDYVELVQRKRVGVWNVPYISQAYVIRGDTLRMELP 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB5 ERNYFVRDKLDPDMALCRNAREMGVFMYISNRHEFGRLLSTANYNTSHYNNDLWQIFENP .:. : . :::::.:.. :. :.:...::.:::::::.:. :.: : . ::::::.:: CCDS57 QRDVFSGSDTDPDMAFCKSFRDKGIFLHLSNQHEFGRLLATSRYDTEHLHPDLWQIFDNP 480 490 500 510 520 530 540 550 560 570 580 590 pF1KB5 VDWKEKYINRDYSKIFT-ENIVEQPCPDVFWFPIFSEKACDELVEEMEHYGKWSGGKHHD :::::.::...::. . :.:::::::::.:::..::. ::::: ::::::.::::.:.: CCDS57 VDWKEQYIHENYSRALEGEGIVEQPCPDVYWFPLLSEQMCDELVAEMEHYGQWSGGRHED 540 550 560 570 580 590 600 610 620 630 640 650 pF1KB5 SRISGGYENVPTDDIHMKQVDLENVWLHFIREFIAPVTLKVFAGYYTKGFALLNFVVKYS ::..:::::::: ::::::: :. ::...: ...:.: ..: ::.::. :..::::.: CCDS57 SRLAGGYENVPTVDIHMKQVGYEDQWLQLLRTYVGPMTESLFPGYHTKARAVMNFVVRYR 600 610 620 630 640 650 660 670 680 690 700 710 pF1KB5 PERQRSLRPHHDASTFTINIALNNVGEDFQGGGCKFLRYNCSIESPRKGWSFMHPGRLTH :..: :::::::.::::.:.:::. : :..::::.::::.: : ::::::...::::::: CCDS57 PDEQPSLRPHHDSSTFTLNVALNHKGLDYEGGGCRFLRYDCVISSPRKGWALLHPGRLTH 660 670 680 690 700 710 720 730 pF1KB5 LHEGLPVKNGTRYIAVSFIDP :::::. ::::: :::.:: CCDS57 YHEGLPTTWGTRYIMVSFVDP 720 730 >>CCDS142.1 PLOD1 gene_id:5351|Hs108|chr1 (727 aa) initn: 3159 init1: 2076 opt: 3165 Z-score: 4116.3 bits: 772.3 E(32554): 0 Smith-Waterman score: 3165; 59.8% identity (85.1% similar) in 734 aa overlap (6-737:1-727) 10 20 30 40 50 60 pF1KB5 MGGCTVKPQLLLLALVLHPWNPCLGADSEKPSSIPTDKLLVITVATKESDGFHRFMQSAK ..: ::::::. : : :.. : .. : :.:::.::::::..::.:: .::. CCDS14 MRP-LLLLALL--GW--LLLAEA-KGDAKPEDNLLVLTVATKETEGFRRFKRSAQ 10 20 30 40 70 80 90 100 110 120 pF1KB5 YFNYTVKVLGQGEEWRGGDGINSIGGGQKVRLMKEVMEHYADQDDLVVMFTECFDVIFAG .::: ...:: ::.: : .: ::::::::.:...:..::..:::..:.. .::.::. CCDS14 FFNYKIQALGLGEDWNVEKG-TSAGGGQKVRLLKKALEKHADKEDLVILFADSYDVLFAS 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB5 GPEEVLKKFQKANHKVVFAADGILWPDKRLADKYPVVHIGKRYLNSGGFIGYAPYVNRIV ::.:.::::..: .:::.:. ...::.:: ::::: :::.:.::::::::: ....: CCDS14 GPRELLKKFRQARSQVVFSAEELIYPDRRLETKYPVVSDGKRFLGSGGFIGYAPNLSKLV 110 120 130 140 150 160 190 200 210 220 230 240 pF1KB5 QQWNLQDNDDDQLFYTKVYIDPLKREAINITLDHKCKIFQTLNGAVDEVVLKFENGKARA .:. ::.:.:::::::...:: ::: :::::::.:.:::.:.::.:::::::: :..:: CCDS14 AEWEGQDSDSDQLFYTKIFLDPEKREQINITLDHRCRIFQNLDGALDEVVLKFEMGHVRA 170 180 190 200 210 220 250 260 270 280 290 pF1KB5 KNTFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAV--DVHPNV .: :.:::: :.::::::. :::.:::.: :: ..:::.:. .:... .. :.: CCDS14 RNLAYDTLPVLIHGNGPTKLQLNYLGNYIPRFWTFETGCTVCDEGLRSLKGIGDEALPTV 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB5 SIGVFIEQPTPFLPRFLDILLTLDYPKEALKLFIHNKEVYHEKDIKVFFDKAKHEIKTIK .::::::::::. :.. :: : ::.. ..:::::.: .:. ... :. . : ...: CCDS14 LVGVFIEQPTPFVSLFFQRLLRLHYPQKHMRLFIHNHEQHHKAQVEEFLAQHGSEYQSVK 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB5 IVGPEENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPLV .:::: ...:.::::: :.::::..: :::::::::.::.: .:..::.::...::::. CCDS14 LVGPEVRMANADARNMGADLCRQDRSCTYYFSVDADVALTEPNSLRLLIQQNKNVIAPLM 350 360 370 380 390 400 420 430 440 450 460 470 pF1KB5 TRHGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMNE ::::.:::::::::: :::::::::::::::: :::::::::..:.:::::..::.:.. CCDS14 TRHGRLWSNFWGALSADGYYARSEDYVDIVQGRRVGVWNVPYISNIYLIKGSALRGELQS 410 420 430 440 450 460 480 490 500 510 520 530 pF1KB5 RNYFVRDKLDPDMALCRNAREMGVFMYISNRHEFGRLLSTANYNTSHYNNDLWQIFENPV . : ..:::::::.: : :.. :::...::: .:.::: .: :.: .::::..: :: CCDS14 SDLFHHSKLDPDMAFCANIRQQDVFMFLTNRHTLGHLLSLDSYRTTHLHNDLWEVFSNPE 470 480 490 500 510 520 540 550 560 570 580 590 pF1KB5 DWKEKYINRDYSKIFTENIVEQPCPDVFWFPIFSEKACDELVEEMEHYGKWSGGKHHDSR :::::::...:.: .. ..:: :::::.:::::.: :::::::::::.:.:: :...:.: CCDS14 DWKEKYIHQNYTKALAGKLVETPCPDVYWFPIFTEVACDELVEEMEHFGQWSLGNNKDNR 530 540 550 560 570 580 600 610 620 630 640 650 pF1KB5 ISGGYENVPTDDIHMKQVDLENVWLHFIREFIAPVTLKVFAGYYTKGFALLNFVVKYSPE :.:::::::: ::::.:. .: : .:. :.:::.: :.. ::::.. : :::.:.:. CCDS14 IQGGYENVPTIDIHMNQIGFEREWHKFLLEYIAPMTEKLYPGYYTRAQFDLAFVVRYKPD 590 600 610 620 630 640 660 670 680 690 700 710 pF1KB5 RQRSLRPHHDASTFTINIALNNVGEDFQGGGCKFLRYNCSIESPRKGWSFMHPGRLTHLH .: :: ::::::::::::::: :: :..::::.::::::::..:::::..:::::::: : CCDS14 EQPSLMPHHDASTFTINIALNRVGVDYEGGGCRFLRYNCSIRAPRKGWTLMHPGRLTHYH 650 660 670 680 690 700 720 730 pF1KB5 EGLPVKNGTRYIAVSFIDP ::::. :::::::::.:: CCDS14 EGLPTTRGTRYIAVSFVDP 710 720 >>CCDS1360.1 COLGALT2 gene_id:23127|Hs108|chr1 (626 aa) initn: 329 init1: 143 opt: 304 Z-score: 389.0 bits: 82.4 E(32554): 2.4e-15 Smith-Waterman score: 355; 29.4% identity (59.6% similar) in 272 aa overlap (268-515:29-292) 240 250 260 270 280 290 pF1KB5 ARAKNTFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPN .: . ..:.: : :.. :. CCDS13 MAARPAATLAWSLLLLSSALLREGCRARFVAERDSEDDGEEPVVFPESPLQS----PT 10 20 30 40 50 300 310 320 330 340 pF1KB5 VSIGVFIEQPTPFLPRFLDILLTLDYPKEALKLFI---HN----KEVYHE--KDIKVFFD : ..:. .. . ::.:: : ::::: . .. :: :...: :... .. CCDS13 VLVAVLARNAAHTLPHFLGCLERLDYPKSRMAIWAATDHNVDNTTEIFREWLKNVQRLYH 60 70 80 90 100 110 350 360 370 380 390 pF1KB5 ----KAKHEIKTIKI-VGPEENLSQAEARNMGMD---FCRQDEK-CDYYFSVDADVVLTN . : .. .::.. .. :. : . . :: :: . .:.: ::: CCDS13 YVEWRPMDEPESYPDEIGPKHWPTSRFAHVMKLRQAALRTAREKWSDYILFIDVDNFLTN 120 130 140 150 160 170 400 410 420 430 440 450 pF1KB5 PRTLKILIEQNRKIIAPLVTRHGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVP :.::..:: .:. :.::.. .: :.:::: ...: :.: :. :::.: . .:.: . :: CCDS13 PQTLNLLIAENKTIVAPMLESRG-LYSNFWCGITPKGFYKRTPDYVQIREWKRTGCFPVP 180 190 200 210 220 230 460 470 480 490 500 510 pF1KB5 YMANVYLIKGKTLRSEMNERNYFV---RD---KLDPDMALCRNAREMGVFMYISNRHEFG .. ...:: ::.: ... : .: .: ... ..:. :. ::. ::...: CCDS13 MVHSTFLID---LRKEASDKLTFYPPHQDYTWTFDDIIVFAFSSRQAGIQMYLCNREHYG 240 250 260 270 280 290 520 530 540 550 560 570 pF1KB5 RLLSTANYNTSHYNNDLWQIFENPVDWKEKYINRDYSKIFTENIVEQPCPDVFWFPIFSE : CCDS13 YLPIPLKPHQTLQEDIENLIHVQIEAMIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLK 300 310 320 330 340 350 >>CCDS12363.1 COLGALT1 gene_id:79709|Hs108|chr19 (622 aa) initn: 219 init1: 121 opt: 242 Z-score: 308.3 bits: 67.4 E(32554): 7.5e-11 Smith-Waterman score: 250; 26.2% identity (54.5% similar) in 244 aa overlap (296-515:52-291) 270 280 290 300 310 320 pF1KB5 GNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPNVSIGVFIEQPTPFLPRFLDILLTLDYPK : : :... .. . :: : : : .:. CCDS12 LLAPLPPGAPPGADAYFPEERWSPESPLQAPRVLIALLARNAAHALPTTLGALERLRHPR 30 40 50 60 70 80 330 340 350 360 370 pF1KB5 EALKLFI---HNKE----VYHEK--DIKVFFDKAKHEIKTIKIVGPEENLSQ--AEARNM : :.. :: . : .: .: .. ... . :.:. . ...: CCDS12 ERTALWVATDHNMDNTSTVLREWLVAVKSLYHSVEWRPAEEPRSYPDEEGPKHWSDSRYE 90 100 110 120 130 140 380 390 400 410 420 pF1KB5 GMDFCRQ-------DEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPLVTRHGKLWSN . :: : :: . :::: .. :: ::..:: .:. ..::.. .. .:: CCDS12 HVMKLRQAALKSARDMWADYILFVDADNLILNPDTLSLLIAENKTVVAPMLDSRAA-YSN 150 160 170 180 190 200 430 440 450 460 470 480 pF1KB5 FWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMNERNYFVRDK- :: ... .::: :. :. : . .: : . ::.. ...:: ::. .. : . CCDS12 FWCGMTSQGYYKRTPAYIPIRKRDRRGCFAVPMVHSTFLID---LRKAASRNLAFYPPHP 210 220 230 240 250 490 500 510 520 530 540 pF1KB5 -----LDPDMALCRNAREMGVFMYISNRHEFGRLLSTANYNTSHYNNDLWQIFENPVDWK .: ... . .. : ::. :..:.: : CCDS12 DYTWSFDDIIVFAFSCKQAEVQMYVCNKEEYGFLPVPLRAHSTLQDEAESFMHVQLEVMV 260 270 280 290 300 310 550 560 570 580 590 600 pF1KB5 EKYINRDYSKIFTENIVEQPCPDVFWFPIFSEKACDELVEEMEHYGKWSGGKHHDSRISG CCDS12 KHPPAEPSRFISAPTKTPDKMGFDEVFMINLRRRQDRRERMLRALQAQEIECRLVEAVDG 320 330 340 350 360 370 737 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 07:17:34 2016 done: Sat Nov 5 07:17:35 2016 Total Scan time: 2.890 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]