FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5565, 737 aa 1>>>pF1KB5565 737 - 737 aa - 737 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.6036+/-0.000448; mu= 23.4253+/- 0.028 mean_var=56.8636+/-12.084, 0's: 0 Z-trim(107.9): 26 B-trim: 692 in 1/52 Lambda= 0.170082 statistics sampled from 15922 (15941) to 15922 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.539), E-opt: 0.2 (0.187), width: 16 Scan time: 10.570 The best scores are: opt bits E(85289) NP_000926 (OMIM: 601865,609220) procollagen-lysine ( 737) 5083 1256.3 0 NP_891988 (OMIM: 601865,609220) procollagen-lysine ( 758) 3408 845.3 0 NP_001075 (OMIM: 603066,612394) procollagen-lysine ( 738) 3173 787.7 0 NP_000293 (OMIM: 153454,225400) procollagen-lysine ( 727) 3165 785.7 0 NP_001303249 (OMIM: 153454,225400) procollagen-lys ( 774) 3155 783.3 0 XP_005247592 (OMIM: 601865,609220) PREDICTED: proc ( 666) 2779 691.0 4.2e-198 XP_016862114 (OMIM: 601865,609220) PREDICTED: proc ( 666) 2779 691.0 4.2e-198 XP_011517065 (OMIM: 616626) PREDICTED: probable in ( 517) 226 64.4 1.3e-09 NP_001273689 (OMIM: 616626) probable inactive glyc ( 517) 226 64.4 1.3e-09 XP_011517064 (OMIM: 616626) PREDICTED: probable in ( 595) 226 64.5 1.4e-09 NP_057258 (OMIM: 616626) probable inactive glycosy ( 595) 226 64.5 1.4e-09 XP_016870283 (OMIM: 616626) PREDICTED: probable in ( 595) 226 64.5 1.4e-09 XP_005252092 (OMIM: 616626) PREDICTED: probable in ( 595) 226 64.5 1.4e-09 >>NP_000926 (OMIM: 601865,609220) procollagen-lysine,2-o (737 aa) initn: 5083 init1: 5083 opt: 5083 Z-score: 6732.4 bits: 1256.3 E(85289): 0 Smith-Waterman score: 5083; 100.0% identity (100.0% similar) in 737 aa overlap (1-737:1-737) 10 20 30 40 50 60 pF1KB5 MGGCTVKPQLLLLALVLHPWNPCLGADSEKPSSIPTDKLLVITVATKESDGFHRFMQSAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 MGGCTVKPQLLLLALVLHPWNPCLGADSEKPSSIPTDKLLVITVATKESDGFHRFMQSAK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 YFNYTVKVLGQGEEWRGGDGINSIGGGQKVRLMKEVMEHYADQDDLVVMFTECFDVIFAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 YFNYTVKVLGQGEEWRGGDGINSIGGGQKVRLMKEVMEHYADQDDLVVMFTECFDVIFAG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 GPEEVLKKFQKANHKVVFAADGILWPDKRLADKYPVVHIGKRYLNSGGFIGYAPYVNRIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 GPEEVLKKFQKANHKVVFAADGILWPDKRLADKYPVVHIGKRYLNSGGFIGYAPYVNRIV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 QQWNLQDNDDDQLFYTKVYIDPLKREAINITLDHKCKIFQTLNGAVDEVVLKFENGKARA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 QQWNLQDNDDDQLFYTKVYIDPLKREAINITLDHKCKIFQTLNGAVDEVVLKFENGKARA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 KNTFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPNVSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 KNTFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPNVSI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 GVFIEQPTPFLPRFLDILLTLDYPKEALKLFIHNKEVYHEKDIKVFFDKAKHEIKTIKIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 GVFIEQPTPFLPRFLDILLTLDYPKEALKLFIHNKEVYHEKDIKVFFDKAKHEIKTIKIV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 GPEENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPLVTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 GPEENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPLVTR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 HGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMNERN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 HGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMNERN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB5 YFVRDKLDPDMALCRNAREMGVFMYISNRHEFGRLLSTANYNTSHYNNDLWQIFENPVDW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 YFVRDKLDPDMALCRNAREMGVFMYISNRHEFGRLLSTANYNTSHYNNDLWQIFENPVDW 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB5 KEKYINRDYSKIFTENIVEQPCPDVFWFPIFSEKACDELVEEMEHYGKWSGGKHHDSRIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 KEKYINRDYSKIFTENIVEQPCPDVFWFPIFSEKACDELVEEMEHYGKWSGGKHHDSRIS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB5 GGYENVPTDDIHMKQVDLENVWLHFIREFIAPVTLKVFAGYYTKGFALLNFVVKYSPERQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 GGYENVPTDDIHMKQVDLENVWLHFIREFIAPVTLKVFAGYYTKGFALLNFVVKYSPERQ 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB5 RSLRPHHDASTFTINIALNNVGEDFQGGGCKFLRYNCSIESPRKGWSFMHPGRLTHLHEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 RSLRPHHDASTFTINIALNNVGEDFQGGGCKFLRYNCSIESPRKGWSFMHPGRLTHLHEG 670 680 690 700 710 720 730 pF1KB5 LPVKNGTRYIAVSFIDP ::::::::::::::::: NP_000 LPVKNGTRYIAVSFIDP 730 >>NP_891988 (OMIM: 601865,609220) procollagen-lysine,2-o (758 aa) initn: 5069 init1: 3408 opt: 3408 Z-score: 4511.0 bits: 845.3 E(85289): 0 Smith-Waterman score: 5031; 97.2% identity (97.2% similar) in 758 aa overlap (1-737:1-758) 10 20 30 40 50 60 pF1KB5 MGGCTVKPQLLLLALVLHPWNPCLGADSEKPSSIPTDKLLVITVATKESDGFHRFMQSAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_891 MGGCTVKPQLLLLALVLHPWNPCLGADSEKPSSIPTDKLLVITVATKESDGFHRFMQSAK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 YFNYTVKVLGQGEEWRGGDGINSIGGGQKVRLMKEVMEHYADQDDLVVMFTECFDVIFAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_891 YFNYTVKVLGQGEEWRGGDGINSIGGGQKVRLMKEVMEHYADQDDLVVMFTECFDVIFAG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 GPEEVLKKFQKANHKVVFAADGILWPDKRLADKYPVVHIGKRYLNSGGFIGYAPYVNRIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_891 GPEEVLKKFQKANHKVVFAADGILWPDKRLADKYPVVHIGKRYLNSGGFIGYAPYVNRIV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 QQWNLQDNDDDQLFYTKVYIDPLKREAINITLDHKCKIFQTLNGAVDEVVLKFENGKARA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_891 QQWNLQDNDDDQLFYTKVYIDPLKREAINITLDHKCKIFQTLNGAVDEVVLKFENGKARA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 KNTFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPNVSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_891 KNTFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPNVSI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 GVFIEQPTPFLPRFLDILLTLDYPKEALKLFIHNKEVYHEKDIKVFFDKAKHEIKTIKIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_891 GVFIEQPTPFLPRFLDILLTLDYPKEALKLFIHNKEVYHEKDIKVFFDKAKHEIKTIKIV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 GPEENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPLVTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_891 GPEENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPLVTR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 HGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMNERN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_891 HGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMNERN 430 440 450 460 470 480 490 500 510 pF1KB5 YFVRDKLDPDMALCRNAREM---------------------GVFMYISNRHEFGRLLSTA :::::::::::::::::::: ::::::::::::::::::: NP_891 YFVRDKLDPDMALCRNAREMTLQREKDSPTPETFQMLSPPKGVFMYISNRHEFGRLLSTA 490 500 510 520 530 540 520 530 540 550 560 570 pF1KB5 NYNTSHYNNDLWQIFENPVDWKEKYINRDYSKIFTENIVEQPCPDVFWFPIFSEKACDEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_891 NYNTSHYNNDLWQIFENPVDWKEKYINRDYSKIFTENIVEQPCPDVFWFPIFSEKACDEL 550 560 570 580 590 600 580 590 600 610 620 630 pF1KB5 VEEMEHYGKWSGGKHHDSRISGGYENVPTDDIHMKQVDLENVWLHFIREFIAPVTLKVFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_891 VEEMEHYGKWSGGKHHDSRISGGYENVPTDDIHMKQVDLENVWLHFIREFIAPVTLKVFA 610 620 630 640 650 660 640 650 660 670 680 690 pF1KB5 GYYTKGFALLNFVVKYSPERQRSLRPHHDASTFTINIALNNVGEDFQGGGCKFLRYNCSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_891 GYYTKGFALLNFVVKYSPERQRSLRPHHDASTFTINIALNNVGEDFQGGGCKFLRYNCSI 670 680 690 700 710 720 700 710 720 730 pF1KB5 ESPRKGWSFMHPGRLTHLHEGLPVKNGTRYIAVSFIDP :::::::::::::::::::::::::::::::::::::: NP_891 ESPRKGWSFMHPGRLTHLHEGLPVKNGTRYIAVSFIDP 730 740 750 >>NP_001075 (OMIM: 603066,612394) procollagen-lysine,2-o (738 aa) initn: 3163 init1: 2219 opt: 3173 Z-score: 4199.5 bits: 787.7 E(85289): 0 Smith-Waterman score: 3173; 58.6% identity (84.9% similar) in 734 aa overlap (8-737:8-738) 10 20 30 40 50 pF1KB5 MGGCTVKPQLLLLALVLHPWNPCLGADSEKPSS---IPTDKLLVITVATKESDGFHRFMQ :..::: .: : : .: :..: . . .::::::::: :..:. ::.. NP_001 MTSSGPGPRFLLLLPLLLP--PAASA-SDRPRGRDPVNPEKLLVITVATAETEGYLRFLR 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 SAKYFNYTVKVLGQGEEWRGGDGINSIGGGQKVRLMKEVMEHYADQDDLVVMFTECFDVI ::..:::::..:: :::::::: ..::::::: .:. ::.:::..:...::.. .::: NP_001 SAEFFNYTVRTLGLGEEWRGGDVARTVGGGQKVRWLKKEMEKYADREDMIIMFVDSYDVI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 FAGGPEEVLKKFQKANHKVVFAADGILWPDKRLADKYPVVHIGKRYLNSGGFIGYAPYVN .::.: :.:::: ... ...:.:... ::. ::..:: : :::.::::::::.: .. NP_001 LAGSPTELLKKFVQSGSRLLFSAESFCWPEWGLAEQYPEVGTGKRFLNSGGFIGFATTIH 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 RIVQQWNLQDNDDDQLFYTKVYIDPLKREAINITLDHKCKIFQTLNGAVDEVVLKFENGK .::.::. .:.::::::::..:.:: :: ....:::: .:::.::::.:::::::. .. NP_001 QIVRQWKYKDDDDDQLFYTRLYLDPGLREKLSLNLDHKSRIFQNLNGALDEVVLKFDRNR 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB5 ARAKNTFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPN .: .:. :.:::....::::::. :::.::::::.:: ..:: .:. : : . . : NP_001 VRIRNVAYDTLPIVVHGNGPTKLQLNYLGNYVPNGWTPEGGCGFCNQDRRTLPGGQPPPR 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB5 VSIGVFIEQPTPFLPRFLDILLTLDYPKEALKLFIHNKEVYHEKDIKVFFDKAKHEIKTI : ..::.:::::::::::. :: :::: . . ::.::.::.:: : . . . ..... NP_001 VFLAVFVEQPTPFLPRFLQRLLLLDYPPDRVTLFLHNNEVFHEPHIADSWPQLQDHFSAV 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB5 KIVGPEENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPL :.::::: :: .:::.:.::.:::: .:..:::.:::.:::: .::.::::.:::.:::. NP_001 KLVGPEEALSPGEARDMAMDLCRQDPECEFYFSLDADAVLTNLQTLRILIEENRKVIAPM 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB5 VTRHGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMN ..:::::::::::::::: :::::::::..:: .:::::::::....:.:.: ::: :. NP_001 LSRHGKLWSNFWGALSPDEYYARSEDYVELVQRKRVGVWNVPYISQAYVIRGDTLRMELP 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB5 ERNYFVRDKLDPDMALCRNAREMGVFMYISNRHEFGRLLSTANYNTSHYNNDLWQIFENP .:. : . :::::.:.. :. :.:...::.:::::::.:. :.: : . ::::::.:: NP_001 QRDVFSGSDTDPDMAFCKSFRDKGIFLHLSNQHEFGRLLATSRYDTEHLHPDLWQIFDNP 480 490 500 510 520 530 540 550 560 570 580 590 pF1KB5 VDWKEKYINRDYSKIFT-ENIVEQPCPDVFWFPIFSEKACDELVEEMEHYGKWSGGKHHD :::::.::...::. . :.:::::::::.:::..::. ::::: ::::::.::::.:.: NP_001 VDWKEQYIHENYSRALEGEGIVEQPCPDVYWFPLLSEQMCDELVAEMEHYGQWSGGRHED 540 550 560 570 580 590 600 610 620 630 640 650 pF1KB5 SRISGGYENVPTDDIHMKQVDLENVWLHFIREFIAPVTLKVFAGYYTKGFALLNFVVKYS ::..:::::::: ::::::: :. ::...: ...:.: ..: ::.::. :..::::.: NP_001 SRLAGGYENVPTVDIHMKQVGYEDQWLQLLRTYVGPMTESLFPGYHTKARAVMNFVVRYR 600 610 620 630 640 650 660 670 680 690 700 710 pF1KB5 PERQRSLRPHHDASTFTINIALNNVGEDFQGGGCKFLRYNCSIESPRKGWSFMHPGRLTH :..: :::::::.::::.:.:::. : :..::::.::::.: : ::::::...::::::: NP_001 PDEQPSLRPHHDSSTFTLNVALNHKGLDYEGGGCRFLRYDCVISSPRKGWALLHPGRLTH 660 670 680 690 700 710 720 730 pF1KB5 LHEGLPVKNGTRYIAVSFIDP :::::. ::::: :::.:: NP_001 YHEGLPTTWGTRYIMVSFVDP 720 730 >>NP_000293 (OMIM: 153454,225400) procollagen-lysine,2-o (727 aa) initn: 3159 init1: 2076 opt: 3165 Z-score: 4189.0 bits: 785.7 E(85289): 0 Smith-Waterman score: 3165; 59.8% identity (85.1% similar) in 734 aa overlap (6-737:1-727) 10 20 30 40 50 60 pF1KB5 MGGCTVKPQLLLLALVLHPWNPCLGADSEKPSSIPTDKLLVITVATKESDGFHRFMQSAK ..: ::::::. : : :.. : .. : :.:::.::::::..::.:: .::. NP_000 MRP-LLLLALL--GW--LLLAEA-KGDAKPEDNLLVLTVATKETEGFRRFKRSAQ 10 20 30 40 70 80 90 100 110 120 pF1KB5 YFNYTVKVLGQGEEWRGGDGINSIGGGQKVRLMKEVMEHYADQDDLVVMFTECFDVIFAG .::: ...:: ::.: : .: ::::::::.:...:..::..:::..:.. .::.::. NP_000 FFNYKIQALGLGEDWNVEKG-TSAGGGQKVRLLKKALEKHADKEDLVILFADSYDVLFAS 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB5 GPEEVLKKFQKANHKVVFAADGILWPDKRLADKYPVVHIGKRYLNSGGFIGYAPYVNRIV ::.:.::::..: .:::.:. ...::.:: ::::: :::.:.::::::::: ....: NP_000 GPRELLKKFRQARSQVVFSAEELIYPDRRLETKYPVVSDGKRFLGSGGFIGYAPNLSKLV 110 120 130 140 150 160 190 200 210 220 230 240 pF1KB5 QQWNLQDNDDDQLFYTKVYIDPLKREAINITLDHKCKIFQTLNGAVDEVVLKFENGKARA .:. ::.:.:::::::...:: ::: :::::::.:.:::.:.::.:::::::: :..:: NP_000 AEWEGQDSDSDQLFYTKIFLDPEKREQINITLDHRCRIFQNLDGALDEVVLKFEMGHVRA 170 180 190 200 210 220 250 260 270 280 290 pF1KB5 KNTFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAV--DVHPNV .: :.:::: :.::::::. :::.:::.: :: ..:::.:. .:... .. :.: NP_000 RNLAYDTLPVLIHGNGPTKLQLNYLGNYIPRFWTFETGCTVCDEGLRSLKGIGDEALPTV 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB5 SIGVFIEQPTPFLPRFLDILLTLDYPKEALKLFIHNKEVYHEKDIKVFFDKAKHEIKTIK .::::::::::. :.. :: : ::.. ..:::::.: .:. ... :. . : ...: NP_000 LVGVFIEQPTPFVSLFFQRLLRLHYPQKHMRLFIHNHEQHHKAQVEEFLAQHGSEYQSVK 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB5 IVGPEENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPLV .:::: ...:.::::: :.::::..: :::::::::.::.: .:..::.::...::::. NP_000 LVGPEVRMANADARNMGADLCRQDRSCTYYFSVDADVALTEPNSLRLLIQQNKNVIAPLM 350 360 370 380 390 400 420 430 440 450 460 470 pF1KB5 TRHGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMNE ::::.:::::::::: :::::::::::::::: :::::::::..:.:::::..::.:.. NP_000 TRHGRLWSNFWGALSADGYYARSEDYVDIVQGRRVGVWNVPYISNIYLIKGSALRGELQS 410 420 430 440 450 460 480 490 500 510 520 530 pF1KB5 RNYFVRDKLDPDMALCRNAREMGVFMYISNRHEFGRLLSTANYNTSHYNNDLWQIFENPV . : ..:::::::.: : :.. :::...::: .:.::: .: :.: .::::..: :: NP_000 SDLFHHSKLDPDMAFCANIRQQDVFMFLTNRHTLGHLLSLDSYRTTHLHNDLWEVFSNPE 470 480 490 500 510 520 540 550 560 570 580 590 pF1KB5 DWKEKYINRDYSKIFTENIVEQPCPDVFWFPIFSEKACDELVEEMEHYGKWSGGKHHDSR :::::::...:.: .. ..:: :::::.:::::.: :::::::::::.:.:: :...:.: NP_000 DWKEKYIHQNYTKALAGKLVETPCPDVYWFPIFTEVACDELVEEMEHFGQWSLGNNKDNR 530 540 550 560 570 580 600 610 620 630 640 650 pF1KB5 ISGGYENVPTDDIHMKQVDLENVWLHFIREFIAPVTLKVFAGYYTKGFALLNFVVKYSPE :.:::::::: ::::.:. .: : .:. :.:::.: :.. ::::.. : :::.:.:. NP_000 IQGGYENVPTIDIHMNQIGFEREWHKFLLEYIAPMTEKLYPGYYTRAQFDLAFVVRYKPD 590 600 610 620 630 640 660 670 680 690 700 710 pF1KB5 RQRSLRPHHDASTFTINIALNNVGEDFQGGGCKFLRYNCSIESPRKGWSFMHPGRLTHLH .: :: ::::::::::::::: :: :..::::.::::::::..:::::..:::::::: : NP_000 EQPSLMPHHDASTFTINIALNRVGVDYEGGGCRFLRYNCSIRAPRKGWTLMHPGRLTHYH 650 660 670 680 690 700 720 730 pF1KB5 EGLPVKNGTRYIAVSFIDP ::::. :::::::::.:: NP_000 EGLPTTRGTRYIAVSFVDP 710 720 >>NP_001303249 (OMIM: 153454,225400) procollagen-lysine, (774 aa) initn: 3150 init1: 2076 opt: 3155 Z-score: 4175.3 bits: 783.3 E(85289): 0 Smith-Waterman score: 3155; 60.1% identity (85.3% similar) in 721 aa overlap (25-737:55-774) 10 20 30 40 pF1KB5 MGGCTVKPQLLLLALVLHPWNPCLGADSEKPSSIP------TDKLLVITVATKE :. : . :::: .:.:::.:::::: NP_001 EAPCCQEGLRAGGSGSLHLGRDFTVLAGARGSPSPSVSSIPRFWIPGSDNLLVLTVATKE 30 40 50 60 70 80 50 60 70 80 90 100 pF1KB5 SDGFHRFMQSAKYFNYTVKVLGQGEEWRGGDGINSIGGGQKVRLMKEVMEHYADQDDLVV ..::.:: .::..::: ...:: ::.: : .: ::::::::.:...:..::..:::. NP_001 TEGFRRFKRSAQFFNYKIQALGLGEDWNVEKG-TSAGGGQKVRLLKKALEKHADKEDLVI 90 100 110 120 130 140 110 120 130 140 150 160 pF1KB5 MFTECFDVIFAGGPEEVLKKFQKANHKVVFAADGILWPDKRLADKYPVVHIGKRYLNSGG .:.. .::.::.::.:.::::..: .:::.:. ...::.:: ::::: :::.:.::: NP_001 LFADSYDVLFASGPRELLKKFRQARSQVVFSAEELIYPDRRLETKYPVVSDGKRFLGSGG 150 160 170 180 190 200 170 180 190 200 210 220 pF1KB5 FIGYAPYVNRIVQQWNLQDNDDDQLFYTKVYIDPLKREAINITLDHKCKIFQTLNGAVDE :::::: ....: .:. ::.:.:::::::...:: ::: :::::::.:.:::.:.::.:: NP_001 FIGYAPNLSKLVAEWEGQDSDSDQLFYTKIFLDPEKREQINITLDHRCRIFQNLDGALDE 210 220 230 240 250 260 230 240 250 260 270 280 pF1KB5 VVLKFENGKARAKNTFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVD :::::: :..::.: :.:::: :.::::::. :::.:::.: :: ..:::.:. . NP_001 VVLKFEMGHVRARNLAYDTLPVLIHGNGPTKLQLNYLGNYIPRFWTFETGCTVCDEGLRS 270 280 290 300 310 320 290 300 310 320 330 340 pF1KB5 LSAV--DVHPNVSIGVFIEQPTPFLPRFLDILLTLDYPKEALKLFIHNKEVYHEKDIKVF :... .. :.: .::::::::::. :.. :: : ::.. ..:::::.: .:. ... : NP_001 LKGIGDEALPTVLVGVFIEQPTPFVSLFFQRLLRLHYPQKHMRLFIHNHEQHHKAQVEEF 330 340 350 360 370 380 350 360 370 380 390 400 pF1KB5 FDKAKHEIKTIKIVGPEENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKIL . . : ...:.:::: ...:.::::: :.::::..: :::::::::.::.: .:..: NP_001 LAQHGSEYQSVKLVGPEVRMANADARNMGADLCRQDRSCTYYFSVDADVALTEPNSLRLL 390 400 410 420 430 440 410 420 430 440 450 460 pF1KB5 IEQNRKIIAPLVTRHGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYL :.::...::::.::::.:::::::::: :::::::::::::::: :::::::::..:.:: NP_001 IQQNKNVIAPLMTRHGRLWSNFWGALSADGYYARSEDYVDIVQGRRVGVWNVPYISNIYL 450 460 470 480 490 500 470 480 490 500 510 520 pF1KB5 IKGKTLRSEMNERNYFVRDKLDPDMALCRNAREMGVFMYISNRHEFGRLLSTANYNTSHY :::..::.:.. . : ..:::::::.: : :.. :::...::: .:.::: .: :.: NP_001 IKGSALRGELQSSDLFHHSKLDPDMAFCANIRQQDVFMFLTNRHTLGHLLSLDSYRTTHL 510 520 530 540 550 560 530 540 550 560 570 580 pF1KB5 NNDLWQIFENPVDWKEKYINRDYSKIFTENIVEQPCPDVFWFPIFSEKACDELVEEMEHY .::::..: :: :::::::...:.: .. ..:: :::::.:::::.: :::::::::::. NP_001 HNDLWEVFSNPEDWKEKYIHQNYTKALAGKLVETPCPDVYWFPIFTEVACDELVEEMEHF 570 580 590 600 610 620 590 600 610 620 630 640 pF1KB5 GKWSGGKHHDSRISGGYENVPTDDIHMKQVDLENVWLHFIREFIAPVTLKVFAGYYTKGF :.:: :...:.::.:::::::: ::::.:. .: : .:. :.:::.: :.. ::::.. NP_001 GQWSLGNNKDNRIQGGYENVPTIDIHMNQIGFEREWHKFLLEYIAPMTEKLYPGYYTRAQ 630 640 650 660 670 680 650 660 670 680 690 700 pF1KB5 ALLNFVVKYSPERQRSLRPHHDASTFTINIALNNVGEDFQGGGCKFLRYNCSIESPRKGW : :::.:.:..: :: ::::::::::::::: :: :..::::.::::::::..::::: NP_001 FDLAFVVRYKPDEQPSLMPHHDASTFTINIALNRVGVDYEGGGCRFLRYNCSIRAPRKGW 690 700 710 720 730 740 710 720 730 pF1KB5 SFMHPGRLTHLHEGLPVKNGTRYIAVSFIDP ..:::::::: :::::. :::::::::.:: NP_001 TLMHPGRLTHYHEGLPTTRGTRYIAVSFVDP 750 760 770 >>XP_005247592 (OMIM: 601865,609220) PREDICTED: procolla (666 aa) initn: 4440 init1: 2779 opt: 2779 Z-score: 3677.6 bits: 691.0 E(85289): 4.2e-198 Smith-Waterman score: 4402; 96.8% identity (96.8% similar) in 666 aa overlap (93-737:1-666) 70 80 90 100 110 120 pF1KB5 NYTVKVLGQGEEWRGGDGINSIGGGQKVRLMKEVMEHYADQDDLVVMFTECFDVIFAGGP :::::::::::::::::::::::::::::: XP_005 MKEVMEHYADQDDLVVMFTECFDVIFAGGP 10 20 30 130 140 150 160 170 180 pF1KB5 EEVLKKFQKANHKVVFAADGILWPDKRLADKYPVVHIGKRYLNSGGFIGYAPYVNRIVQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 EEVLKKFQKANHKVVFAADGILWPDKRLADKYPVVHIGKRYLNSGGFIGYAPYVNRIVQQ 40 50 60 70 80 90 190 200 210 220 230 240 pF1KB5 WNLQDNDDDQLFYTKVYIDPLKREAINITLDHKCKIFQTLNGAVDEVVLKFENGKARAKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 WNLQDNDDDQLFYTKVYIDPLKREAINITLDHKCKIFQTLNGAVDEVVLKFENGKARAKN 100 110 120 130 140 150 250 260 270 280 290 300 pF1KB5 TFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPNVSIGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 TFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPNVSIGV 160 170 180 190 200 210 310 320 330 340 350 360 pF1KB5 FIEQPTPFLPRFLDILLTLDYPKEALKLFIHNKEVYHEKDIKVFFDKAKHEIKTIKIVGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 FIEQPTPFLPRFLDILLTLDYPKEALKLFIHNKEVYHEKDIKVFFDKAKHEIKTIKIVGP 220 230 240 250 260 270 370 380 390 400 410 420 pF1KB5 EENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPLVTRHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 EENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPLVTRHG 280 290 300 310 320 330 430 440 450 460 470 480 pF1KB5 KLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMNERNYF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 KLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMNERNYF 340 350 360 370 380 390 490 500 510 520 pF1KB5 VRDKLDPDMALCRNAREM---------------------GVFMYISNRHEFGRLLSTANY :::::::::::::::::: ::::::::::::::::::::: XP_005 VRDKLDPDMALCRNAREMTLQREKDSPTPETFQMLSPPKGVFMYISNRHEFGRLLSTANY 400 410 420 430 440 450 530 540 550 560 570 580 pF1KB5 NTSHYNNDLWQIFENPVDWKEKYINRDYSKIFTENIVEQPCPDVFWFPIFSEKACDELVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 NTSHYNNDLWQIFENPVDWKEKYINRDYSKIFTENIVEQPCPDVFWFPIFSEKACDELVE 460 470 480 490 500 510 590 600 610 620 630 640 pF1KB5 EMEHYGKWSGGKHHDSRISGGYENVPTDDIHMKQVDLENVWLHFIREFIAPVTLKVFAGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 EMEHYGKWSGGKHHDSRISGGYENVPTDDIHMKQVDLENVWLHFIREFIAPVTLKVFAGY 520 530 540 550 560 570 650 660 670 680 690 700 pF1KB5 YTKGFALLNFVVKYSPERQRSLRPHHDASTFTINIALNNVGEDFQGGGCKFLRYNCSIES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 YTKGFALLNFVVKYSPERQRSLRPHHDASTFTINIALNNVGEDFQGGGCKFLRYNCSIES 580 590 600 610 620 630 710 720 730 pF1KB5 PRKGWSFMHPGRLTHLHEGLPVKNGTRYIAVSFIDP :::::::::::::::::::::::::::::::::::: XP_005 PRKGWSFMHPGRLTHLHEGLPVKNGTRYIAVSFIDP 640 650 660 >>XP_016862114 (OMIM: 601865,609220) PREDICTED: procolla (666 aa) initn: 4440 init1: 2779 opt: 2779 Z-score: 3677.6 bits: 691.0 E(85289): 4.2e-198 Smith-Waterman score: 4402; 96.8% identity (96.8% similar) in 666 aa overlap (93-737:1-666) 70 80 90 100 110 120 pF1KB5 NYTVKVLGQGEEWRGGDGINSIGGGQKVRLMKEVMEHYADQDDLVVMFTECFDVIFAGGP :::::::::::::::::::::::::::::: XP_016 MKEVMEHYADQDDLVVMFTECFDVIFAGGP 10 20 30 130 140 150 160 170 180 pF1KB5 EEVLKKFQKANHKVVFAADGILWPDKRLADKYPVVHIGKRYLNSGGFIGYAPYVNRIVQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 EEVLKKFQKANHKVVFAADGILWPDKRLADKYPVVHIGKRYLNSGGFIGYAPYVNRIVQQ 40 50 60 70 80 90 190 200 210 220 230 240 pF1KB5 WNLQDNDDDQLFYTKVYIDPLKREAINITLDHKCKIFQTLNGAVDEVVLKFENGKARAKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 WNLQDNDDDQLFYTKVYIDPLKREAINITLDHKCKIFQTLNGAVDEVVLKFENGKARAKN 100 110 120 130 140 150 250 260 270 280 290 300 pF1KB5 TFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPNVSIGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 TFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPNVSIGV 160 170 180 190 200 210 310 320 330 340 350 360 pF1KB5 FIEQPTPFLPRFLDILLTLDYPKEALKLFIHNKEVYHEKDIKVFFDKAKHEIKTIKIVGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 FIEQPTPFLPRFLDILLTLDYPKEALKLFIHNKEVYHEKDIKVFFDKAKHEIKTIKIVGP 220 230 240 250 260 270 370 380 390 400 410 420 pF1KB5 EENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPLVTRHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 EENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPLVTRHG 280 290 300 310 320 330 430 440 450 460 470 480 pF1KB5 KLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMNERNYF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 KLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMNERNYF 340 350 360 370 380 390 490 500 510 520 pF1KB5 VRDKLDPDMALCRNAREM---------------------GVFMYISNRHEFGRLLSTANY :::::::::::::::::: ::::::::::::::::::::: XP_016 VRDKLDPDMALCRNAREMTLQREKDSPTPETFQMLSPPKGVFMYISNRHEFGRLLSTANY 400 410 420 430 440 450 530 540 550 560 570 580 pF1KB5 NTSHYNNDLWQIFENPVDWKEKYINRDYSKIFTENIVEQPCPDVFWFPIFSEKACDELVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 NTSHYNNDLWQIFENPVDWKEKYINRDYSKIFTENIVEQPCPDVFWFPIFSEKACDELVE 460 470 480 490 500 510 590 600 610 620 630 640 pF1KB5 EMEHYGKWSGGKHHDSRISGGYENVPTDDIHMKQVDLENVWLHFIREFIAPVTLKVFAGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 EMEHYGKWSGGKHHDSRISGGYENVPTDDIHMKQVDLENVWLHFIREFIAPVTLKVFAGY 520 530 540 550 560 570 650 660 670 680 690 700 pF1KB5 YTKGFALLNFVVKYSPERQRSLRPHHDASTFTINIALNNVGEDFQGGGCKFLRYNCSIES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 YTKGFALLNFVVKYSPERQRSLRPHHDASTFTINIALNNVGEDFQGGGCKFLRYNCSIES 580 590 600 610 620 630 710 720 730 pF1KB5 PRKGWSFMHPGRLTHLHEGLPVKNGTRYIAVSFIDP :::::::::::::::::::::::::::::::::::: XP_016 PRKGWSFMHPGRLTHLHEGLPVKNGTRYIAVSFIDP 640 650 660 >>XP_011517065 (OMIM: 616626) PREDICTED: probable inacti (517 aa) initn: 195 init1: 114 opt: 226 Z-score: 293.6 bits: 64.4 E(85289): 1.3e-09 Smith-Waterman score: 226; 27.0% identity (60.5% similar) in 152 aa overlap (370-515:46-192) 340 350 360 370 380 390 pF1KB5 EKDIKVFFDKAKHEIKTIKIVGPEENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTN : .. .. : : . :: . .:.: .::: XP_011 VVWRPEGEPRFYPDEEGPKHWTKERHQFLMELKQEALTFAR-NWGADYILFADTDNILTN 20 30 40 50 60 70 400 410 420 430 440 450 pF1KB5 PRTLKILIEQNRKIIAPLVTRHGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVP .::..:. :. ..::.. . .:::: ...:.::: :. .: . .: : . :: XP_011 NQTLRLLMGQGLPVVAPMLDSQ-TYYSNFWCGITPQGYYRRTAEYFPTKNRQRRGCFRVP 80 90 100 110 120 130 460 470 480 490 500 510 pF1KB5 YMANVYLIKGKTLRSEMNERNYFVRDK------LDPDMALCRNAREMGVFMYISNRHEFG .. ...: .::.: .. : . .: ... . :: ... :.:..: XP_011 MVHSTFL---ASLRAEGADQLAFYPPHPNYTWPFDDIIVFAYACQAAGVSVHVCNEHRYG 140 150 160 170 180 190 520 530 540 550 560 570 pF1KB5 RLLSTANYNTSHYNNDLWQIFENPVDWKEKYINRDYSKIFTENIVEQPCPDVFWFPIFSE . XP_011 YMNVPVKSHQGLEDERVNFIHLILEALVDGPRMQASAHVTRPSKRPSKIGFDEVFVISLA 200 210 220 230 240 250 >>NP_001273689 (OMIM: 616626) probable inactive glycosyl (517 aa) initn: 195 init1: 114 opt: 226 Z-score: 293.6 bits: 64.4 E(85289): 1.3e-09 Smith-Waterman score: 226; 27.0% identity (60.5% similar) in 152 aa overlap (370-515:46-192) 340 350 360 370 380 390 pF1KB5 EKDIKVFFDKAKHEIKTIKIVGPEENLSQAEARNMGMDFCRQDEKCDYYFSVDADVVLTN : .. .. : : . :: . .:.: .::: NP_001 VVWRPEGEPRFYPDEEGPKHWTKERHQFLMELKQEALTFAR-NWGADYILFADTDNILTN 20 30 40 50 60 70 400 410 420 430 440 450 pF1KB5 PRTLKILIEQNRKIIAPLVTRHGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVP .::..:. :. ..::.. . .:::: ...:.::: :. .: . .: : . :: NP_001 NQTLRLLMGQGLPVVAPMLDSQ-TYYSNFWCGITPQGYYRRTAEYFPTKNRQRRGCFRVP 80 90 100 110 120 130 460 470 480 490 500 510 pF1KB5 YMANVYLIKGKTLRSEMNERNYFVRDK------LDPDMALCRNAREMGVFMYISNRHEFG .. ...: .::.: .. : . .: ... . :: ... :.:..: NP_001 MVHSTFL---ASLRAEGADQLAFYPPHPNYTWPFDDIIVFAYACQAAGVSVHVCNEHRYG 140 150 160 170 180 190 520 530 540 550 560 570 pF1KB5 RLLSTANYNTSHYNNDLWQIFENPVDWKEKYINRDYSKIFTENIVEQPCPDVFWFPIFSE . NP_001 YMNVPVKSHQGLEDERVNFIHLILEALVDGPRMQASAHVTRPSKRPSKIGFDEVFVISLA 200 210 220 230 240 250 >>XP_011517064 (OMIM: 616626) PREDICTED: probable inacti (595 aa) initn: 274 init1: 114 opt: 226 Z-score: 292.7 bits: 64.5 E(85289): 1.4e-09 Smith-Waterman score: 249; 24.9% identity (53.5% similar) in 245 aa overlap (296-515:31-270) 270 280 290 300 310 320 pF1KB5 GNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPNVSIGVFIEQPTPFLPRFLDILLTLDYPK : : .... .. ::..: : ::::. XP_011 MRAARAAPLLQLLLLLGPWLEAAGVAESPLPAVVLAILARNAEHSLPHYLGALERLDYPR 10 20 30 40 50 60 330 340 350 360 pF1KB5 EALKLFI---HN----KEVYHE------KDIKVFFDKAKHEIKTIKIV-GP-----EENL . :. :: :. .: : . . . : . :: :.. XP_011 ARMALWCATDHNVDNTTEMLQEWLAAVGDDYAAVVWRPEGEPRFYPDEEGPKHWTKERHQ 70 80 90 100 110 120 370 380 390 400 410 420 pF1KB5 SQAEARNMGMDFCRQDEKCDYYFSVDADVVLTNPRTLKILIEQNRKIIAPLVTRHGKLWS : .. .. : : . :: . .:.: .::: .::..:. :. ..::.. . .: XP_011 FLMELKQEALTFAR-NWGADYILFADTDNILTNNQTLRLLMGQGLPVVAPMLDSQ-TYYS 130 140 150 160 170 430 440 450 460 470 480 pF1KB5 NFWGALSPDGYYARSEDYVDIVQGNRVGVWNVPYMANVYLIKGKTLRSEMNERNYFVRDK ::: ...:.::: :. .: . .: : . ::.. ...: .::.: .. : . XP_011 NFWCGITPQGYYRRTAEYFPTKNRQRRGCFRVPMVHSTFL---ASLRAEGADQLAFYPPH 180 190 200 210 220 230 490 500 510 520 530 540 pF1KB5 ------LDPDMALCRNAREMGVFMYISNRHEFGRLLSTANYNTSHYNNDLWQIFENPVDW .: ... . :: ... :.:..: . XP_011 PNYTWPFDDIIVFAYACQAAGVSVHVCNEHRYGYMNVPVKSHQGLEDERVNFIHLILEAL 240 250 260 270 280 290 550 560 570 580 590 600 pF1KB5 KEKYINRDYSKIFTENIVEQPCPDVFWFPIFSEKACDELVEEMEHYGKWSGGKHHDSRIS XP_011 VDGPRMQASAHVTRPSKRPSKIGFDEVFVISLARRPDRRERMLASLWEMEISGRVVDAVD 300 310 320 330 340 350 737 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 07:17:35 2016 done: Sat Nov 5 07:17:37 2016 Total Scan time: 10.570 Total Display time: 0.180 Function used was FASTA [36.3.4 Apr, 2011]