FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA0584, 626 aa 1>>>pF1KA0584 626 - 626 aa - 626 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.7788+/-0.000392; mu= 22.2618+/- 0.024 mean_var=69.3400+/-14.026, 0's: 0 Z-trim(112.4): 36 B-trim: 523 in 1/48 Lambda= 0.154022 statistics sampled from 21233 (21263) to 21233 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.621), E-opt: 0.2 (0.249), width: 16 Scan time: 7.630 The best scores are: opt bits E(85289) XP_016870283 (OMIM: 616626) PREDICTED: probable in ( 595) 2152 487.8 4.6e-137 XP_005252092 (OMIM: 616626) PREDICTED: probable in ( 595) 2152 487.8 4.6e-137 XP_011517064 (OMIM: 616626) PREDICTED: probable in ( 595) 2152 487.8 4.6e-137 NP_057258 (OMIM: 616626) probable inactive glycosy ( 595) 2152 487.8 4.6e-137 NP_001273689 (OMIM: 616626) probable inactive glyc ( 517) 1874 426.0 1.6e-118 XP_011517065 (OMIM: 616626) PREDICTED: probable in ( 517) 1874 426.0 1.6e-118 NP_000926 (OMIM: 601865,609220) procollagen-lysine ( 737) 304 77.2 2.2e-13 NP_001075 (OMIM: 603066,612394) procollagen-lysine ( 738) 284 72.8 4.8e-12 NP_000293 (OMIM: 153454,225400) procollagen-lysine ( 727) 283 72.6 5.5e-12 NP_001303249 (OMIM: 153454,225400) procollagen-lys ( 774) 283 72.6 5.8e-12 XP_005247592 (OMIM: 601865,609220) PREDICTED: proc ( 666) 263 68.1 1.1e-10 XP_016862114 (OMIM: 601865,609220) PREDICTED: proc ( 666) 263 68.1 1.1e-10 NP_891988 (OMIM: 601865,609220) procollagen-lysine ( 758) 263 68.1 1.2e-10 >>XP_016870283 (OMIM: 616626) PREDICTED: probable inacti (595 aa) initn: 2096 init1: 1712 opt: 2152 Z-score: 2581.8 bits: 487.8 E(85289): 4.6e-137 Smith-Waterman score: 2153; 52.8% identity (78.7% similar) in 581 aa overlap (47-626:27-595) 20 30 40 50 60 70 pF1KA0 SSALLREGCRARFVAERDSEDDGEEPVVFPESPLQSPTVLVAVLARNAAHTLPHFLGCLE :::: :.:..:.::::: :.:::.:: :: XP_016 MRAARAAPLLQLLLLLGPWLEAAGVAESPL--PAVVLAILARNAEHSLPHYLGALE 10 20 30 40 50 80 90 100 110 120 130 pF1KA0 RLDYPKSRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVEWRPMDEPESYPDEIGPKHW :::::..:::.: :::::::::::...::: : : : ::: ::. :::: ::::: XP_016 RLDYPRARMALWCATDHNVDNTTEMLQEWLAAVGDDYAAVVWRPEGEPRFYPDEEGPKHW 60 70 80 90 100 110 140 150 160 170 180 190 pF1KA0 PTSRFAHVMKLRQAALRTAREKWSDYILFIDVDNFLTNPQTLNLLIAENKTIVAPMLESR : .:.:.: :: ::. .::::: :.::.::: ::: ::.... .:::::.:. XP_016 TKERHQFLMELKQEALTFARNWGADYILFADTDNILTNNQTLRLLMGQGLPVVAPMLDSQ 120 130 140 150 160 170 200 210 220 230 240 250 pF1KA0 GLYSNFWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLIDLRKEASDKLTFYPP ::::::::::.:.:.:: .: .. .: ::: ::::::::: .:: :..:.:.:::: XP_016 TYYSNFWCGITPQGYYRRTAEYFPTKNRQRRGCFRVPMVHSTFLASLRAEGADQLAFYPP 180 190 200 210 220 230 260 270 280 290 300 310 pF1KA0 HQDYTWTFDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQTLQEDIENLIHVQIEA : .::: ::::::::.. . ::.....::...:::. .:.: :: :... :.::. .:: XP_016 HPNYTWPFDDIIVFAYACQAAGVSVHVCNEHRYGYMNVPVKSHQGLEDERVNFIHLILEA 240 250 260 270 280 290 320 330 340 350 360 370 pF1KA0 MIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEVKIVEAV ..: : :. : .:. : :.:.::::.:.:.: :: :::.::: .:.:.:: ..:.:: XP_016 LVDGPRMQASAHVTRPSKRPSKIGFDEVFVISLARRPDRRERMLASLWEMEISGRVVDAV 300 310 320 330 340 350 380 390 400 410 420 430 pF1KA0 DGKALNTSQLKALNIEMLPGYRDPYSSRPLTRGEIGCFLSHYSVWKEVIDRELEKTLVIE :: ::.: .. :....::::.::::.: ::.::.::::::::.:.::. : : ..::.: XP_016 DGWMLNSSAIRNLGVDLLPGYQDPYSGRTLTKGEVGCFLSHYSIWEEVVARGLARVLVFE 360 370 380 390 400 410 440 450 460 470 480 490 pF1KA0 DDVRFEHQFKKKLMKLMDNIDQAQLDWELIYIGRKRMQVKEPEKAVPNVANLVEADYSYW :::::: .:. .: .::.... .:.:.:::.:::... : : :: .. .:: : :::: XP_016 DDVRFESNFRGRLERLMEDVEAEKLSWDLIYLGRKQVN-PEKETAVEGLPGLVVAGYSYW 420 430 440 450 460 470 500 510 520 530 540 550 pF1KA0 TLGYVISLEGAQKLVGANPFGKMLPVDEFLPVMYNKHPVAEYKEYYESRDLKAFSAEPLL ::.:.. : ::.::....:. .:::::::::.:...:: .:: .. ::: ::::.::: XP_016 TLAYALRLAGARKLLASQPLRRMLPVDEFLPIMFDQHPNEQYKAHFWPRDLVAFSAQPLL 480 490 500 510 520 530 560 570 580 590 600 610 pF1KA0 IYPTHYTGQPGYLSDTETSTIWDNET-VATDWDRTHAWKSRKQSRIYSNAKNTEALPPPT ::::.:. .:::::::. ::... .: . . :. .. :. .... ..: : XP_016 AAPTHYAGDAEWLSDTETSSPWDDDSGRLISW--SGSQKTLRSPRLDLTGSSGHSLQPQ- 540 550 560 570 580 590 620 pF1KA0 SLDTVPSRDEL : :::: XP_016 -----P-RDEL >>XP_005252092 (OMIM: 616626) PREDICTED: probable inacti (595 aa) initn: 2096 init1: 1712 opt: 2152 Z-score: 2581.8 bits: 487.8 E(85289): 4.6e-137 Smith-Waterman score: 2153; 52.8% identity (78.7% similar) in 581 aa overlap (47-626:27-595) 20 30 40 50 60 70 pF1KA0 SSALLREGCRARFVAERDSEDDGEEPVVFPESPLQSPTVLVAVLARNAAHTLPHFLGCLE :::: :.:..:.::::: :.:::.:: :: XP_005 MRAARAAPLLQLLLLLGPWLEAAGVAESPL--PAVVLAILARNAEHSLPHYLGALE 10 20 30 40 50 80 90 100 110 120 130 pF1KA0 RLDYPKSRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVEWRPMDEPESYPDEIGPKHW :::::..:::.: :::::::::::...::: : : : ::: ::. :::: ::::: XP_005 RLDYPRARMALWCATDHNVDNTTEMLQEWLAAVGDDYAAVVWRPEGEPRFYPDEEGPKHW 60 70 80 90 100 110 140 150 160 170 180 190 pF1KA0 PTSRFAHVMKLRQAALRTAREKWSDYILFIDVDNFLTNPQTLNLLIAENKTIVAPMLESR : .:.:.: :: ::. .::::: :.::.::: ::: ::.... .:::::.:. XP_005 TKERHQFLMELKQEALTFARNWGADYILFADTDNILTNNQTLRLLMGQGLPVVAPMLDSQ 120 130 140 150 160 170 200 210 220 230 240 250 pF1KA0 GLYSNFWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLIDLRKEASDKLTFYPP ::::::::::.:.:.:: .: .. .: ::: ::::::::: .:: :..:.:.:::: XP_005 TYYSNFWCGITPQGYYRRTAEYFPTKNRQRRGCFRVPMVHSTFLASLRAEGADQLAFYPP 180 190 200 210 220 230 260 270 280 290 300 310 pF1KA0 HQDYTWTFDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQTLQEDIENLIHVQIEA : .::: ::::::::.. . ::.....::...:::. .:.: :: :... :.::. .:: XP_005 HPNYTWPFDDIIVFAYACQAAGVSVHVCNEHRYGYMNVPVKSHQGLEDERVNFIHLILEA 240 250 260 270 280 290 320 330 340 350 360 370 pF1KA0 MIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEVKIVEAV ..: : :. : .:. : :.:.::::.:.:.: :: :::.::: .:.:.:: ..:.:: XP_005 LVDGPRMQASAHVTRPSKRPSKIGFDEVFVISLARRPDRRERMLASLWEMEISGRVVDAV 300 310 320 330 340 350 380 390 400 410 420 430 pF1KA0 DGKALNTSQLKALNIEMLPGYRDPYSSRPLTRGEIGCFLSHYSVWKEVIDRELEKTLVIE :: ::.: .. :....::::.::::.: ::.::.::::::::.:.::. : : ..::.: XP_005 DGWMLNSSAIRNLGVDLLPGYQDPYSGRTLTKGEVGCFLSHYSIWEEVVARGLARVLVFE 360 370 380 390 400 410 440 450 460 470 480 490 pF1KA0 DDVRFEHQFKKKLMKLMDNIDQAQLDWELIYIGRKRMQVKEPEKAVPNVANLVEADYSYW :::::: .:. .: .::.... .:.:.:::.:::... : : :: .. .:: : :::: XP_005 DDVRFESNFRGRLERLMEDVEAEKLSWDLIYLGRKQVN-PEKETAVEGLPGLVVAGYSYW 420 430 440 450 460 470 500 510 520 530 540 550 pF1KA0 TLGYVISLEGAQKLVGANPFGKMLPVDEFLPVMYNKHPVAEYKEYYESRDLKAFSAEPLL ::.:.. : ::.::....:. .:::::::::.:...:: .:: .. ::: ::::.::: XP_005 TLAYALRLAGARKLLASQPLRRMLPVDEFLPIMFDQHPNEQYKAHFWPRDLVAFSAQPLL 480 490 500 510 520 530 560 570 580 590 600 610 pF1KA0 IYPTHYTGQPGYLSDTETSTIWDNET-VATDWDRTHAWKSRKQSRIYSNAKNTEALPPPT ::::.:. .:::::::. ::... .: . . :. .. :. .... ..: : XP_005 AAPTHYAGDAEWLSDTETSSPWDDDSGRLISW--SGSQKTLRSPRLDLTGSSGHSLQPQ- 540 550 560 570 580 590 620 pF1KA0 SLDTVPSRDEL : :::: XP_005 -----P-RDEL >>XP_011517064 (OMIM: 616626) PREDICTED: probable inacti (595 aa) initn: 2096 init1: 1712 opt: 2152 Z-score: 2581.8 bits: 487.8 E(85289): 4.6e-137 Smith-Waterman score: 2153; 52.8% identity (78.7% similar) in 581 aa overlap (47-626:27-595) 20 30 40 50 60 70 pF1KA0 SSALLREGCRARFVAERDSEDDGEEPVVFPESPLQSPTVLVAVLARNAAHTLPHFLGCLE :::: :.:..:.::::: :.:::.:: :: XP_011 MRAARAAPLLQLLLLLGPWLEAAGVAESPL--PAVVLAILARNAEHSLPHYLGALE 10 20 30 40 50 80 90 100 110 120 130 pF1KA0 RLDYPKSRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVEWRPMDEPESYPDEIGPKHW :::::..:::.: :::::::::::...::: : : : ::: ::. :::: ::::: XP_011 RLDYPRARMALWCATDHNVDNTTEMLQEWLAAVGDDYAAVVWRPEGEPRFYPDEEGPKHW 60 70 80 90 100 110 140 150 160 170 180 190 pF1KA0 PTSRFAHVMKLRQAALRTAREKWSDYILFIDVDNFLTNPQTLNLLIAENKTIVAPMLESR : .:.:.: :: ::. .::::: :.::.::: ::: ::.... .:::::.:. XP_011 TKERHQFLMELKQEALTFARNWGADYILFADTDNILTNNQTLRLLMGQGLPVVAPMLDSQ 120 130 140 150 160 170 200 210 220 230 240 250 pF1KA0 GLYSNFWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLIDLRKEASDKLTFYPP ::::::::::.:.:.:: .: .. .: ::: ::::::::: .:: :..:.:.:::: XP_011 TYYSNFWCGITPQGYYRRTAEYFPTKNRQRRGCFRVPMVHSTFLASLRAEGADQLAFYPP 180 190 200 210 220 230 260 270 280 290 300 310 pF1KA0 HQDYTWTFDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQTLQEDIENLIHVQIEA : .::: ::::::::.. . ::.....::...:::. .:.: :: :... :.::. .:: XP_011 HPNYTWPFDDIIVFAYACQAAGVSVHVCNEHRYGYMNVPVKSHQGLEDERVNFIHLILEA 240 250 260 270 280 290 320 330 340 350 360 370 pF1KA0 MIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEVKIVEAV ..: : :. : .:. : :.:.::::.:.:.: :: :::.::: .:.:.:: ..:.:: XP_011 LVDGPRMQASAHVTRPSKRPSKIGFDEVFVISLARRPDRRERMLASLWEMEISGRVVDAV 300 310 320 330 340 350 380 390 400 410 420 430 pF1KA0 DGKALNTSQLKALNIEMLPGYRDPYSSRPLTRGEIGCFLSHYSVWKEVIDRELEKTLVIE :: ::.: .. :....::::.::::.: ::.::.::::::::.:.::. : : ..::.: XP_011 DGWMLNSSAIRNLGVDLLPGYQDPYSGRTLTKGEVGCFLSHYSIWEEVVARGLARVLVFE 360 370 380 390 400 410 440 450 460 470 480 490 pF1KA0 DDVRFEHQFKKKLMKLMDNIDQAQLDWELIYIGRKRMQVKEPEKAVPNVANLVEADYSYW :::::: .:. .: .::.... .:.:.:::.:::... : : :: .. .:: : :::: XP_011 DDVRFESNFRGRLERLMEDVEAEKLSWDLIYLGRKQVN-PEKETAVEGLPGLVVAGYSYW 420 430 440 450 460 470 500 510 520 530 540 550 pF1KA0 TLGYVISLEGAQKLVGANPFGKMLPVDEFLPVMYNKHPVAEYKEYYESRDLKAFSAEPLL ::.:.. : ::.::....:. .:::::::::.:...:: .:: .. ::: ::::.::: XP_011 TLAYALRLAGARKLLASQPLRRMLPVDEFLPIMFDQHPNEQYKAHFWPRDLVAFSAQPLL 480 490 500 510 520 530 560 570 580 590 600 610 pF1KA0 IYPTHYTGQPGYLSDTETSTIWDNET-VATDWDRTHAWKSRKQSRIYSNAKNTEALPPPT ::::.:. .:::::::. ::... .: . . :. .. :. .... ..: : XP_011 AAPTHYAGDAEWLSDTETSSPWDDDSGRLISW--SGSQKTLRSPRLDLTGSSGHSLQPQ- 540 550 560 570 580 590 620 pF1KA0 SLDTVPSRDEL : :::: XP_011 -----P-RDEL >>NP_057258 (OMIM: 616626) probable inactive glycosyltra (595 aa) initn: 2096 init1: 1712 opt: 2152 Z-score: 2581.8 bits: 487.8 E(85289): 4.6e-137 Smith-Waterman score: 2153; 52.8% identity (78.7% similar) in 581 aa overlap (47-626:27-595) 20 30 40 50 60 70 pF1KA0 SSALLREGCRARFVAERDSEDDGEEPVVFPESPLQSPTVLVAVLARNAAHTLPHFLGCLE :::: :.:..:.::::: :.:::.:: :: NP_057 MRAARAAPLLQLLLLLGPWLEAAGVAESPL--PAVVLAILARNAEHSLPHYLGALE 10 20 30 40 50 80 90 100 110 120 130 pF1KA0 RLDYPKSRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVEWRPMDEPESYPDEIGPKHW :::::..:::.: :::::::::::...::: : : : ::: ::. :::: ::::: NP_057 RLDYPRARMALWCATDHNVDNTTEMLQEWLAAVGDDYAAVVWRPEGEPRFYPDEEGPKHW 60 70 80 90 100 110 140 150 160 170 180 190 pF1KA0 PTSRFAHVMKLRQAALRTAREKWSDYILFIDVDNFLTNPQTLNLLIAENKTIVAPMLESR : .:.:.: :: ::. .::::: :.::.::: ::: ::.... .:::::.:. NP_057 TKERHQFLMELKQEALTFARNWGADYILFADTDNILTNNQTLRLLMGQGLPVVAPMLDSQ 120 130 140 150 160 170 200 210 220 230 240 250 pF1KA0 GLYSNFWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLIDLRKEASDKLTFYPP ::::::::::.:.:.:: .: .. .: ::: ::::::::: .:: :..:.:.:::: NP_057 TYYSNFWCGITPQGYYRRTAEYFPTKNRQRRGCFRVPMVHSTFLASLRAEGADQLAFYPP 180 190 200 210 220 230 260 270 280 290 300 310 pF1KA0 HQDYTWTFDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQTLQEDIENLIHVQIEA : .::: ::::::::.. . ::.....::...:::. .:.: :: :... :.::. .:: NP_057 HPNYTWPFDDIIVFAYACQAAGVSVHVCNEHRYGYMNVPVKSHQGLEDERVNFIHLILEA 240 250 260 270 280 290 320 330 340 350 360 370 pF1KA0 MIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEVKIVEAV ..: : :. : .:. : :.:.::::.:.:.: :: :::.::: .:.:.:: ..:.:: NP_057 LVDGPRMQASAHVTRPSKRPSKIGFDEVFVISLARRPDRRERMLASLWEMEISGRVVDAV 300 310 320 330 340 350 380 390 400 410 420 430 pF1KA0 DGKALNTSQLKALNIEMLPGYRDPYSSRPLTRGEIGCFLSHYSVWKEVIDRELEKTLVIE :: ::.: .. :....::::.::::.: ::.::.::::::::.:.::. : : ..::.: NP_057 DGWMLNSSAIRNLGVDLLPGYQDPYSGRTLTKGEVGCFLSHYSIWEEVVARGLARVLVFE 360 370 380 390 400 410 440 450 460 470 480 490 pF1KA0 DDVRFEHQFKKKLMKLMDNIDQAQLDWELIYIGRKRMQVKEPEKAVPNVANLVEADYSYW :::::: .:. .: .::.... .:.:.:::.:::... : : :: .. .:: : :::: NP_057 DDVRFESNFRGRLERLMEDVEAEKLSWDLIYLGRKQVN-PEKETAVEGLPGLVVAGYSYW 420 430 440 450 460 470 500 510 520 530 540 550 pF1KA0 TLGYVISLEGAQKLVGANPFGKMLPVDEFLPVMYNKHPVAEYKEYYESRDLKAFSAEPLL ::.:.. : ::.::....:. .:::::::::.:...:: .:: .. ::: ::::.::: NP_057 TLAYALRLAGARKLLASQPLRRMLPVDEFLPIMFDQHPNEQYKAHFWPRDLVAFSAQPLL 480 490 500 510 520 530 560 570 580 590 600 610 pF1KA0 IYPTHYTGQPGYLSDTETSTIWDNET-VATDWDRTHAWKSRKQSRIYSNAKNTEALPPPT ::::.:. .:::::::. ::... .: . . :. .. :. .... ..: : NP_057 AAPTHYAGDAEWLSDTETSSPWDDDSGRLISW--SGSQKTLRSPRLDLTGSSGHSLQPQ- 540 550 560 570 580 590 620 pF1KA0 SLDTVPSRDEL : :::: NP_057 -----P-RDEL >>NP_001273689 (OMIM: 616626) probable inactive glycosyl (517 aa) initn: 1852 init1: 1468 opt: 1874 Z-score: 2248.7 bits: 426.0 E(85289): 1.6e-118 Smith-Waterman score: 1875; 50.7% identity (77.6% similar) in 527 aa overlap (101-626:1-517) 80 90 100 110 120 130 pF1KA0 FLGCLERLDYPKSRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVEWRPMDEPESYPDE ...::: : : : ::: ::. :::: NP_001 MLQEWLAAVGDDYAAVVWRPEGEPRFYPDE 10 20 30 140 150 160 170 180 190 pF1KA0 IGPKHWPTSRFAHVMKLRQAALRTAREKWSDYILFIDVDNFLTNPQTLNLLIAENKTIVA ::::: : .:.:.: :: ::. .::::: :.::.::: ::: ::.... .:: NP_001 EGPKHWTKERHQFLMELKQEALTFARNWGADYILFADTDNILTNNQTLRLLMGQGLPVVA 40 50 60 70 80 90 200 210 220 230 240 250 pF1KA0 PMLESRGLYSNFWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLIDLRKEASDK :::.:. ::::::::::.:.:.:: .: .. .: ::: ::::::::: .:: :..:. NP_001 PMLDSQTYYSNFWCGITPQGYYRRTAEYFPTKNRQRRGCFRVPMVHSTFLASLRAEGADQ 100 110 120 130 140 150 260 270 280 290 300 310 pF1KA0 LTFYPPHQDYTWTFDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQTLQEDIENLI :.::::: .::: ::::::::.. . ::.....::...:::. .:.: :: :... :.: NP_001 LAFYPPHPNYTWPFDDIIVFAYACQAAGVSVHVCNEHRYGYMNVPVKSHQGLEDERVNFI 160 170 180 190 200 210 320 330 340 350 360 370 pF1KA0 HVQIEAMIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEV :. .::..: : :. : .:. : :.:.::::.:.:.: :: :::.::: .:.:.:: NP_001 HLILEALVDGPRMQASAHVTRPSKRPSKIGFDEVFVISLARRPDRRERMLASLWEMEISG 220 230 240 250 260 270 380 390 400 410 420 430 pF1KA0 KIVEAVDGKALNTSQLKALNIEMLPGYRDPYSSRPLTRGEIGCFLSHYSVWKEVIDRELE ..:.:::: ::.: .. :....::::.::::.: ::.::.::::::::.:.::. : : NP_001 RVVDAVDGWMLNSSAIRNLGVDLLPGYQDPYSGRTLTKGEVGCFLSHYSIWEEVVARGLA 280 290 300 310 320 330 440 450 460 470 480 490 pF1KA0 KTLVIEDDVRFEHQFKKKLMKLMDNIDQAQLDWELIYIGRKRMQVKEPEKAVPNVANLVE ..::.::::::: .:. .: .::.... .:.:.:::.:::... : : :: .. .:: NP_001 RVLVFEDDVRFESNFRGRLERLMEDVEAEKLSWDLIYLGRKQVN-PEKETAVEGLPGLVV 340 350 360 370 380 500 510 520 530 540 550 pF1KA0 ADYSYWTLGYVISLEGAQKLVGANPFGKMLPVDEFLPVMYNKHPVAEYKEYYESRDLKAF : ::::::.:.. : ::.::....:. .:::::::::.:...:: .:: .. ::: :: NP_001 AGYSYWTLAYALRLAGARKLLASQPLRRMLPVDEFLPIMFDQHPNEQYKAHFWPRDLVAF 390 400 410 420 430 440 560 570 580 590 600 pF1KA0 SAEPLLIYPTHYTGQPGYLSDTETSTIWDNET-VATDWDRTHAWKSRKQSRIYSNAKNTE ::.::: ::::.:. .:::::::. ::... .:. .. :. .. :. .... . NP_001 SAQPLLAAPTHYAGDAEWLSDTETSSPWDDDSGRLISWSGSQ--KTLRSPRLDLTGSSGH 450 460 470 480 490 500 610 620 pF1KA0 ALPPPTSLDTVPSRDEL .: : : :::: NP_001 SLQPQ------P-RDEL 510 >>XP_011517065 (OMIM: 616626) PREDICTED: probable inacti (517 aa) initn: 1852 init1: 1468 opt: 1874 Z-score: 2248.7 bits: 426.0 E(85289): 1.6e-118 Smith-Waterman score: 1875; 50.7% identity (77.6% similar) in 527 aa overlap (101-626:1-517) 80 90 100 110 120 130 pF1KA0 FLGCLERLDYPKSRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVEWRPMDEPESYPDE ...::: : : : ::: ::. :::: XP_011 MLQEWLAAVGDDYAAVVWRPEGEPRFYPDE 10 20 30 140 150 160 170 180 190 pF1KA0 IGPKHWPTSRFAHVMKLRQAALRTAREKWSDYILFIDVDNFLTNPQTLNLLIAENKTIVA ::::: : .:.:.: :: ::. .::::: :.::.::: ::: ::.... .:: XP_011 EGPKHWTKERHQFLMELKQEALTFARNWGADYILFADTDNILTNNQTLRLLMGQGLPVVA 40 50 60 70 80 90 200 210 220 230 240 250 pF1KA0 PMLESRGLYSNFWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLIDLRKEASDK :::.:. ::::::::::.:.:.:: .: .. .: ::: ::::::::: .:: :..:. XP_011 PMLDSQTYYSNFWCGITPQGYYRRTAEYFPTKNRQRRGCFRVPMVHSTFLASLRAEGADQ 100 110 120 130 140 150 260 270 280 290 300 310 pF1KA0 LTFYPPHQDYTWTFDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQTLQEDIENLI :.::::: .::: ::::::::.. . ::.....::...:::. .:.: :: :... :.: XP_011 LAFYPPHPNYTWPFDDIIVFAYACQAAGVSVHVCNEHRYGYMNVPVKSHQGLEDERVNFI 160 170 180 190 200 210 320 330 340 350 360 370 pF1KA0 HVQIEAMIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEV :. .::..: : :. : .:. : :.:.::::.:.:.: :: :::.::: .:.:.:: XP_011 HLILEALVDGPRMQASAHVTRPSKRPSKIGFDEVFVISLARRPDRRERMLASLWEMEISG 220 230 240 250 260 270 380 390 400 410 420 430 pF1KA0 KIVEAVDGKALNTSQLKALNIEMLPGYRDPYSSRPLTRGEIGCFLSHYSVWKEVIDRELE ..:.:::: ::.: .. :....::::.::::.: ::.::.::::::::.:.::. : : XP_011 RVVDAVDGWMLNSSAIRNLGVDLLPGYQDPYSGRTLTKGEVGCFLSHYSIWEEVVARGLA 280 290 300 310 320 330 440 450 460 470 480 490 pF1KA0 KTLVIEDDVRFEHQFKKKLMKLMDNIDQAQLDWELIYIGRKRMQVKEPEKAVPNVANLVE ..::.::::::: .:. .: .::.... .:.:.:::.:::... : : :: .. .:: XP_011 RVLVFEDDVRFESNFRGRLERLMEDVEAEKLSWDLIYLGRKQVN-PEKETAVEGLPGLVV 340 350 360 370 380 500 510 520 530 540 550 pF1KA0 ADYSYWTLGYVISLEGAQKLVGANPFGKMLPVDEFLPVMYNKHPVAEYKEYYESRDLKAF : ::::::.:.. : ::.::....:. .:::::::::.:...:: .:: .. ::: :: XP_011 AGYSYWTLAYALRLAGARKLLASQPLRRMLPVDEFLPIMFDQHPNEQYKAHFWPRDLVAF 390 400 410 420 430 440 560 570 580 590 600 pF1KA0 SAEPLLIYPTHYTGQPGYLSDTETSTIWDNET-VATDWDRTHAWKSRKQSRIYSNAKNTE ::.::: ::::.:. .:::::::. ::... .:. .. :. .. :. .... . XP_011 SAQPLLAAPTHYAGDAEWLSDTETSSPWDDDSGRLISWSGSQ--KTLRSPRLDLTGSSGH 450 460 470 480 490 500 610 620 pF1KA0 ALPPPTSLDTVPSRDEL .: : : :::: XP_011 SLQPQ------P-RDEL 510 >>NP_000926 (OMIM: 601865,609220) procollagen-lysine,2-o (737 aa) initn: 329 init1: 143 opt: 304 Z-score: 361.3 bits: 77.2 E(85289): 2.2e-13 Smith-Waterman score: 355; 29.4% identity (59.6% similar) in 272 aa overlap (29-292:268-515) 10 20 30 40 50 pF1KA0 MAARPAATLAWSLLLLSSALLREGCRARFVAERDSEDDGEEPVVFPESPLQS----PT .: . ..:.: : :.. :. NP_000 ARAKNTFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPN 240 250 260 270 280 290 60 70 80 90 100 110 pF1KA0 VLVAVLARNAAHTLPHFLGCLERLDYPKSRMAIWAATDHNVDNTTEIFREWLKNVQRLYH : ..:. .. . ::.:: : ::::: . .. :: :...: :... .. NP_000 VSIGVFIEQPTPFLPRFLDILLTLDYPKEALKLFI---HN----KEVYHE--KDIKVFFD 300 310 320 330 340 120 130 140 150 160 170 pF1KA0 YVEWRPMDEPESYPDEIGPKHWPTSRFAHVMKLRQAALRTAREKWSDYILFIDVDNFLTN . : .. .::.. .. :. : . . :: :: . .:.: ::: NP_000 ----KAKHEIKTIKI-VGPEENLSQAEARNMGMD---FCRQDEK-CDYYFSVDADVVLTN 350 360 370 380 390 180 190 200 210 220 230 pF1KA0 PQTLNLLIAENKTIVAPMLESRG-LYSNFWCGITPKGFYKRTPDYVQIREWKRTGCFPVP :.::..:: .:. :.::.. .: :.:::: ...: :.: :. :::.: . .:.: . :: NP_000 PRTLKILIEQNRKIIAPLVTRHGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVP 400 410 420 430 440 450 240 250 260 270 280 290 pF1KA0 MVHSTFLID---LRKEASDKLTFYPPHQDYTWTFDDIIVFAFSSRQAGIQMYLCNREHYG .. ...:: ::.: ... : .: .: ... ..:. :. ::. ::...: NP_000 YMANVYLIKGKTLRSEMNERNYFV---RD---KLDPDMALCRNAREMGVFMYISNRHEFG 460 470 480 490 500 510 300 310 320 330 340 350 pF1KA0 YLPIPLKPHQTLQEDIENLIHVQIEAMIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLK : NP_000 RLLSTANYNTSHYNNDLWQIFENPVDWKEKYINRDYSKIFTENIVEQPCPDVFWFPIFSE 520 530 540 550 560 570 >>NP_001075 (OMIM: 603066,612394) procollagen-lysine,2-o (738 aa) initn: 265 init1: 129 opt: 284 Z-score: 337.3 bits: 72.8 E(85289): 4.8e-12 Smith-Waterman score: 356; 30.1% identity (57.8% similar) in 282 aa overlap (53-329:296-545) 30 40 50 60 70 80 pF1KA0 EGCRARFVAERDSEDDGEEPVVFPESPLQSPTVLVAVLARNAAHTLPHFLGCLERLDYPK : :..::.... . ::.:: : :::: NP_001 GNYVPNGWTPEGGCGFCNQDRRTLPGGQPPPRVFLAVFVEQPTPFLPRFLQRLLLLDYPP 270 280 290 300 310 320 90 100 110 120 130 140 pF1KA0 SRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVE-WRPMDEPESYPDEIGPKHWPTSRF .:.... :: .:.:.: : .. : ... : .::.. . NP_001 DRVTLFL---HN----NEVFHE--------PHIADSWPQLQDHFSAVKLVGPEEALSPGE 330 340 350 360 370 150 160 170 180 190 pF1KA0 AHVMKLRQAALRTAREK-WSDYILFIDVDNFLTNPQTLNLLIAENKTIVAPMLESRG-LY : :. :. :. .. . .:.: ::: ::: .:: ::. ..:::: .: :. NP_001 A-----RDMAMDLCRQDPECEFYFSLDADAVLTNLQTLRILIEENRKVIAPMLSRHGKLW 380 390 400 410 420 200 210 220 230 240 250 pF1KA0 SNFWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLIDLRKEASDKLTFYPPHQD :::: ...: .: :. :::.. . ::.: . ::.. ....: .: : . :..: NP_001 SNFWGALSPDEYYARSEDYVELVQRKRVGVWNVPYISQAYVIR-----GDTLRMELPQRD 430 440 450 460 470 480 260 270 280 290 300 310 pF1KA0 -YTWT-FDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQTLQEDIENLIHVQIEAM .. . : ..: : :. :: ..: :....: : : . : :.: : .. . NP_001 VFSGSDTDPDMAFCKSFRDKGIFLHLSNQHEFGRL------LATSRYDTEHL-HPDLWQI 490 500 510 520 530 320 330 340 350 360 370 pF1KA0 IDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEVKIVEAVD .: : ::. NP_001 FDNPVDWKEQYIHENYSRALEGEGIVEQPCPDVYWFPLLSEQMCDELVAEMEHYGQWSGG 540 550 560 570 580 590 >>NP_000293 (OMIM: 153454,225400) procollagen-lysine,2-o (727 aa) initn: 271 init1: 138 opt: 283 Z-score: 336.1 bits: 72.6 E(85289): 5.5e-12 Smith-Waterman score: 315; 28.8% identity (59.6% similar) in 260 aa overlap (53-306:286-520) 30 40 50 60 70 80 pF1KA0 EGCRARFVAERDSEDDGEEPVVFPESPLQSPTVLVAVLARNAAHTLPHFLGCLERLDYPK :::::.:. .. . . :. : :: ::. NP_000 YIPRFWTFETGCTVCDEGLRSLKGIGDEALPTVLVGVFIEQPTPFVSLFFQRLLRLHYPQ 260 270 280 290 300 310 90 100 110 120 130 140 pF1KA0 SRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVEWRPMDEPESYPDEIGPKHWPTSRFA ..: .. .:. . ... .:.: . :. :. .::. :.: NP_000 KHMRLFIH-NHEQHHKAQV-EEFLAQHGSEYQSVKL------------VGPE----VRMA 320 330 340 350 150 160 170 180 190 200 pF1KA0 HVMKLRQAALRTAREKWSDYILFIDVDNFLTNPQTLNLLIAENKTIVAPMLESRG-LYSN .. ..: ... : . .:.: ::.:..: ::: .::...::.. .: :.:: NP_000 NADARNMGADLCRQDRSCTYYFSVDADVALTEPNSLRLLIQQNKNVIAPLMTRHGRLWSN 360 370 380 390 400 410 210 220 230 240 250 pF1KA0 FWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLID---LRKEASDKLTFYPPHQ :: ... :.: :. :::.: . .:.: . ::.. . .:: :: : ... :. :. NP_000 FWGALSADGYYARSEDYVDIVQGRRVGVWNVPYISNIYLIKGSALRGELQSSDLFH--HS 420 430 440 450 460 470 260 270 280 290 300 310 pF1KA0 DYTWTFDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQT--LQEDIENLIHVQIEA .: ..: . :: . :.: ::. :.: . : ..: :..:. NP_000 ----KLDPDMAFCANIRQQDVFMFLTNRHTLGHL-LSLDSYRTTHLHNDLWEVFSNPEDW 480 490 500 510 520 530 320 330 340 350 360 370 pF1KA0 MIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEVKIVEAV NP_000 KEKYIHQNYTKALAGKLVETPCPDVYWFPIFTEVACDELVEEMEHFGQWSLGNNKDNRIQ 540 550 560 570 580 590 >>NP_001303249 (OMIM: 153454,225400) procollagen-lysine, (774 aa) initn: 271 init1: 138 opt: 283 Z-score: 335.8 bits: 72.6 E(85289): 5.8e-12 Smith-Waterman score: 315; 28.8% identity (59.6% similar) in 260 aa overlap (53-306:333-567) 30 40 50 60 70 80 pF1KA0 EGCRARFVAERDSEDDGEEPVVFPESPLQSPTVLVAVLARNAAHTLPHFLGCLERLDYPK :::::.:. .. . . :. : :: ::. NP_001 YIPRFWTFETGCTVCDEGLRSLKGIGDEALPTVLVGVFIEQPTPFVSLFFQRLLRLHYPQ 310 320 330 340 350 360 90 100 110 120 130 140 pF1KA0 SRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVEWRPMDEPESYPDEIGPKHWPTSRFA ..: .. .:. . ... .:.: . :. :. .::. :.: NP_001 KHMRLFIH-NHEQHHKAQV-EEFLAQHGSEYQSVKL------------VGPE----VRMA 370 380 390 400 150 160 170 180 190 200 pF1KA0 HVMKLRQAALRTAREKWSDYILFIDVDNFLTNPQTLNLLIAENKTIVAPMLESRG-LYSN .. ..: ... : . .:.: ::.:..: ::: .::...::.. .: :.:: NP_001 NADARNMGADLCRQDRSCTYYFSVDADVALTEPNSLRLLIQQNKNVIAPLMTRHGRLWSN 410 420 430 440 450 460 210 220 230 240 250 pF1KA0 FWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLID---LRKEASDKLTFYPPHQ :: ... :.: :. :::.: . .:.: . ::.. . .:: :: : ... :. :. NP_001 FWGALSADGYYARSEDYVDIVQGRRVGVWNVPYISNIYLIKGSALRGELQSSDLFH--HS 470 480 490 500 510 520 260 270 280 290 300 310 pF1KA0 DYTWTFDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQT--LQEDIENLIHVQIEA .: ..: . :: . :.: ::. :.: . : ..: :..:. NP_001 ----KLDPDMAFCANIRQQDVFMFLTNRHTLGHL-LSLDSYRTTHLHNDLWEVFSNPEDW 530 540 550 560 570 320 330 340 350 360 370 pF1KA0 MIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEVKIVEAV NP_001 KEKYIHQNYTKALAGKLVETPCPDVYWFPIFTEVACDELVEEMEHFGQWSLGNNKDNRIQ 580 590 600 610 620 630 626 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 19:21:13 2016 done: Wed Nov 2 19:21:14 2016 Total Scan time: 7.630 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]