FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA0584, 626 aa
1>>>pF1KA0584 626 - 626 aa - 626 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 4.7788+/-0.000392; mu= 22.2618+/- 0.024
mean_var=69.3400+/-14.026, 0's: 0 Z-trim(112.4): 36 B-trim: 523 in 1/48
Lambda= 0.154022
statistics sampled from 21233 (21263) to 21233 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.621), E-opt: 0.2 (0.249), width: 16
Scan time: 7.630
The best scores are: opt bits E(85289)
XP_016870283 (OMIM: 616626) PREDICTED: probable in ( 595) 2152 487.8 4.6e-137
XP_005252092 (OMIM: 616626) PREDICTED: probable in ( 595) 2152 487.8 4.6e-137
XP_011517064 (OMIM: 616626) PREDICTED: probable in ( 595) 2152 487.8 4.6e-137
NP_057258 (OMIM: 616626) probable inactive glycosy ( 595) 2152 487.8 4.6e-137
NP_001273689 (OMIM: 616626) probable inactive glyc ( 517) 1874 426.0 1.6e-118
XP_011517065 (OMIM: 616626) PREDICTED: probable in ( 517) 1874 426.0 1.6e-118
NP_000926 (OMIM: 601865,609220) procollagen-lysine ( 737) 304 77.2 2.2e-13
NP_001075 (OMIM: 603066,612394) procollagen-lysine ( 738) 284 72.8 4.8e-12
NP_000293 (OMIM: 153454,225400) procollagen-lysine ( 727) 283 72.6 5.5e-12
NP_001303249 (OMIM: 153454,225400) procollagen-lys ( 774) 283 72.6 5.8e-12
XP_005247592 (OMIM: 601865,609220) PREDICTED: proc ( 666) 263 68.1 1.1e-10
XP_016862114 (OMIM: 601865,609220) PREDICTED: proc ( 666) 263 68.1 1.1e-10
NP_891988 (OMIM: 601865,609220) procollagen-lysine ( 758) 263 68.1 1.2e-10
>>XP_016870283 (OMIM: 616626) PREDICTED: probable inacti (595 aa)
initn: 2096 init1: 1712 opt: 2152 Z-score: 2581.8 bits: 487.8 E(85289): 4.6e-137
Smith-Waterman score: 2153; 52.8% identity (78.7% similar) in 581 aa overlap (47-626:27-595)
20 30 40 50 60 70
pF1KA0 SSALLREGCRARFVAERDSEDDGEEPVVFPESPLQSPTVLVAVLARNAAHTLPHFLGCLE
:::: :.:..:.::::: :.:::.:: ::
XP_016 MRAARAAPLLQLLLLLGPWLEAAGVAESPL--PAVVLAILARNAEHSLPHYLGALE
10 20 30 40 50
80 90 100 110 120 130
pF1KA0 RLDYPKSRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVEWRPMDEPESYPDEIGPKHW
:::::..:::.: :::::::::::...::: : : : ::: ::. :::: :::::
XP_016 RLDYPRARMALWCATDHNVDNTTEMLQEWLAAVGDDYAAVVWRPEGEPRFYPDEEGPKHW
60 70 80 90 100 110
140 150 160 170 180 190
pF1KA0 PTSRFAHVMKLRQAALRTAREKWSDYILFIDVDNFLTNPQTLNLLIAENKTIVAPMLESR
: .:.:.: :: ::. .::::: :.::.::: ::: ::.... .:::::.:.
XP_016 TKERHQFLMELKQEALTFARNWGADYILFADTDNILTNNQTLRLLMGQGLPVVAPMLDSQ
120 130 140 150 160 170
200 210 220 230 240 250
pF1KA0 GLYSNFWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLIDLRKEASDKLTFYPP
::::::::::.:.:.:: .: .. .: ::: ::::::::: .:: :..:.:.::::
XP_016 TYYSNFWCGITPQGYYRRTAEYFPTKNRQRRGCFRVPMVHSTFLASLRAEGADQLAFYPP
180 190 200 210 220 230
260 270 280 290 300 310
pF1KA0 HQDYTWTFDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQTLQEDIENLIHVQIEA
: .::: ::::::::.. . ::.....::...:::. .:.: :: :... :.::. .::
XP_016 HPNYTWPFDDIIVFAYACQAAGVSVHVCNEHRYGYMNVPVKSHQGLEDERVNFIHLILEA
240 250 260 270 280 290
320 330 340 350 360 370
pF1KA0 MIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEVKIVEAV
..: : :. : .:. : :.:.::::.:.:.: :: :::.::: .:.:.:: ..:.::
XP_016 LVDGPRMQASAHVTRPSKRPSKIGFDEVFVISLARRPDRRERMLASLWEMEISGRVVDAV
300 310 320 330 340 350
380 390 400 410 420 430
pF1KA0 DGKALNTSQLKALNIEMLPGYRDPYSSRPLTRGEIGCFLSHYSVWKEVIDRELEKTLVIE
:: ::.: .. :....::::.::::.: ::.::.::::::::.:.::. : : ..::.:
XP_016 DGWMLNSSAIRNLGVDLLPGYQDPYSGRTLTKGEVGCFLSHYSIWEEVVARGLARVLVFE
360 370 380 390 400 410
440 450 460 470 480 490
pF1KA0 DDVRFEHQFKKKLMKLMDNIDQAQLDWELIYIGRKRMQVKEPEKAVPNVANLVEADYSYW
:::::: .:. .: .::.... .:.:.:::.:::... : : :: .. .:: : ::::
XP_016 DDVRFESNFRGRLERLMEDVEAEKLSWDLIYLGRKQVN-PEKETAVEGLPGLVVAGYSYW
420 430 440 450 460 470
500 510 520 530 540 550
pF1KA0 TLGYVISLEGAQKLVGANPFGKMLPVDEFLPVMYNKHPVAEYKEYYESRDLKAFSAEPLL
::.:.. : ::.::....:. .:::::::::.:...:: .:: .. ::: ::::.:::
XP_016 TLAYALRLAGARKLLASQPLRRMLPVDEFLPIMFDQHPNEQYKAHFWPRDLVAFSAQPLL
480 490 500 510 520 530
560 570 580 590 600 610
pF1KA0 IYPTHYTGQPGYLSDTETSTIWDNET-VATDWDRTHAWKSRKQSRIYSNAKNTEALPPPT
::::.:. .:::::::. ::... .: . . :. .. :. .... ..: :
XP_016 AAPTHYAGDAEWLSDTETSSPWDDDSGRLISW--SGSQKTLRSPRLDLTGSSGHSLQPQ-
540 550 560 570 580 590
620
pF1KA0 SLDTVPSRDEL
: ::::
XP_016 -----P-RDEL
>>XP_005252092 (OMIM: 616626) PREDICTED: probable inacti (595 aa)
initn: 2096 init1: 1712 opt: 2152 Z-score: 2581.8 bits: 487.8 E(85289): 4.6e-137
Smith-Waterman score: 2153; 52.8% identity (78.7% similar) in 581 aa overlap (47-626:27-595)
20 30 40 50 60 70
pF1KA0 SSALLREGCRARFVAERDSEDDGEEPVVFPESPLQSPTVLVAVLARNAAHTLPHFLGCLE
:::: :.:..:.::::: :.:::.:: ::
XP_005 MRAARAAPLLQLLLLLGPWLEAAGVAESPL--PAVVLAILARNAEHSLPHYLGALE
10 20 30 40 50
80 90 100 110 120 130
pF1KA0 RLDYPKSRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVEWRPMDEPESYPDEIGPKHW
:::::..:::.: :::::::::::...::: : : : ::: ::. :::: :::::
XP_005 RLDYPRARMALWCATDHNVDNTTEMLQEWLAAVGDDYAAVVWRPEGEPRFYPDEEGPKHW
60 70 80 90 100 110
140 150 160 170 180 190
pF1KA0 PTSRFAHVMKLRQAALRTAREKWSDYILFIDVDNFLTNPQTLNLLIAENKTIVAPMLESR
: .:.:.: :: ::. .::::: :.::.::: ::: ::.... .:::::.:.
XP_005 TKERHQFLMELKQEALTFARNWGADYILFADTDNILTNNQTLRLLMGQGLPVVAPMLDSQ
120 130 140 150 160 170
200 210 220 230 240 250
pF1KA0 GLYSNFWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLIDLRKEASDKLTFYPP
::::::::::.:.:.:: .: .. .: ::: ::::::::: .:: :..:.:.::::
XP_005 TYYSNFWCGITPQGYYRRTAEYFPTKNRQRRGCFRVPMVHSTFLASLRAEGADQLAFYPP
180 190 200 210 220 230
260 270 280 290 300 310
pF1KA0 HQDYTWTFDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQTLQEDIENLIHVQIEA
: .::: ::::::::.. . ::.....::...:::. .:.: :: :... :.::. .::
XP_005 HPNYTWPFDDIIVFAYACQAAGVSVHVCNEHRYGYMNVPVKSHQGLEDERVNFIHLILEA
240 250 260 270 280 290
320 330 340 350 360 370
pF1KA0 MIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEVKIVEAV
..: : :. : .:. : :.:.::::.:.:.: :: :::.::: .:.:.:: ..:.::
XP_005 LVDGPRMQASAHVTRPSKRPSKIGFDEVFVISLARRPDRRERMLASLWEMEISGRVVDAV
300 310 320 330 340 350
380 390 400 410 420 430
pF1KA0 DGKALNTSQLKALNIEMLPGYRDPYSSRPLTRGEIGCFLSHYSVWKEVIDRELEKTLVIE
:: ::.: .. :....::::.::::.: ::.::.::::::::.:.::. : : ..::.:
XP_005 DGWMLNSSAIRNLGVDLLPGYQDPYSGRTLTKGEVGCFLSHYSIWEEVVARGLARVLVFE
360 370 380 390 400 410
440 450 460 470 480 490
pF1KA0 DDVRFEHQFKKKLMKLMDNIDQAQLDWELIYIGRKRMQVKEPEKAVPNVANLVEADYSYW
:::::: .:. .: .::.... .:.:.:::.:::... : : :: .. .:: : ::::
XP_005 DDVRFESNFRGRLERLMEDVEAEKLSWDLIYLGRKQVN-PEKETAVEGLPGLVVAGYSYW
420 430 440 450 460 470
500 510 520 530 540 550
pF1KA0 TLGYVISLEGAQKLVGANPFGKMLPVDEFLPVMYNKHPVAEYKEYYESRDLKAFSAEPLL
::.:.. : ::.::....:. .:::::::::.:...:: .:: .. ::: ::::.:::
XP_005 TLAYALRLAGARKLLASQPLRRMLPVDEFLPIMFDQHPNEQYKAHFWPRDLVAFSAQPLL
480 490 500 510 520 530
560 570 580 590 600 610
pF1KA0 IYPTHYTGQPGYLSDTETSTIWDNET-VATDWDRTHAWKSRKQSRIYSNAKNTEALPPPT
::::.:. .:::::::. ::... .: . . :. .. :. .... ..: :
XP_005 AAPTHYAGDAEWLSDTETSSPWDDDSGRLISW--SGSQKTLRSPRLDLTGSSGHSLQPQ-
540 550 560 570 580 590
620
pF1KA0 SLDTVPSRDEL
: ::::
XP_005 -----P-RDEL
>>XP_011517064 (OMIM: 616626) PREDICTED: probable inacti (595 aa)
initn: 2096 init1: 1712 opt: 2152 Z-score: 2581.8 bits: 487.8 E(85289): 4.6e-137
Smith-Waterman score: 2153; 52.8% identity (78.7% similar) in 581 aa overlap (47-626:27-595)
20 30 40 50 60 70
pF1KA0 SSALLREGCRARFVAERDSEDDGEEPVVFPESPLQSPTVLVAVLARNAAHTLPHFLGCLE
:::: :.:..:.::::: :.:::.:: ::
XP_011 MRAARAAPLLQLLLLLGPWLEAAGVAESPL--PAVVLAILARNAEHSLPHYLGALE
10 20 30 40 50
80 90 100 110 120 130
pF1KA0 RLDYPKSRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVEWRPMDEPESYPDEIGPKHW
:::::..:::.: :::::::::::...::: : : : ::: ::. :::: :::::
XP_011 RLDYPRARMALWCATDHNVDNTTEMLQEWLAAVGDDYAAVVWRPEGEPRFYPDEEGPKHW
60 70 80 90 100 110
140 150 160 170 180 190
pF1KA0 PTSRFAHVMKLRQAALRTAREKWSDYILFIDVDNFLTNPQTLNLLIAENKTIVAPMLESR
: .:.:.: :: ::. .::::: :.::.::: ::: ::.... .:::::.:.
XP_011 TKERHQFLMELKQEALTFARNWGADYILFADTDNILTNNQTLRLLMGQGLPVVAPMLDSQ
120 130 140 150 160 170
200 210 220 230 240 250
pF1KA0 GLYSNFWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLIDLRKEASDKLTFYPP
::::::::::.:.:.:: .: .. .: ::: ::::::::: .:: :..:.:.::::
XP_011 TYYSNFWCGITPQGYYRRTAEYFPTKNRQRRGCFRVPMVHSTFLASLRAEGADQLAFYPP
180 190 200 210 220 230
260 270 280 290 300 310
pF1KA0 HQDYTWTFDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQTLQEDIENLIHVQIEA
: .::: ::::::::.. . ::.....::...:::. .:.: :: :... :.::. .::
XP_011 HPNYTWPFDDIIVFAYACQAAGVSVHVCNEHRYGYMNVPVKSHQGLEDERVNFIHLILEA
240 250 260 270 280 290
320 330 340 350 360 370
pF1KA0 MIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEVKIVEAV
..: : :. : .:. : :.:.::::.:.:.: :: :::.::: .:.:.:: ..:.::
XP_011 LVDGPRMQASAHVTRPSKRPSKIGFDEVFVISLARRPDRRERMLASLWEMEISGRVVDAV
300 310 320 330 340 350
380 390 400 410 420 430
pF1KA0 DGKALNTSQLKALNIEMLPGYRDPYSSRPLTRGEIGCFLSHYSVWKEVIDRELEKTLVIE
:: ::.: .. :....::::.::::.: ::.::.::::::::.:.::. : : ..::.:
XP_011 DGWMLNSSAIRNLGVDLLPGYQDPYSGRTLTKGEVGCFLSHYSIWEEVVARGLARVLVFE
360 370 380 390 400 410
440 450 460 470 480 490
pF1KA0 DDVRFEHQFKKKLMKLMDNIDQAQLDWELIYIGRKRMQVKEPEKAVPNVANLVEADYSYW
:::::: .:. .: .::.... .:.:.:::.:::... : : :: .. .:: : ::::
XP_011 DDVRFESNFRGRLERLMEDVEAEKLSWDLIYLGRKQVN-PEKETAVEGLPGLVVAGYSYW
420 430 440 450 460 470
500 510 520 530 540 550
pF1KA0 TLGYVISLEGAQKLVGANPFGKMLPVDEFLPVMYNKHPVAEYKEYYESRDLKAFSAEPLL
::.:.. : ::.::....:. .:::::::::.:...:: .:: .. ::: ::::.:::
XP_011 TLAYALRLAGARKLLASQPLRRMLPVDEFLPIMFDQHPNEQYKAHFWPRDLVAFSAQPLL
480 490 500 510 520 530
560 570 580 590 600 610
pF1KA0 IYPTHYTGQPGYLSDTETSTIWDNET-VATDWDRTHAWKSRKQSRIYSNAKNTEALPPPT
::::.:. .:::::::. ::... .: . . :. .. :. .... ..: :
XP_011 AAPTHYAGDAEWLSDTETSSPWDDDSGRLISW--SGSQKTLRSPRLDLTGSSGHSLQPQ-
540 550 560 570 580 590
620
pF1KA0 SLDTVPSRDEL
: ::::
XP_011 -----P-RDEL
>>NP_057258 (OMIM: 616626) probable inactive glycosyltra (595 aa)
initn: 2096 init1: 1712 opt: 2152 Z-score: 2581.8 bits: 487.8 E(85289): 4.6e-137
Smith-Waterman score: 2153; 52.8% identity (78.7% similar) in 581 aa overlap (47-626:27-595)
20 30 40 50 60 70
pF1KA0 SSALLREGCRARFVAERDSEDDGEEPVVFPESPLQSPTVLVAVLARNAAHTLPHFLGCLE
:::: :.:..:.::::: :.:::.:: ::
NP_057 MRAARAAPLLQLLLLLGPWLEAAGVAESPL--PAVVLAILARNAEHSLPHYLGALE
10 20 30 40 50
80 90 100 110 120 130
pF1KA0 RLDYPKSRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVEWRPMDEPESYPDEIGPKHW
:::::..:::.: :::::::::::...::: : : : ::: ::. :::: :::::
NP_057 RLDYPRARMALWCATDHNVDNTTEMLQEWLAAVGDDYAAVVWRPEGEPRFYPDEEGPKHW
60 70 80 90 100 110
140 150 160 170 180 190
pF1KA0 PTSRFAHVMKLRQAALRTAREKWSDYILFIDVDNFLTNPQTLNLLIAENKTIVAPMLESR
: .:.:.: :: ::. .::::: :.::.::: ::: ::.... .:::::.:.
NP_057 TKERHQFLMELKQEALTFARNWGADYILFADTDNILTNNQTLRLLMGQGLPVVAPMLDSQ
120 130 140 150 160 170
200 210 220 230 240 250
pF1KA0 GLYSNFWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLIDLRKEASDKLTFYPP
::::::::::.:.:.:: .: .. .: ::: ::::::::: .:: :..:.:.::::
NP_057 TYYSNFWCGITPQGYYRRTAEYFPTKNRQRRGCFRVPMVHSTFLASLRAEGADQLAFYPP
180 190 200 210 220 230
260 270 280 290 300 310
pF1KA0 HQDYTWTFDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQTLQEDIENLIHVQIEA
: .::: ::::::::.. . ::.....::...:::. .:.: :: :... :.::. .::
NP_057 HPNYTWPFDDIIVFAYACQAAGVSVHVCNEHRYGYMNVPVKSHQGLEDERVNFIHLILEA
240 250 260 270 280 290
320 330 340 350 360 370
pF1KA0 MIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEVKIVEAV
..: : :. : .:. : :.:.::::.:.:.: :: :::.::: .:.:.:: ..:.::
NP_057 LVDGPRMQASAHVTRPSKRPSKIGFDEVFVISLARRPDRRERMLASLWEMEISGRVVDAV
300 310 320 330 340 350
380 390 400 410 420 430
pF1KA0 DGKALNTSQLKALNIEMLPGYRDPYSSRPLTRGEIGCFLSHYSVWKEVIDRELEKTLVIE
:: ::.: .. :....::::.::::.: ::.::.::::::::.:.::. : : ..::.:
NP_057 DGWMLNSSAIRNLGVDLLPGYQDPYSGRTLTKGEVGCFLSHYSIWEEVVARGLARVLVFE
360 370 380 390 400 410
440 450 460 470 480 490
pF1KA0 DDVRFEHQFKKKLMKLMDNIDQAQLDWELIYIGRKRMQVKEPEKAVPNVANLVEADYSYW
:::::: .:. .: .::.... .:.:.:::.:::... : : :: .. .:: : ::::
NP_057 DDVRFESNFRGRLERLMEDVEAEKLSWDLIYLGRKQVN-PEKETAVEGLPGLVVAGYSYW
420 430 440 450 460 470
500 510 520 530 540 550
pF1KA0 TLGYVISLEGAQKLVGANPFGKMLPVDEFLPVMYNKHPVAEYKEYYESRDLKAFSAEPLL
::.:.. : ::.::....:. .:::::::::.:...:: .:: .. ::: ::::.:::
NP_057 TLAYALRLAGARKLLASQPLRRMLPVDEFLPIMFDQHPNEQYKAHFWPRDLVAFSAQPLL
480 490 500 510 520 530
560 570 580 590 600 610
pF1KA0 IYPTHYTGQPGYLSDTETSTIWDNET-VATDWDRTHAWKSRKQSRIYSNAKNTEALPPPT
::::.:. .:::::::. ::... .: . . :. .. :. .... ..: :
NP_057 AAPTHYAGDAEWLSDTETSSPWDDDSGRLISW--SGSQKTLRSPRLDLTGSSGHSLQPQ-
540 550 560 570 580 590
620
pF1KA0 SLDTVPSRDEL
: ::::
NP_057 -----P-RDEL
>>NP_001273689 (OMIM: 616626) probable inactive glycosyl (517 aa)
initn: 1852 init1: 1468 opt: 1874 Z-score: 2248.7 bits: 426.0 E(85289): 1.6e-118
Smith-Waterman score: 1875; 50.7% identity (77.6% similar) in 527 aa overlap (101-626:1-517)
80 90 100 110 120 130
pF1KA0 FLGCLERLDYPKSRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVEWRPMDEPESYPDE
...::: : : : ::: ::. ::::
NP_001 MLQEWLAAVGDDYAAVVWRPEGEPRFYPDE
10 20 30
140 150 160 170 180 190
pF1KA0 IGPKHWPTSRFAHVMKLRQAALRTAREKWSDYILFIDVDNFLTNPQTLNLLIAENKTIVA
::::: : .:.:.: :: ::. .::::: :.::.::: ::: ::.... .::
NP_001 EGPKHWTKERHQFLMELKQEALTFARNWGADYILFADTDNILTNNQTLRLLMGQGLPVVA
40 50 60 70 80 90
200 210 220 230 240 250
pF1KA0 PMLESRGLYSNFWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLIDLRKEASDK
:::.:. ::::::::::.:.:.:: .: .. .: ::: ::::::::: .:: :..:.
NP_001 PMLDSQTYYSNFWCGITPQGYYRRTAEYFPTKNRQRRGCFRVPMVHSTFLASLRAEGADQ
100 110 120 130 140 150
260 270 280 290 300 310
pF1KA0 LTFYPPHQDYTWTFDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQTLQEDIENLI
:.::::: .::: ::::::::.. . ::.....::...:::. .:.: :: :... :.:
NP_001 LAFYPPHPNYTWPFDDIIVFAYACQAAGVSVHVCNEHRYGYMNVPVKSHQGLEDERVNFI
160 170 180 190 200 210
320 330 340 350 360 370
pF1KA0 HVQIEAMIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEV
:. .::..: : :. : .:. : :.:.::::.:.:.: :: :::.::: .:.:.::
NP_001 HLILEALVDGPRMQASAHVTRPSKRPSKIGFDEVFVISLARRPDRRERMLASLWEMEISG
220 230 240 250 260 270
380 390 400 410 420 430
pF1KA0 KIVEAVDGKALNTSQLKALNIEMLPGYRDPYSSRPLTRGEIGCFLSHYSVWKEVIDRELE
..:.:::: ::.: .. :....::::.::::.: ::.::.::::::::.:.::. : :
NP_001 RVVDAVDGWMLNSSAIRNLGVDLLPGYQDPYSGRTLTKGEVGCFLSHYSIWEEVVARGLA
280 290 300 310 320 330
440 450 460 470 480 490
pF1KA0 KTLVIEDDVRFEHQFKKKLMKLMDNIDQAQLDWELIYIGRKRMQVKEPEKAVPNVANLVE
..::.::::::: .:. .: .::.... .:.:.:::.:::... : : :: .. .::
NP_001 RVLVFEDDVRFESNFRGRLERLMEDVEAEKLSWDLIYLGRKQVN-PEKETAVEGLPGLVV
340 350 360 370 380
500 510 520 530 540 550
pF1KA0 ADYSYWTLGYVISLEGAQKLVGANPFGKMLPVDEFLPVMYNKHPVAEYKEYYESRDLKAF
: ::::::.:.. : ::.::....:. .:::::::::.:...:: .:: .. ::: ::
NP_001 AGYSYWTLAYALRLAGARKLLASQPLRRMLPVDEFLPIMFDQHPNEQYKAHFWPRDLVAF
390 400 410 420 430 440
560 570 580 590 600
pF1KA0 SAEPLLIYPTHYTGQPGYLSDTETSTIWDNET-VATDWDRTHAWKSRKQSRIYSNAKNTE
::.::: ::::.:. .:::::::. ::... .:. .. :. .. :. .... .
NP_001 SAQPLLAAPTHYAGDAEWLSDTETSSPWDDDSGRLISWSGSQ--KTLRSPRLDLTGSSGH
450 460 470 480 490 500
610 620
pF1KA0 ALPPPTSLDTVPSRDEL
.: : : ::::
NP_001 SLQPQ------P-RDEL
510
>>XP_011517065 (OMIM: 616626) PREDICTED: probable inacti (517 aa)
initn: 1852 init1: 1468 opt: 1874 Z-score: 2248.7 bits: 426.0 E(85289): 1.6e-118
Smith-Waterman score: 1875; 50.7% identity (77.6% similar) in 527 aa overlap (101-626:1-517)
80 90 100 110 120 130
pF1KA0 FLGCLERLDYPKSRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVEWRPMDEPESYPDE
...::: : : : ::: ::. ::::
XP_011 MLQEWLAAVGDDYAAVVWRPEGEPRFYPDE
10 20 30
140 150 160 170 180 190
pF1KA0 IGPKHWPTSRFAHVMKLRQAALRTAREKWSDYILFIDVDNFLTNPQTLNLLIAENKTIVA
::::: : .:.:.: :: ::. .::::: :.::.::: ::: ::.... .::
XP_011 EGPKHWTKERHQFLMELKQEALTFARNWGADYILFADTDNILTNNQTLRLLMGQGLPVVA
40 50 60 70 80 90
200 210 220 230 240 250
pF1KA0 PMLESRGLYSNFWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLIDLRKEASDK
:::.:. ::::::::::.:.:.:: .: .. .: ::: ::::::::: .:: :..:.
XP_011 PMLDSQTYYSNFWCGITPQGYYRRTAEYFPTKNRQRRGCFRVPMVHSTFLASLRAEGADQ
100 110 120 130 140 150
260 270 280 290 300 310
pF1KA0 LTFYPPHQDYTWTFDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQTLQEDIENLI
:.::::: .::: ::::::::.. . ::.....::...:::. .:.: :: :... :.:
XP_011 LAFYPPHPNYTWPFDDIIVFAYACQAAGVSVHVCNEHRYGYMNVPVKSHQGLEDERVNFI
160 170 180 190 200 210
320 330 340 350 360 370
pF1KA0 HVQIEAMIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEV
:. .::..: : :. : .:. : :.:.::::.:.:.: :: :::.::: .:.:.::
XP_011 HLILEALVDGPRMQASAHVTRPSKRPSKIGFDEVFVISLARRPDRRERMLASLWEMEISG
220 230 240 250 260 270
380 390 400 410 420 430
pF1KA0 KIVEAVDGKALNTSQLKALNIEMLPGYRDPYSSRPLTRGEIGCFLSHYSVWKEVIDRELE
..:.:::: ::.: .. :....::::.::::.: ::.::.::::::::.:.::. : :
XP_011 RVVDAVDGWMLNSSAIRNLGVDLLPGYQDPYSGRTLTKGEVGCFLSHYSIWEEVVARGLA
280 290 300 310 320 330
440 450 460 470 480 490
pF1KA0 KTLVIEDDVRFEHQFKKKLMKLMDNIDQAQLDWELIYIGRKRMQVKEPEKAVPNVANLVE
..::.::::::: .:. .: .::.... .:.:.:::.:::... : : :: .. .::
XP_011 RVLVFEDDVRFESNFRGRLERLMEDVEAEKLSWDLIYLGRKQVN-PEKETAVEGLPGLVV
340 350 360 370 380
500 510 520 530 540 550
pF1KA0 ADYSYWTLGYVISLEGAQKLVGANPFGKMLPVDEFLPVMYNKHPVAEYKEYYESRDLKAF
: ::::::.:.. : ::.::....:. .:::::::::.:...:: .:: .. ::: ::
XP_011 AGYSYWTLAYALRLAGARKLLASQPLRRMLPVDEFLPIMFDQHPNEQYKAHFWPRDLVAF
390 400 410 420 430 440
560 570 580 590 600
pF1KA0 SAEPLLIYPTHYTGQPGYLSDTETSTIWDNET-VATDWDRTHAWKSRKQSRIYSNAKNTE
::.::: ::::.:. .:::::::. ::... .:. .. :. .. :. .... .
XP_011 SAQPLLAAPTHYAGDAEWLSDTETSSPWDDDSGRLISWSGSQ--KTLRSPRLDLTGSSGH
450 460 470 480 490 500
610 620
pF1KA0 ALPPPTSLDTVPSRDEL
.: : : ::::
XP_011 SLQPQ------P-RDEL
510
>>NP_000926 (OMIM: 601865,609220) procollagen-lysine,2-o (737 aa)
initn: 329 init1: 143 opt: 304 Z-score: 361.3 bits: 77.2 E(85289): 2.2e-13
Smith-Waterman score: 355; 29.4% identity (59.6% similar) in 272 aa overlap (29-292:268-515)
10 20 30 40 50
pF1KA0 MAARPAATLAWSLLLLSSALLREGCRARFVAERDSEDDGEEPVVFPESPLQS----PT
.: . ..:.: : :.. :.
NP_000 ARAKNTFYETLPVAINGNGPTKILLNYFGNYVPNSWTQDNGCTLCEFDTVDLSAVDVHPN
240 250 260 270 280 290
60 70 80 90 100 110
pF1KA0 VLVAVLARNAAHTLPHFLGCLERLDYPKSRMAIWAATDHNVDNTTEIFREWLKNVQRLYH
: ..:. .. . ::.:: : ::::: . .. :: :...: :... ..
NP_000 VSIGVFIEQPTPFLPRFLDILLTLDYPKEALKLFI---HN----KEVYHE--KDIKVFFD
300 310 320 330 340
120 130 140 150 160 170
pF1KA0 YVEWRPMDEPESYPDEIGPKHWPTSRFAHVMKLRQAALRTAREKWSDYILFIDVDNFLTN
. : .. .::.. .. :. : . . :: :: . .:.: :::
NP_000 ----KAKHEIKTIKI-VGPEENLSQAEARNMGMD---FCRQDEK-CDYYFSVDADVVLTN
350 360 370 380 390
180 190 200 210 220 230
pF1KA0 PQTLNLLIAENKTIVAPMLESRG-LYSNFWCGITPKGFYKRTPDYVQIREWKRTGCFPVP
:.::..:: .:. :.::.. .: :.:::: ...: :.: :. :::.: . .:.: . ::
NP_000 PRTLKILIEQNRKIIAPLVTRHGKLWSNFWGALSPDGYYARSEDYVDIVQGNRVGVWNVP
400 410 420 430 440 450
240 250 260 270 280 290
pF1KA0 MVHSTFLID---LRKEASDKLTFYPPHQDYTWTFDDIIVFAFSSRQAGIQMYLCNREHYG
.. ...:: ::.: ... : .: .: ... ..:. :. ::. ::...:
NP_000 YMANVYLIKGKTLRSEMNERNYFV---RD---KLDPDMALCRNAREMGVFMYISNRHEFG
460 470 480 490 500 510
300 310 320 330 340 350
pF1KA0 YLPIPLKPHQTLQEDIENLIHVQIEAMIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLK
:
NP_000 RLLSTANYNTSHYNNDLWQIFENPVDWKEKYINRDYSKIFTENIVEQPCPDVFWFPIFSE
520 530 540 550 560 570
>>NP_001075 (OMIM: 603066,612394) procollagen-lysine,2-o (738 aa)
initn: 265 init1: 129 opt: 284 Z-score: 337.3 bits: 72.8 E(85289): 4.8e-12
Smith-Waterman score: 356; 30.1% identity (57.8% similar) in 282 aa overlap (53-329:296-545)
30 40 50 60 70 80
pF1KA0 EGCRARFVAERDSEDDGEEPVVFPESPLQSPTVLVAVLARNAAHTLPHFLGCLERLDYPK
: :..::.... . ::.:: : ::::
NP_001 GNYVPNGWTPEGGCGFCNQDRRTLPGGQPPPRVFLAVFVEQPTPFLPRFLQRLLLLDYPP
270 280 290 300 310 320
90 100 110 120 130 140
pF1KA0 SRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVE-WRPMDEPESYPDEIGPKHWPTSRF
.:.... :: .:.:.: : .. : ... : .::.. .
NP_001 DRVTLFL---HN----NEVFHE--------PHIADSWPQLQDHFSAVKLVGPEEALSPGE
330 340 350 360 370
150 160 170 180 190
pF1KA0 AHVMKLRQAALRTAREK-WSDYILFIDVDNFLTNPQTLNLLIAENKTIVAPMLESRG-LY
: :. :. :. .. . .:.: ::: ::: .:: ::. ..:::: .: :.
NP_001 A-----RDMAMDLCRQDPECEFYFSLDADAVLTNLQTLRILIEENRKVIAPMLSRHGKLW
380 390 400 410 420
200 210 220 230 240 250
pF1KA0 SNFWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLIDLRKEASDKLTFYPPHQD
:::: ...: .: :. :::.. . ::.: . ::.. ....: .: : . :..:
NP_001 SNFWGALSPDEYYARSEDYVELVQRKRVGVWNVPYISQAYVIR-----GDTLRMELPQRD
430 440 450 460 470 480
260 270 280 290 300 310
pF1KA0 -YTWT-FDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQTLQEDIENLIHVQIEAM
.. . : ..: : :. :: ..: :....: : : . : :.: : .. .
NP_001 VFSGSDTDPDMAFCKSFRDKGIFLHLSNQHEFGRL------LATSRYDTEHL-HPDLWQI
490 500 510 520 530
320 330 340 350 360 370
pF1KA0 IDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEVKIVEAVD
.: : ::.
NP_001 FDNPVDWKEQYIHENYSRALEGEGIVEQPCPDVYWFPLLSEQMCDELVAEMEHYGQWSGG
540 550 560 570 580 590
>>NP_000293 (OMIM: 153454,225400) procollagen-lysine,2-o (727 aa)
initn: 271 init1: 138 opt: 283 Z-score: 336.1 bits: 72.6 E(85289): 5.5e-12
Smith-Waterman score: 315; 28.8% identity (59.6% similar) in 260 aa overlap (53-306:286-520)
30 40 50 60 70 80
pF1KA0 EGCRARFVAERDSEDDGEEPVVFPESPLQSPTVLVAVLARNAAHTLPHFLGCLERLDYPK
:::::.:. .. . . :. : :: ::.
NP_000 YIPRFWTFETGCTVCDEGLRSLKGIGDEALPTVLVGVFIEQPTPFVSLFFQRLLRLHYPQ
260 270 280 290 300 310
90 100 110 120 130 140
pF1KA0 SRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVEWRPMDEPESYPDEIGPKHWPTSRFA
..: .. .:. . ... .:.: . :. :. .::. :.:
NP_000 KHMRLFIH-NHEQHHKAQV-EEFLAQHGSEYQSVKL------------VGPE----VRMA
320 330 340 350
150 160 170 180 190 200
pF1KA0 HVMKLRQAALRTAREKWSDYILFIDVDNFLTNPQTLNLLIAENKTIVAPMLESRG-LYSN
.. ..: ... : . .:.: ::.:..: ::: .::...::.. .: :.::
NP_000 NADARNMGADLCRQDRSCTYYFSVDADVALTEPNSLRLLIQQNKNVIAPLMTRHGRLWSN
360 370 380 390 400 410
210 220 230 240 250
pF1KA0 FWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLID---LRKEASDKLTFYPPHQ
:: ... :.: :. :::.: . .:.: . ::.. . .:: :: : ... :. :.
NP_000 FWGALSADGYYARSEDYVDIVQGRRVGVWNVPYISNIYLIKGSALRGELQSSDLFH--HS
420 430 440 450 460 470
260 270 280 290 300 310
pF1KA0 DYTWTFDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQT--LQEDIENLIHVQIEA
.: ..: . :: . :.: ::. :.: . : ..: :..:.
NP_000 ----KLDPDMAFCANIRQQDVFMFLTNRHTLGHL-LSLDSYRTTHLHNDLWEVFSNPEDW
480 490 500 510 520 530
320 330 340 350 360 370
pF1KA0 MIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEVKIVEAV
NP_000 KEKYIHQNYTKALAGKLVETPCPDVYWFPIFTEVACDELVEEMEHFGQWSLGNNKDNRIQ
540 550 560 570 580 590
>>NP_001303249 (OMIM: 153454,225400) procollagen-lysine, (774 aa)
initn: 271 init1: 138 opt: 283 Z-score: 335.8 bits: 72.6 E(85289): 5.8e-12
Smith-Waterman score: 315; 28.8% identity (59.6% similar) in 260 aa overlap (53-306:333-567)
30 40 50 60 70 80
pF1KA0 EGCRARFVAERDSEDDGEEPVVFPESPLQSPTVLVAVLARNAAHTLPHFLGCLERLDYPK
:::::.:. .. . . :. : :: ::.
NP_001 YIPRFWTFETGCTVCDEGLRSLKGIGDEALPTVLVGVFIEQPTPFVSLFFQRLLRLHYPQ
310 320 330 340 350 360
90 100 110 120 130 140
pF1KA0 SRMAIWAATDHNVDNTTEIFREWLKNVQRLYHYVEWRPMDEPESYPDEIGPKHWPTSRFA
..: .. .:. . ... .:.: . :. :. .::. :.:
NP_001 KHMRLFIH-NHEQHHKAQV-EEFLAQHGSEYQSVKL------------VGPE----VRMA
370 380 390 400
150 160 170 180 190 200
pF1KA0 HVMKLRQAALRTAREKWSDYILFIDVDNFLTNPQTLNLLIAENKTIVAPMLESRG-LYSN
.. ..: ... : . .:.: ::.:..: ::: .::...::.. .: :.::
NP_001 NADARNMGADLCRQDRSCTYYFSVDADVALTEPNSLRLLIQQNKNVIAPLMTRHGRLWSN
410 420 430 440 450 460
210 220 230 240 250
pF1KA0 FWCGITPKGFYKRTPDYVQIREWKRTGCFPVPMVHSTFLID---LRKEASDKLTFYPPHQ
:: ... :.: :. :::.: . .:.: . ::.. . .:: :: : ... :. :.
NP_001 FWGALSADGYYARSEDYVDIVQGRRVGVWNVPYISNIYLIKGSALRGELQSSDLFH--HS
470 480 490 500 510 520
260 270 280 290 300 310
pF1KA0 DYTWTFDDIIVFAFSSRQAGIQMYLCNREHYGYLPIPLKPHQT--LQEDIENLIHVQIEA
.: ..: . :: . :.: ::. :.: . : ..: :..:.
NP_001 ----KLDPDMAFCANIRQQDVFMFLTNRHTLGHL-LSLDSYRTTHLHNDLWEVFSNPEDW
530 540 550 560 570
320 330 340 350 360 370
pF1KA0 MIDRPPMEPSQYVSVVPKYPDKMGFDEIFMINLKRRKDRRDRMLRTLYEQEIEVKIVEAV
NP_001 KEKYIHQNYTKALAGKLVETPCPDVYWFPIFTEVACDELVEEMEHFGQWSLGNNKDNRIQ
580 590 600 610 620 630
626 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 19:21:13 2016 done: Wed Nov 2 19:21:14 2016
Total Scan time: 7.630 Total Display time: 0.060
Function used was FASTA [36.3.4 Apr, 2011]