FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1226, 704 aa
1>>>pF1KA1226 704 - 704 aa - 704 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.8611+/-0.00117; mu= 16.8888+/- 0.070
mean_var=69.6644+/-13.890, 0's: 0 Z-trim(101.8): 30 B-trim: 0 in 0/49
Lambda= 0.153663
statistics sampled from 6685 (6690) to 6685 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.559), E-opt: 0.2 (0.206), width: 16
Scan time: 3.440
The best scores are: opt bits E(32554)
CCDS3989.1 NLN gene_id:57486|Hs108|chr5 ( 704) 4666 1044.2 0
CCDS12095.1 THOP1 gene_id:7064|Hs108|chr19 ( 689) 2999 674.6 1.3e-193
CCDS9303.1 MIPEP gene_id:4285|Hs108|chr13 ( 713) 632 149.9 1.2e-35
>>CCDS3989.1 NLN gene_id:57486|Hs108|chr5 (704 aa)
initn: 4666 init1: 4666 opt: 4666 Z-score: 5586.4 bits: 1044.2 E(32554): 0
Smith-Waterman score: 4666; 100.0% identity (100.0% similar) in 704 aa overlap (1-704:1-704)
10 20 30 40 50 60
pF1KA1 MIARCLLAVRSLRRVGGSRILLRMTLGREVMSPLQAMSSYTVAGRNVLRWDLSPEQIKTR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 MIARCLLAVRSLRRVGGSRILLRMTLGREVMSPLQAMSSYTVAGRNVLRWDLSPEQIKTR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 TEELIVQTKQVYDAVGMLGIEEVTYENCLQALADVEVKYIVERTMLDFPQHVSSDKEVRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 TEELIVQTKQVYDAVGMLGIEEVTYENCLQALADVEVKYIVERTMLDFPQHVSSDKEVRA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 ASTEADKRLSRFDIEMSMRGDIFERIVHLQETCDLGKIKPEARRYLEKSIKMGKRNGLHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 ASTEADKRLSRFDIEMSMRGDIFERIVHLQETCDLGKIKPEARRYLEKSIKMGKRNGLHL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 PEQVQNEIKSMKKRMSELCIDFNKNLNEDDTFLVFSKAELGALPDDFIDSLEKTDDDKYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 PEQVQNEIKSMKKRMSELCIDFNKNLNEDDTFLVFSKAELGALPDDFIDSLEKTDDDKYK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 ITLKYPHYFPVMKKCCIPETRRRMEMAFNTRCKEENTIILQQLLPLRTKVAKLLGYSTHA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 ITLKYPHYFPVMKKCCIPETRRRMEMAFNTRCKEENTIILQQLLPLRTKVAKLLGYSTHA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 DFVLEMNTAKSTSRVTAFLDDLSQKLKPLGEAEREFILNLKKKECKDRGFEYDGKINAWD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 DFVLEMNTAKSTSRVTAFLDDLSQKLKPLGEAEREFILNLKKKECKDRGFEYDGKINAWD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 LYYYMTQTEELKYSIDQEFLKEYFPIEVVTEGLLNTYQELLGLSFEQMTDAHVWNKSVTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 LYYYMTQTEELKYSIDQEFLKEYFPIEVVTEGLLNTYQELLGLSFEQMTDAHVWNKSVTL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 YTVKDKATGEVLGQFYLDLYPREGKYNHAACFGLQPGCLLPDGSRMMAVAALVVNFSQPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 YTVKDKATGEVLGQFYLDLYPREGKYNHAACFGLQPGCLLPDGSRMMAVAALVVNFSQPV
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 AGRPSLLRHDEVRTYFHEFGHVMHQICAQTDFARFSGTNVETDFVEVPSQMLENWVWDVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 AGRPSLLRHDEVRTYFHEFGHVMHQICAQTDFARFSGTNVETDFVEVPSQMLENWVWDVD
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA1 SLRRLSKHYKDGSPIADDLLEKLVASRLVNTGLLTLRQIVLSKVDQSLHTNTSLDAASEY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 SLRRLSKHYKDGSPIADDLLEKLVASRLVNTGLLTLRQIVLSKVDQSLHTNTSLDAASEY
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA1 AKYCSEILGVAATPGTNMPATFGHLAGGYDGQYYGYLWSEVFSMDMFYSCFKKEGIMNPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 AKYCSEILGVAATPGTNMPATFGHLAGGYDGQYYGYLWSEVFSMDMFYSCFKKEGIMNPE
610 620 630 640 650 660
670 680 690 700
pF1KA1 VGMKYRNLILKPGGSLDGMDMLHNFLKREPNQKAFLMSRGLHAP
::::::::::::::::::::::::::::::::::::::::::::
CCDS39 VGMKYRNLILKPGGSLDGMDMLHNFLKREPNQKAFLMSRGLHAP
670 680 690 700
>>CCDS12095.1 THOP1 gene_id:7064|Hs108|chr19 (689 aa)
initn: 3024 init1: 2996 opt: 2999 Z-score: 3589.3 bits: 674.6 E(32554): 1.3e-193
Smith-Waterman score: 2999; 64.8% identity (86.9% similar) in 657 aa overlap (46-702:22-678)
20 30 40 50 60 70
pF1KA1 GGSRILLRMTLGREVMSPLQAMSSYTVAGRNVLRWDLSPEQIKTRTEELIVQTKQVYDAV
: :::::: .::. ::.::: :::.::: :
CCDS12 MKPPAACAGDMADAASPCSVVNDLRWDLSAQQIEERTRELIEQTKRVYDQV
10 20 30 40 50
80 90 100 110 120 130
pF1KA1 GMLGIEEVTYENCLQALADVEVKYIVERTMLDFPQHVSSDKEVRAASTEADKRLSRFDIE
: .:.:.::. :.::::::: : :.:..:::::::: .:..:.:::::::.::.::.:
CCDS12 GTQEFEDVSYESTLKALADVEVTYTVQRNILDFPQHVSPSKDIRTASTEADKKLSEFDVE
60 70 80 90 100 110
140 150 160 170 180 190
pF1KA1 MSMRGDIFERIVHLQETCDLGKIKPEARRYLEKSIKMGKRNGLHLPEQVQNEIKSMKKRM
:::: :...::: ::: . ...::: ::::. ::.:.:::::::...:..:: .::..
CCDS12 MSMREDVYQRIVWLQEKVQKDSLRPEAARYLERLIKLGRRNGLHLPRETQENIKRIKKKL
120 130 140 150 160 170
200 210 220 230 240 250
pF1KA1 SELCIDFNKNLNEDDTFLVFSKAELGALPDDFIDSLEKTDDDKYKITLKYPHYFPVMKKC
: :::::::::::: ::: :. :::.::.::..:::: .: : :.:::::::::..:::
CCDS12 SLLCIDFNKNLNEDTTFLPFTLQELGGLPEDFLNSLEKMEDGKLKVTLKYPHYFPLLKKC
180 190 200 210 220 230
260 270 280 290 300 310
pF1KA1 CIPETRRRMEMAFNTRCKEENTIILQQLLPLRTKVAKLLGYSTHADFVLEMNTAKSTSRV
.:::::..: ::: :::::: ::..:. ::.. ..:::. ::::.::::: ::... :
CCDS12 HVPETRRKVEEAFNCRCKEENCAILKELVTLRAQKSRLLGFHTHADYVLEMNMAKTSQTV
240 250 260 270 280 290
320 330 340 350 360 370
pF1KA1 TAFLDDLSQKLKPLGEAEREFILNLKKKECKDRGFEYDGKINAWDLYYYMTQTEELKYSI
..:::.:.:::::::: :: ::.::. ::. ::. .::.: :::. :::.:.:: .: .
CCDS12 ATFLDELAQKLKPLGEQERAVILELKRAECERRGLPFDGRIRAWDMRYYMNQVEETRYCV
300 310 320 330 340 350
380 390 400 410 420 430
pF1KA1 DQEFLKEYFPIEVVTEGLLNTYQELLGLSFEQMTDAHVWNKSVTLYTVKDKATGEVLGQF
::..::::::..:::.:::. :::::::.:.. : .:...: :::..: :.:::.:.:
CCDS12 DQNLLKEYFPVQVVTHGLLGIYQELLGLAFHHEEGASAWHEDVRLYTARDAASGEVVGKF
360 370 380 390 400 410
440 450 460 470 480 490
pF1KA1 YLDLYPREGKYNHAACFGLQPGCLLPDGSRMMAVAALVVNFSQPVAGRPSLLRHDEVRTY
:::::::::::.:::::::::::: ::::..:.::.:.::..:.: ::::.::::.::
CCDS12 YLDLYPREGKYGHAACFGLQPGCLRQDGSRQIAIAAMVANFTKPTADAPSLLQHDEVETY
420 430 440 450 460 470
500 510 520 530 540 550
pF1KA1 FHEFGHVMHQICAQTDFARFSGTNVETDFVEVPSQMLENWVWDVDSLRRLSKHYKDGSPI
::::::::::.:.:..:: ::::.:: ::::.::::::::::. . : :.:.::. :: .
CCDS12 FHEFGHVMHQLCSQAEFAMFSGTHVERDFVEAPSQMLENWVWEQEPLLRMSRHYRTGSAV
480 490 500 510 520 530
560 570 580 590 600 610
pF1KA1 ADDLLEKLVASRLVNTGLLTLRQIVLSKVDQSLHTNTSLDAASEYAKYCSEILGVAATPG
.:::::. :: .::::..::::::.::::.:::.:. : : :::. :.::::: ::::
CCDS12 PRELLEKLIESRQANTGLFNLRQIVLAKVDQALHTQTDADPAEEYARLCQEILGVPATPG
540 550 560 570 580 590
620 630 640 650 660 670
pF1KA1 TNMPATFGHLAGGYDGQYYGYLWSEVFSMDMFYSCFKKEGIMNPEVGMKYRNLILKPGGS
:::::::::::::::.::::::::::.:::::.. ::.::..: .::: ::. ::.::::
CCDS12 TNMPATFGHLAGGYDAQYYGYLWSEVYSMDMFHTRFKQEGVLNSKVGMDYRSCILRPGGS
600 610 620 630 640 650
680 690 700
pF1KA1 LDGMDMLHNFLKREPNQKAFLMSRGLHAP
:. ::. :: :.:.: :::.:.::.
CCDS12 EDASAMLRRFLGRDPKQDAFLLSKGLQVGGCEPEPQVC
660 670 680
>>CCDS9303.1 MIPEP gene_id:4285|Hs108|chr13 (713 aa)
initn: 516 init1: 272 opt: 632 Z-score: 753.2 bits: 149.9 E(32554): 1.2e-35
Smith-Waterman score: 660; 26.8% identity (56.4% similar) in 605 aa overlap (105-696:121-694)
80 90 100 110 120 130
pF1KA1 VGMLGIEEVTYENCLQALADVEVKYIVERTMLDFPQHVSSDKEVRAASTEADKRLSRFDI
. :: . . . : :. :: . .. .
CCDS93 LVDRACSTPPGPQTVLIFDELSDSLCRVADLADFVKIAHPEPAFREAAEEACRSIGTMVE
100 110 120 130 140 150
140 150 160 170 180 190
pF1KA1 EMSMRGDIFERIVHLQETCDL-GKIKPEARRYLEKSIKMGKRNGLHLPEQVQNEIKSMKK
... :... . .: : .. ::.:: : . . .:.:: : .:
CCDS93 KLNTNVDLYQSLQKLLADKKLVDSLDPETRRVAELFMFDFEISGIHLD-------KEKRK
160 170 180 190 200
200 210 220 230 240
pF1KA1 RMSELCIDFNKNLNEDDTFLV---F-SKAELGALPDDFIDSLEKTDDDKYKITLKYPHYF
: .: . : :. ..:::. : .: : ::. . .. .. : .: . :
CCDS93 RAVDLNV---KILDLSSTFLMGTNFPNKIEKHLLPEHIRRNFTSAGD---HIIIDGLH--
210 220 230 240 250
250 260 270 280 290 300
pF1KA1 PVMKKCCIPETRRRMEMAFNT---RCKEENTIILQQLLPLRTKVAKLLGYSTHADFVLEM
. :. .. . :. .: :..:: : .:::.:::: . .:.
CCDS93 AESPDDLVREAAYKIFLYPNAGQLKC-------LEELLSSRDLLAKLVGYSTFSHRALQG
260 270 280 290 300
310 320 330 340 350 360
pF1KA1 NTAKSTSRVTAFLDDLSQKLKPLGEAEREFILNLKKKECKDRGFEYDGKINAWDLYYYMT
. ::. : ::. ::.::. . :.: ..: : . .... :: ::
CCDS93 TIAKNPETVMQFLEKLSDKLSERTLKDFEMIRGMKMKLNPQ-----NSEVMPWDPPYYSG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 QTEELKYSIDQEFLKEYFPIEVVTEGLLNTYQELLGLSF--EQMTDAHVWNKSVTLYTVK
. .:.:. . .: . . ::: ..:::.:. :: . ..::...: .:
CCDS93 VIRAERYNIEPSLYCPFFSLGACMEGLNILLNRLLGISLYAEQPAKGEVWSEDVRKLAVV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 DKATGEVLGQFYLDLYPREGKYNHAAC-FGLQPGCLLPDGSRMMAVAALVVNFSQPVAGR
.. : .:: .: :.. : : : : : .. : : ::. .. :..:..:. . .
CCDS93 HESEG-LLGYIYCDFFQRADK-PHQDCHFTIRGGRLKEDGDYQLPVVVLMLNLPRSSRSS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 PSLLRHDEVRTYFHEFGHVMHQICAQTDFARFSGTNVETDFVEVPSQMLENWVWDVDSLR
:.:: . ... :::.::.::.. ..: . . .:: :::.:::: ..: .. : .
CCDS93 PTLLTPSMMENLFHEMGHAMHSMLGRTRYQHVTGTRCPTDFAEVPSILMEYFANDYRVVN
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA1 RLSKHYKDGSPIADDLLEKLVASRLVNTGLLTLRQIVLSKVDQSLHTNTSL-DAASEYAK
....::. :.:. ... .: :. : .. :. . .:: : . : ..... :
CCDS93 QFARHYQTGQPLPKNMVSRLCESKKVCAAADMQLQVFYATLDQIYHGKHPLRNSTTDILK
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA1 YCSE-ILGVAATPGTNMPATFGHLAGGYDGQYYGYLWSEVFSMDMFYSCFKKEGIMNPEV
.: . :. .:.: :.::.: : ..::.:: :.. . .. :: .. . : .
CCDS93 ETQEKFYGLPYVPNTAWQLRFSHLVG-YGARYYSYLMSRAVASMVWKECFLQDPF-NRAA
610 620 630 640 650
670 680 690 700
pF1KA1 GMKYRNLILKPGGSLDGMDMLHNFLKREPNQKAFLMSRGLHAP
: .:: .: ::. . : :....:.. :. :.
CCDS93 GERYRREMLAHGGGREPMLMVEGMLQKCPSVDDFVSALVSDLDLDFETFLMDSE
660 670 680 690 700 710
704 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 01:23:52 2016 done: Fri Nov 4 01:23:53 2016
Total Scan time: 3.440 Total Display time: 0.060
Function used was FASTA [36.3.4 Apr, 2011]