FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB0496, 1042 aa
1>>>pF1KB0496 1042 - 1042 aa - 1042 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.7456+/-0.00117; mu= 19.8531+/- 0.070
mean_var=72.6393+/-14.516, 0's: 0 Z-trim(101.5): 38 B-trim: 45 in 1/51
Lambda= 0.150483
statistics sampled from 6540 (6555) to 6540 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.547), E-opt: 0.2 (0.201), width: 16
Scan time: 4.270
The best scores are: opt bits E(32554)
CCDS3967.1 SKIV2L2 gene_id:23517|Hs108|chr5 (1042) 6856 1498.7 0
CCDS4731.1 SKIV2L gene_id:6499|Hs108|chr6 (1246) 813 186.8 2.6e-46
CCDS33833.1 POLQ gene_id:10721|Hs108|chr3 (2590) 310 77.7 3.6e-13
>>CCDS3967.1 SKIV2L2 gene_id:23517|Hs108|chr5 (1042 aa)
initn: 6856 init1: 6856 opt: 6856 Z-score: 8036.6 bits: 1498.7 E(32554): 0
Smith-Waterman score: 6856; 100.0% identity (100.0% similar) in 1042 aa overlap (1-1042:1-1042)
10 20 30 40 50 60
pF1KB0 MADAFGDELFSVFEGDSTTAAGTKKDKEKDKGKWKGPPGSADKAGKRFDGKLQSESTNNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 MADAFGDELFSVFEGDSTTAAGTKKDKEKDKGKWKGPPGSADKAGKRFDGKLQSESTNNG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB0 KNKRDVDFEGTDEPIFGKKPRIEESITEDLSLADLMPRVKVQSVETVEGCTHEVALPAEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 KNKRDVDFEGTDEPIFGKKPRIEESITEDLSLADLMPRVKVQSVETVEGCTHEVALPAEE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB0 DYLPLKPRVGKAAKEYPFILDAFQREAIQCVDNNQSVLVSAHTSAGKTVCAEYAIALALR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 DYLPLKPRVGKAAKEYPFILDAFQREAIQCVDNNQSVLVSAHTSAGKTVCAEYAIALALR
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB0 EKQRVIFTSPIKALSNQKYREMYEEFQDVGLMTGDVTINPTASCLVMTTEILRSMLYRGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 EKQRVIFTSPIKALSNQKYREMYEEFQDVGLMTGDVTINPTASCLVMTTEILRSMLYRGS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB0 EVMREVAWVIFDEIHYMRDSERGVVWEETIILLPDNVHYVFLSATIPNARQFAEWICHLH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 EVMREVAWVIFDEIHYMRDSERGVVWEETIILLPDNVHYVFLSATIPNARQFAEWICHLH
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB0 KQPCHVIYTDYRPTPLQHYIFPAGGDGLHLVVDENGDFREDNFNTAMQVLRDAGDLAKGD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 KQPCHVIYTDYRPTPLQHYIFPAGGDGLHLVVDENGDFREDNFNTAMQVLRDAGDLAKGD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB0 QKGRKGGTKGPSNVFKIVKMIMERNFQPVIIFSFSKKDCEAYALQMTKLDFNTDEEKKMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 QKGRKGGTKGPSNVFKIVKMIMERNFQPVIIFSFSKKDCEAYALQMTKLDFNTDEEKKMV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB0 EEVFSNAIDCLSDEDKKLPQVEHVLPLLKRGIGIHHGGLLPILKETIEILFSEGLIKALF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 EEVFSNAIDCLSDEDKKLPQVEHVLPLLKRGIGIHHGGLLPILKETIEILFSEGLIKALF
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB0 ATETFAMGINMPARTVLFTNARKFDGKDFRWISSGEYIQMSGRAGRRGMDDRGIVILMVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 ATETFAMGINMPARTVLFTNARKFDGKDFRWISSGEYIQMSGRAGRRGMDDRGIVILMVD
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB0 EKMSPTIGKQLLKGSADPLNSAFHLTYNMVLNLLRVEEINPEYMLEKSFYQFQHYRAIPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 EKMSPTIGKQLLKGSADPLNSAFHLTYNMVLNLLRVEEINPEYMLEKSFYQFQHYRAIPG
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB0 VVEKVKNSEEQYNKIVIPNEESVVIYYKIRQQLAKLGKEIEEYIHKPKYCLPFLQPGRLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 VVEKVKNSEEQYNKIVIPNEESVVIYYKIRQQLAKLGKEIEEYIHKPKYCLPFLQPGRLV
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB0 KVKNEGDDFGWGVVVNFSKKSNVKPNSGELDPLYVVEVLLRCSKESLKNSATEAAKPAKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 KVKNEGDDFGWGVVVNFSKKSNVKPNSGELDPLYVVEVLLRCSKESLKNSATEAAKPAKP
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB0 DEKGEMQVVPVLVHLLSAISSVRLYIPKDLRPVDNRQSVLKSIQEVQKRFPDGIPLLDPI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 DEKGEMQVVPVLVHLLSAISSVRLYIPKDLRPVDNRQSVLKSIQEVQKRFPDGIPLLDPI
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB0 DDMGIQDQGLKKVIQKVEAFEHRMYSHPLHNDPNLETVYTLCEKKAQIAIDIKSAKRELK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 DDMGIQDQGLKKVIQKVEAFEHRMYSHPLHNDPNLETVYTLCEKKAQIAIDIKSAKRELK
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB0 KARTVLQMDELKCRKRVLRRLGFATSSDVIEMKGRVACEISSADELLLTEMMFNGLFNDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 KARTVLQMDELKCRKRVLRRLGFATSSDVIEMKGRVACEISSADELLLTEMMFNGLFNDL
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB0 SAEQATALLSCFVFQENSSEMPKLTEQLAGPLRQMQECAKRIAKVSAEAKLEIDEETYLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 SAEQATALLSCFVFQENSSEMPKLTEQLAGPLRQMQECAKRIAKVSAEAKLEIDEETYLS
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB0 SFKPHLMDVVYTWATGATFAHICKMTDVFEGSIIRCMRRLEELLRQMCQAAKAIGNTELE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS39 SFKPHLMDVVYTWATGATFAHICKMTDVFEGSIIRCMRRLEELLRQMCQAAKAIGNTELE
970 980 990 1000 1010 1020
1030 1040
pF1KB0 NKFAEGITKIKRDIVFAASLYL
::::::::::::::::::::::
CCDS39 NKFAEGITKIKRDIVFAASLYL
1030 1040
>>CCDS4731.1 SKIV2L gene_id:6499|Hs108|chr6 (1246 aa)
initn: 1798 init1: 770 opt: 813 Z-score: 945.1 bits: 186.8 E(32554): 2.6e-46
Smith-Waterman score: 1983; 36.4% identity (65.5% similar) in 1013 aa overlap (80-1041:250-1244)
50 60 70 80 90 100
pF1KB0 GKLQSESTNNGKNKRDVDFEGTDEPIFGKKPRIEESITEDLSLADLMPRVKVQSVETVEG
: . : ::: : . . :.. :. :
CCDS47 LGGGDEDENEAVGQPGGPRGDTVSASPCSAPLARASSLEDLVLKE--ASTAVSTPEAPEP
220 230 240 250 260 270
110 120 130 140 150 160
pF1KB0 CTHEV-ALPAEE-----DYLPLKPRVGKAAKEYPFILDAFQREAIQCVDNNQSVLVSAHT
..: :.:.. :. : : . : .. : :.::..:: .. ..::.:.:::
CCDS47 PSQEQWAIPVDATSPVGDFYRLIP---QPAFQWAFEPDVFQKQAILHLERHDSVFVAAHT
280 290 300 310 320 330
170 180 190 200 210 220
pF1KB0 SAGKTVCAEYAIALALREKQRVIFTSPIKALSNQKYREMYEEFQDVGLMTGDVTINPTAS
:::::: :::::::: .. :.:.:::::::::::.:.. . : ::::.:::: ..: ::
CCDS47 SAGKTVVAEYAIALAQKHMTRTIYTSPIKALSNQKFRDFRNTFGDVGLLTGDVQLHPEAS
340 350 360 370 380 390
230 240 250 260 270 280
pF1KB0 CLVMTTEILRSMLYRGSEVMREVAWVIFDEIHYMRDSERGVVWEETIILLPDNVHYVFLS
::.::::::::::: ::.:.:.. ::::::.::. : ::::::::..:.:::.: ..::
CCDS47 CLIMTTEILRSMLYSGSDVIRDLEWVIFDEVHYINDVERGVVWEEVLIMLPDHVSIILLS
400 410 420 430 440 450
290 300 310 320 330
pF1KB0 ATIPNARQFAEWICHLHKQPCHVIYTDYRPTPLQHYIFPAGGDG----LHLVVDENGDFR
::.::: .::.:: .:... .:: : ::.::.::.: .... : :..: : :.
CCDS47 ATVPNALEFADWIGRLKRRQIYVISTVTRPVPLEHYLFTGNSSKTQGELFLLLDSRGAFH
460 470 480 490 500 510
340 350 360 370 380 390
pF1KB0 EDNFNTAMQVLRD-AGDLAK---GDQKGRKGGTKGPSNVF-KIVKMIMERNFQPVIIFSF
.. .:... .. . :. . : ..:: .:. ... . : ::..:.:
CCDS47 TKGYYAAVEAKKERMSKHAQTFGAKQPTHQGGPAQDRGVYLSLLASLRTRAQLPVVVFTF
520 530 540 550 560 570
400 410 420 430 440 450
pF1KB0 SKKDCEAYALQMTKLDFNTDEEKKMVEEVFSNAIDCLSDEDKKLPQVEHVLPLLKRGIGI
:. :. : .:.::..:. ::. .. .. . : :..:::: :. ::.::.:.
CCDS47 SRGRCDEQASGLTSLDLTTSSEKSEIHLFLQRCLARLRGSDRQLPQVLHMSELLNRGLGV
580 590 600 610 620 630
460 470 480 490 500 510
pF1KB0 HHGGLLPILKETIEILFSEGLIKALFATETFAMGINMPARTVLFTNARKFDGKDFRWISS
::.:.:::::: .:.:::.::.:.::::::::::.:::::::.: . :: ::. :: .
CCDS47 HHSGILPILKEIVEMLFSRGLVKVLFATETFAMGVNMPARTVVFDSMRKHDGSTFRDLLP
640 650 660 670 680 690
520 530 540 550 560 570
pF1KB0 GEYIQMSGRAGRRGMDDRGIVILMVDEKMSPTIG--KQLLKGSADPLNSAFHLTYNMVLN
:::.::.:::::::.: : :::. .. : .. .... :. . :.: :.:::.:.::
CCDS47 GEYVQMAGRAGRRGLDPTGTVILLCKGRV-PEMADLHRMMMGKPSQLQSQFRLTYTMILN
700 710 720 730 740 750
580 590 600 610 620
pF1KB0 LLRVEEINPEYMLEKSFYQFQHYRAIPGVVEKVKNSEEQYNKIVIPNEESVVI----YYK
::::. . : :...:: .: . . . . . .. . . :. . .. ::.
CCDS47 LLRVDALRVEDMMKRSFSEFPSRKDSKAHEQALAELTKRLGALEEPDMTGQLVDLPEYYS
760 770 780 790 800 810
630 640 650 660 670 680
pF1KB0 IRQQLAKLGKEIEEYIHKPKYCLPFLQPGRLVKVKNEGDDFGWGVVVNFSKKSNVKPNSG
..:.. . :.. : . : :. ::.: :::. . ::... :..:. .
CCDS47 WGEELTETQHMIQRRIMESVNGLKSLSAGRVVVVKNQEHHNALGVILQVSSNSTSR----
820 830 840 850 860
690 700 710 720 730
pF1KB0 ELDPLYVVEVLLRCSK---ESLKNSATEAAKPAKPDEK-GEMQVVP------VLVHL---
: .:. :.: .. .. . .:. ::. : .: ..:.:
CCDS47 ------VFTTLVLCDKPLSQDPQDRGPATAEVPYPDDLVGFKLFLPEGPCDHTVVKLQPG
870 880 890 900 910 920
740 750 760 770
pF1KB0 -LSAISS--VRLYIPKDLRPVDNRQ-----------SVLKSIQEVQK---RFPDGIPLLD
..::.. .:. : :. ..:: .: ..::. . : : : ::
CCDS47 DMAAITTKVLRVNGEKILEDFSKRQQPKFKKDPPLAAVTTAVQELLRLAQAHPAGPPTLD
930 940 950 960 970 980
780 790 800 810 820 830
pF1KB0 PIDDMGIQDQGLKKVIQKVEAFEHRMYSHPLHNDPNLETVYTLCEKKAQIAIDIKSAKRE
:..:. ..:... . ... .:. . . ..: . . : ... :: ... :
CCDS47 PVNDLQLKDMSVVEGGLRARKLEELIQGAQCVHSPRFPAQYLKLRERMQIQKEMERL-RF
990 1000 1010 1020 1030 1040
840 850 860 870 880 890
pF1KB0 LKKARTVLQMDELKCRKRVLRRLGFATSSDVIEMKGRVACEISSADELLLTEMMFNGLFN
: . ...: . : . : .::: ::.. . .... ::::: .:: ::::::.::.. ..
CCDS47 LLSDQSLLLLPEYHQRVEVLRTLGYVDEAGTVKLAGRVACAMSS-HELLLTELMFDNALS
1050 1060 1070 1080 1090 1100
900 910 920 930 940 950
pF1KB0 DLSAEQATALLSCFVFQENSSEMPKLTEQLAGPLRQMQECAKRIAKVSAEAKLEIDEETY
: :. .:::: .: : .. .: . : ..... ::::..:.. :. : .
CCDS47 TLRPEEIAALLSGLVCQSPGDAGDQLPNTLKQGIERVRAVAKRIGEVQVACGLNQTVEEF
1110 1120 1130 1140 1150 1160
960 970 980 990 1000 1010
pF1KB0 LSSFKPHLMDVVYTWATGATFAHICKMTDVFEGSIIRCMRRLEELLRQMCQAAKAIGNTE
.. .. :..::: :: : :... .. . :: ..::..:: :. :.. ::. .:.
CCDS47 VGELNFGLVEVVYEWARGMPFSELAGLSGTPEGLVVRCIQRLAEMCRSLRGAARLVGEPV
1170 1180 1190 1200 1210 1220
1020 1030 1040
pF1KB0 LENKFAEGITKIKRDIVFAASLYL
: :. . : ..::::::::::
CCDS47 LGAKMETAATLLRRDIVFAASLYTQ
1230 1240
>>CCDS33833.1 POLQ gene_id:10721|Hs108|chr3 (2590 aa)
initn: 311 init1: 126 opt: 310 Z-score: 349.9 bits: 77.7 E(32554): 3.6e-13
Smith-Waterman score: 387; 27.3% identity (54.6% similar) in 454 aa overlap (151-564:105-520)
130 140 150 160 170
pF1KB0 DYLPLKPRVGKAAKEYPFILDAFQREAIQCVDNNQSVLVSAHTSAGKTVCAEYAI-ALAL
: ...... :: ::::::. :: : .:
CCDS33 GLPKAVLEKYHSFGVKKMFEWQAECLLLGQVLEGKNLVYSAPTSAGKTLVAELLILKRVL
80 90 100 110 120 130
180 190 200 210 220
pF1KB0 REKQRVIFTSPIKALSNQKYREMYEEFQDVGL-MTGDV-TINPT--------ASCLVMTT
. .....: :. .....: . ::.::. . : . . .:. : : . .
CCDS33 EMRKKALFILPFVSVAKEKKYYLQSLFQEVGIKVDGYMGSTSPSRHFSSLDIAVCTIERA
140 150 160 170 180 190
230 240 250 260 270
pF1KB0 EILRSMLYRGSEVMREVAWVIFDEIHYMRDSERGVVWEETIIL-----------------
. : . : . .. : .. :. ::.:.. ::.:: . : .
CCDS33 NGLINRLIEENK-MDLLGMVVVDELHMLGDSHRGYLLELLLTKICYITRKSASCQADLAS
200 210 220 230 240 250
280 290 300 310 320 330
pF1KB0 -LPDNVHYVFLSATIPNARQFAEWICHLHKQPCHVIYTDYRPTPLQHYIFPAGGDGLHLV
: . :. : .:::.:: . : :. .. .::.::.:: . . .:.. .
CCDS33 SLSNAVQIVGMSATLPNLELVASWLN------AELYHTDFRPVPLLESV-KVGNS----I
260 270 280 290 300
340 350 360 370 380 390
pF1KB0 VDENGDF-REDNFNTAMQVLRDAGDLAKGDQKGRKGGTKGPSNVFKIVKMIMERNFQPVI
: . . :: :. .:: :::. ..: .. . : . :.
CCDS33 YDSSMKLVRE--FEPMLQV--------KGDE----------DHVVSLCYETICDN-HSVL
310 320 330 340
400 410 420 430 440
pF1KB0 IFSFSKKDCEAYALQMTKLDFNTDEEKK-MVEE-----VFSNAIDCLS--DEDKKLPQ-V
.: ::: :: : ... .: .. . .:. :. . . : :. ..::. .
CCDS33 LFCPSKKWCEKLADIIAREFYNLHHQAEGLVKPSECPPVILEQKELLEVMDQLRRLPSGL
350 360 370 380 390 400
450 460 470 480 490 500
pF1KB0 EHVLP-LLKRGIGIHHGGLLPILKETIEILFSEGLIKALFATETFAMGINMPARTVLFTN
. :: . :...::.:: .. :: : .:::..: :: :.. :.:.::: :.. .
CCDS33 DSVLQKTVPWGVAFHHAGLTFEERDIIEGAFRQGLIRVLAATSTLSSGVNLPARRVIIRT
410 420 430 440 450 460
510 520 530 540 550 560
pF1KB0 ARKFDGKDFRWISSGEYIQMSGRAGRRGMDDRGIVILMVDEKMSPTIGKQLLKGSADPLN
: :. . .. : :: :::::.:.: : ::. .. . . : ::.:: :.
CCDS33 P-IFGGRPLDILT---YKQMVGRAGRKGVDTVGESILICKNSEK-SKGIALLQGSLKPVR
470 480 490 500 510
570 580 590 600 610 620
pF1KB0 SAFHLTYNMVLNLLRVEEINPEYMLEKSFYQFQHYRAIPGVVEKVKNSEEQYNKIVIPNE
: ..
CCDS33 SCLQRREGEEVTGSMIRAILEIIVGGVASTSQDMHTYAACTFLAASMKEGKQGIQRNQES
520 530 540 550 560 570
1042 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 13:36:24 2016 done: Sat Nov 5 13:36:25 2016
Total Scan time: 4.270 Total Display time: 0.110
Function used was FASTA [36.3.4 Apr, 2011]