FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB0496, 1042 aa 1>>>pF1KB0496 1042 - 1042 aa - 1042 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7456+/-0.00117; mu= 19.8531+/- 0.070 mean_var=72.6393+/-14.516, 0's: 0 Z-trim(101.5): 38 B-trim: 45 in 1/51 Lambda= 0.150483 statistics sampled from 6540 (6555) to 6540 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.547), E-opt: 0.2 (0.201), width: 16 Scan time: 4.270 The best scores are: opt bits E(32554) CCDS3967.1 SKIV2L2 gene_id:23517|Hs108|chr5 (1042) 6856 1498.7 0 CCDS4731.1 SKIV2L gene_id:6499|Hs108|chr6 (1246) 813 186.8 2.6e-46 CCDS33833.1 POLQ gene_id:10721|Hs108|chr3 (2590) 310 77.7 3.6e-13 >>CCDS3967.1 SKIV2L2 gene_id:23517|Hs108|chr5 (1042 aa) initn: 6856 init1: 6856 opt: 6856 Z-score: 8036.6 bits: 1498.7 E(32554): 0 Smith-Waterman score: 6856; 100.0% identity (100.0% similar) in 1042 aa overlap (1-1042:1-1042) 10 20 30 40 50 60 pF1KB0 MADAFGDELFSVFEGDSTTAAGTKKDKEKDKGKWKGPPGSADKAGKRFDGKLQSESTNNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 MADAFGDELFSVFEGDSTTAAGTKKDKEKDKGKWKGPPGSADKAGKRFDGKLQSESTNNG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 KNKRDVDFEGTDEPIFGKKPRIEESITEDLSLADLMPRVKVQSVETVEGCTHEVALPAEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 KNKRDVDFEGTDEPIFGKKPRIEESITEDLSLADLMPRVKVQSVETVEGCTHEVALPAEE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB0 DYLPLKPRVGKAAKEYPFILDAFQREAIQCVDNNQSVLVSAHTSAGKTVCAEYAIALALR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 DYLPLKPRVGKAAKEYPFILDAFQREAIQCVDNNQSVLVSAHTSAGKTVCAEYAIALALR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB0 EKQRVIFTSPIKALSNQKYREMYEEFQDVGLMTGDVTINPTASCLVMTTEILRSMLYRGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 EKQRVIFTSPIKALSNQKYREMYEEFQDVGLMTGDVTINPTASCLVMTTEILRSMLYRGS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB0 EVMREVAWVIFDEIHYMRDSERGVVWEETIILLPDNVHYVFLSATIPNARQFAEWICHLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 EVMREVAWVIFDEIHYMRDSERGVVWEETIILLPDNVHYVFLSATIPNARQFAEWICHLH 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB0 KQPCHVIYTDYRPTPLQHYIFPAGGDGLHLVVDENGDFREDNFNTAMQVLRDAGDLAKGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 KQPCHVIYTDYRPTPLQHYIFPAGGDGLHLVVDENGDFREDNFNTAMQVLRDAGDLAKGD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB0 QKGRKGGTKGPSNVFKIVKMIMERNFQPVIIFSFSKKDCEAYALQMTKLDFNTDEEKKMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 QKGRKGGTKGPSNVFKIVKMIMERNFQPVIIFSFSKKDCEAYALQMTKLDFNTDEEKKMV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB0 EEVFSNAIDCLSDEDKKLPQVEHVLPLLKRGIGIHHGGLLPILKETIEILFSEGLIKALF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 EEVFSNAIDCLSDEDKKLPQVEHVLPLLKRGIGIHHGGLLPILKETIEILFSEGLIKALF 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB0 ATETFAMGINMPARTVLFTNARKFDGKDFRWISSGEYIQMSGRAGRRGMDDRGIVILMVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 ATETFAMGINMPARTVLFTNARKFDGKDFRWISSGEYIQMSGRAGRRGMDDRGIVILMVD 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB0 EKMSPTIGKQLLKGSADPLNSAFHLTYNMVLNLLRVEEINPEYMLEKSFYQFQHYRAIPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 EKMSPTIGKQLLKGSADPLNSAFHLTYNMVLNLLRVEEINPEYMLEKSFYQFQHYRAIPG 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB0 VVEKVKNSEEQYNKIVIPNEESVVIYYKIRQQLAKLGKEIEEYIHKPKYCLPFLQPGRLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 VVEKVKNSEEQYNKIVIPNEESVVIYYKIRQQLAKLGKEIEEYIHKPKYCLPFLQPGRLV 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB0 KVKNEGDDFGWGVVVNFSKKSNVKPNSGELDPLYVVEVLLRCSKESLKNSATEAAKPAKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 KVKNEGDDFGWGVVVNFSKKSNVKPNSGELDPLYVVEVLLRCSKESLKNSATEAAKPAKP 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB0 DEKGEMQVVPVLVHLLSAISSVRLYIPKDLRPVDNRQSVLKSIQEVQKRFPDGIPLLDPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 DEKGEMQVVPVLVHLLSAISSVRLYIPKDLRPVDNRQSVLKSIQEVQKRFPDGIPLLDPI 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB0 DDMGIQDQGLKKVIQKVEAFEHRMYSHPLHNDPNLETVYTLCEKKAQIAIDIKSAKRELK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 DDMGIQDQGLKKVIQKVEAFEHRMYSHPLHNDPNLETVYTLCEKKAQIAIDIKSAKRELK 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB0 KARTVLQMDELKCRKRVLRRLGFATSSDVIEMKGRVACEISSADELLLTEMMFNGLFNDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 KARTVLQMDELKCRKRVLRRLGFATSSDVIEMKGRVACEISSADELLLTEMMFNGLFNDL 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB0 SAEQATALLSCFVFQENSSEMPKLTEQLAGPLRQMQECAKRIAKVSAEAKLEIDEETYLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 SAEQATALLSCFVFQENSSEMPKLTEQLAGPLRQMQECAKRIAKVSAEAKLEIDEETYLS 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB0 SFKPHLMDVVYTWATGATFAHICKMTDVFEGSIIRCMRRLEELLRQMCQAAKAIGNTELE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 SFKPHLMDVVYTWATGATFAHICKMTDVFEGSIIRCMRRLEELLRQMCQAAKAIGNTELE 970 980 990 1000 1010 1020 1030 1040 pF1KB0 NKFAEGITKIKRDIVFAASLYL :::::::::::::::::::::: CCDS39 NKFAEGITKIKRDIVFAASLYL 1030 1040 >>CCDS4731.1 SKIV2L gene_id:6499|Hs108|chr6 (1246 aa) initn: 1798 init1: 770 opt: 813 Z-score: 945.1 bits: 186.8 E(32554): 2.6e-46 Smith-Waterman score: 1983; 36.4% identity (65.5% similar) in 1013 aa overlap (80-1041:250-1244) 50 60 70 80 90 100 pF1KB0 GKLQSESTNNGKNKRDVDFEGTDEPIFGKKPRIEESITEDLSLADLMPRVKVQSVETVEG : . : ::: : . . :.. :. : CCDS47 LGGGDEDENEAVGQPGGPRGDTVSASPCSAPLARASSLEDLVLKE--ASTAVSTPEAPEP 220 230 240 250 260 270 110 120 130 140 150 160 pF1KB0 CTHEV-ALPAEE-----DYLPLKPRVGKAAKEYPFILDAFQREAIQCVDNNQSVLVSAHT ..: :.:.. :. : : . : .. : :.::..:: .. ..::.:.::: CCDS47 PSQEQWAIPVDATSPVGDFYRLIP---QPAFQWAFEPDVFQKQAILHLERHDSVFVAAHT 280 290 300 310 320 330 170 180 190 200 210 220 pF1KB0 SAGKTVCAEYAIALALREKQRVIFTSPIKALSNQKYREMYEEFQDVGLMTGDVTINPTAS :::::: :::::::: .. :.:.:::::::::::.:.. . : ::::.:::: ..: :: CCDS47 SAGKTVVAEYAIALAQKHMTRTIYTSPIKALSNQKFRDFRNTFGDVGLLTGDVQLHPEAS 340 350 360 370 380 390 230 240 250 260 270 280 pF1KB0 CLVMTTEILRSMLYRGSEVMREVAWVIFDEIHYMRDSERGVVWEETIILLPDNVHYVFLS ::.::::::::::: ::.:.:.. ::::::.::. : ::::::::..:.:::.: ..:: CCDS47 CLIMTTEILRSMLYSGSDVIRDLEWVIFDEVHYINDVERGVVWEEVLIMLPDHVSIILLS 400 410 420 430 440 450 290 300 310 320 330 pF1KB0 ATIPNARQFAEWICHLHKQPCHVIYTDYRPTPLQHYIFPAGGDG----LHLVVDENGDFR ::.::: .::.:: .:... .:: : ::.::.::.: .... : :..: : :. CCDS47 ATVPNALEFADWIGRLKRRQIYVISTVTRPVPLEHYLFTGNSSKTQGELFLLLDSRGAFH 460 470 480 490 500 510 340 350 360 370 380 390 pF1KB0 EDNFNTAMQVLRD-AGDLAK---GDQKGRKGGTKGPSNVF-KIVKMIMERNFQPVIIFSF .. .:... .. . :. . : ..:: .:. ... . : ::..:.: CCDS47 TKGYYAAVEAKKERMSKHAQTFGAKQPTHQGGPAQDRGVYLSLLASLRTRAQLPVVVFTF 520 530 540 550 560 570 400 410 420 430 440 450 pF1KB0 SKKDCEAYALQMTKLDFNTDEEKKMVEEVFSNAIDCLSDEDKKLPQVEHVLPLLKRGIGI :. :. : .:.::..:. ::. .. .. . : :..:::: :. ::.::.:. CCDS47 SRGRCDEQASGLTSLDLTTSSEKSEIHLFLQRCLARLRGSDRQLPQVLHMSELLNRGLGV 580 590 600 610 620 630 460 470 480 490 500 510 pF1KB0 HHGGLLPILKETIEILFSEGLIKALFATETFAMGINMPARTVLFTNARKFDGKDFRWISS ::.:.:::::: .:.:::.::.:.::::::::::.:::::::.: . :: ::. :: . CCDS47 HHSGILPILKEIVEMLFSRGLVKVLFATETFAMGVNMPARTVVFDSMRKHDGSTFRDLLP 640 650 660 670 680 690 520 530 540 550 560 570 pF1KB0 GEYIQMSGRAGRRGMDDRGIVILMVDEKMSPTIG--KQLLKGSADPLNSAFHLTYNMVLN :::.::.:::::::.: : :::. .. : .. .... :. . :.: :.:::.:.:: CCDS47 GEYVQMAGRAGRRGLDPTGTVILLCKGRV-PEMADLHRMMMGKPSQLQSQFRLTYTMILN 700 710 720 730 740 750 580 590 600 610 620 pF1KB0 LLRVEEINPEYMLEKSFYQFQHYRAIPGVVEKVKNSEEQYNKIVIPNEESVVI----YYK ::::. . : :...:: .: . . . . . .. . . :. . .. ::. CCDS47 LLRVDALRVEDMMKRSFSEFPSRKDSKAHEQALAELTKRLGALEEPDMTGQLVDLPEYYS 760 770 780 790 800 810 630 640 650 660 670 680 pF1KB0 IRQQLAKLGKEIEEYIHKPKYCLPFLQPGRLVKVKNEGDDFGWGVVVNFSKKSNVKPNSG ..:.. . :.. : . : :. ::.: :::. . ::... :..:. . CCDS47 WGEELTETQHMIQRRIMESVNGLKSLSAGRVVVVKNQEHHNALGVILQVSSNSTSR---- 820 830 840 850 860 690 700 710 720 730 pF1KB0 ELDPLYVVEVLLRCSK---ESLKNSATEAAKPAKPDEK-GEMQVVP------VLVHL--- : .:. :.: .. .. . .:. ::. : .: ..:.: CCDS47 ------VFTTLVLCDKPLSQDPQDRGPATAEVPYPDDLVGFKLFLPEGPCDHTVVKLQPG 870 880 890 900 910 920 740 750 760 770 pF1KB0 -LSAISS--VRLYIPKDLRPVDNRQ-----------SVLKSIQEVQK---RFPDGIPLLD ..::.. .:. : :. ..:: .: ..::. . : : : :: CCDS47 DMAAITTKVLRVNGEKILEDFSKRQQPKFKKDPPLAAVTTAVQELLRLAQAHPAGPPTLD 930 940 950 960 970 980 780 790 800 810 820 830 pF1KB0 PIDDMGIQDQGLKKVIQKVEAFEHRMYSHPLHNDPNLETVYTLCEKKAQIAIDIKSAKRE :..:. ..:... . ... .:. . . ..: . . : ... :: ... : CCDS47 PVNDLQLKDMSVVEGGLRARKLEELIQGAQCVHSPRFPAQYLKLRERMQIQKEMERL-RF 990 1000 1010 1020 1030 1040 840 850 860 870 880 890 pF1KB0 LKKARTVLQMDELKCRKRVLRRLGFATSSDVIEMKGRVACEISSADELLLTEMMFNGLFN : . ...: . : . : .::: ::.. . .... ::::: .:: ::::::.::.. .. CCDS47 LLSDQSLLLLPEYHQRVEVLRTLGYVDEAGTVKLAGRVACAMSS-HELLLTELMFDNALS 1050 1060 1070 1080 1090 1100 900 910 920 930 940 950 pF1KB0 DLSAEQATALLSCFVFQENSSEMPKLTEQLAGPLRQMQECAKRIAKVSAEAKLEIDEETY : :. .:::: .: : .. .: . : ..... ::::..:.. :. : . CCDS47 TLRPEEIAALLSGLVCQSPGDAGDQLPNTLKQGIERVRAVAKRIGEVQVACGLNQTVEEF 1110 1120 1130 1140 1150 1160 960 970 980 990 1000 1010 pF1KB0 LSSFKPHLMDVVYTWATGATFAHICKMTDVFEGSIIRCMRRLEELLRQMCQAAKAIGNTE .. .. :..::: :: : :... .. . :: ..::..:: :. :.. ::. .:. CCDS47 VGELNFGLVEVVYEWARGMPFSELAGLSGTPEGLVVRCIQRLAEMCRSLRGAARLVGEPV 1170 1180 1190 1200 1210 1220 1020 1030 1040 pF1KB0 LENKFAEGITKIKRDIVFAASLYL : :. . : ..:::::::::: CCDS47 LGAKMETAATLLRRDIVFAASLYTQ 1230 1240 >>CCDS33833.1 POLQ gene_id:10721|Hs108|chr3 (2590 aa) initn: 311 init1: 126 opt: 310 Z-score: 349.9 bits: 77.7 E(32554): 3.6e-13 Smith-Waterman score: 387; 27.3% identity (54.6% similar) in 454 aa overlap (151-564:105-520) 130 140 150 160 170 pF1KB0 DYLPLKPRVGKAAKEYPFILDAFQREAIQCVDNNQSVLVSAHTSAGKTVCAEYAI-ALAL : ...... :: ::::::. :: : .: CCDS33 GLPKAVLEKYHSFGVKKMFEWQAECLLLGQVLEGKNLVYSAPTSAGKTLVAELLILKRVL 80 90 100 110 120 130 180 190 200 210 220 pF1KB0 REKQRVIFTSPIKALSNQKYREMYEEFQDVGL-MTGDV-TINPT--------ASCLVMTT . .....: :. .....: . ::.::. . : . . .:. : : . . CCDS33 EMRKKALFILPFVSVAKEKKYYLQSLFQEVGIKVDGYMGSTSPSRHFSSLDIAVCTIERA 140 150 160 170 180 190 230 240 250 260 270 pF1KB0 EILRSMLYRGSEVMREVAWVIFDEIHYMRDSERGVVWEETIIL----------------- . : . : . .. : .. :. ::.:.. ::.:: . : . CCDS33 NGLINRLIEENK-MDLLGMVVVDELHMLGDSHRGYLLELLLTKICYITRKSASCQADLAS 200 210 220 230 240 250 280 290 300 310 320 330 pF1KB0 -LPDNVHYVFLSATIPNARQFAEWICHLHKQPCHVIYTDYRPTPLQHYIFPAGGDGLHLV : . :. : .:::.:: . : :. .. .::.::.:: . . .:.. . CCDS33 SLSNAVQIVGMSATLPNLELVASWLN------AELYHTDFRPVPLLESV-KVGNS----I 260 270 280 290 300 340 350 360 370 380 390 pF1KB0 VDENGDF-REDNFNTAMQVLRDAGDLAKGDQKGRKGGTKGPSNVFKIVKMIMERNFQPVI : . . :: :. .:: :::. ..: .. . : . :. CCDS33 YDSSMKLVRE--FEPMLQV--------KGDE----------DHVVSLCYETICDN-HSVL 310 320 330 340 400 410 420 430 440 pF1KB0 IFSFSKKDCEAYALQMTKLDFNTDEEKK-MVEE-----VFSNAIDCLS--DEDKKLPQ-V .: ::: :: : ... .: .. . .:. :. . . : :. ..::. . CCDS33 LFCPSKKWCEKLADIIAREFYNLHHQAEGLVKPSECPPVILEQKELLEVMDQLRRLPSGL 350 360 370 380 390 400 450 460 470 480 490 500 pF1KB0 EHVLP-LLKRGIGIHHGGLLPILKETIEILFSEGLIKALFATETFAMGINMPARTVLFTN . :: . :...::.:: .. :: : .:::..: :: :.. :.:.::: :.. . CCDS33 DSVLQKTVPWGVAFHHAGLTFEERDIIEGAFRQGLIRVLAATSTLSSGVNLPARRVIIRT 410 420 430 440 450 460 510 520 530 540 550 560 pF1KB0 ARKFDGKDFRWISSGEYIQMSGRAGRRGMDDRGIVILMVDEKMSPTIGKQLLKGSADPLN : :. . .. : :: :::::.:.: : ::. .. . . : ::.:: :. CCDS33 P-IFGGRPLDILT---YKQMVGRAGRKGVDTVGESILICKNSEK-SKGIALLQGSLKPVR 470 480 490 500 510 570 580 590 600 610 620 pF1KB0 SAFHLTYNMVLNLLRVEEINPEYMLEKSFYQFQHYRAIPGVVEKVKNSEEQYNKIVIPNE : .. CCDS33 SCLQRREGEEVTGSMIRAILEIIVGGVASTSQDMHTYAACTFLAASMKEGKQGIQRNQES 520 530 540 550 560 570 1042 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 13:36:24 2016 done: Sat Nov 5 13:36:25 2016 Total Scan time: 4.270 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]