FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA0017, 1217 aa
1>>>pF1KSDA0017 1217 - 1217 aa - 1217 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.7221+/-0.00114; mu= 19.3611+/- 0.069
mean_var=58.7368+/-11.517, 0's: 0 Z-trim(100.9): 38 B-trim: 0 in 0/48
Lambda= 0.167347
statistics sampled from 6302 (6307) to 6302 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.544), E-opt: 0.2 (0.194), width: 16
Scan time: 4.830
The best scores are: opt bits E(32554)
CCDS10894.1 SF3B3 gene_id:23450|Hs108|chr16 (1217) 8032 1948.4 0
CCDS31576.1 DDB1 gene_id:1642|Hs108|chr11 (1140) 367 97.8 1.6e-19
>>CCDS10894.1 SF3B3 gene_id:23450|Hs108|chr16 (1217 aa)
initn: 8032 init1: 8032 opt: 8032 Z-score: 10464.7 bits: 1948.4 E(32554): 0
Smith-Waterman score: 8032; 100.0% identity (100.0% similar) in 1217 aa overlap (1-1217:1-1217)
10 20 30 40 50 60
pF1KSD MFLYNLTLQRATGISFAIHGNFSGTKQQEIVVSRGKILELLRPDPNTGKVHTLLTVEVFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MFLYNLTLQRATGISFAIHGNFSGTKQQEIVVSRGKILELLRPDPNTGKVHTLLTVEVFG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD VIRSLMAFRLTGGTKDYIVVGSDSGRIVILEYQPSKNMFEKIHQETFGKSGCRRIVPGQF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VIRSLMAFRLTGGTKDYIVVGSDSGRIVILEYQPSKNMFEKIHQETFGKSGCRRIVPGQF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD LAVDPKGRAVMISAIEKQKLVYILNRDAAARLTISSPLEAHKANTLVYHVVGVDVGFENP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LAVDPKGRAVMISAIEKQKLVYILNRDAAARLTISSPLEAHKANTLVYHVVGVDVGFENP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD MFACLEMDYEEADNDPTGEAAANTQQTLTFYELDLGLNHVVRKYSEPLEEHGNFLITVPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MFACLEMDYEEADNDPTGEAAANTQQTLTFYELDLGLNHVVRKYSEPLEEHGNFLITVPG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD GSDGPSGVLICSENYITYKNFGDQPDIRCPIPRRRNDLDDPERGMIFVCSATHKTKSMFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GSDGPSGVLICSENYITYKNFGDQPDIRCPIPRRRNDLDDPERGMIFVCSATHKTKSMFF
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD FLAQTEQGDIFKITLETDEDMVTEIRLKYFDTVPVAAAMCVLKTGFLFVASEFGNHYLYQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 FLAQTEQGDIFKITLETDEDMVTEIRLKYFDTVPVAAAMCVLKTGFLFVASEFGNHYLYQ
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD IAHLGDDDEEPEFSSAMPLEEGDTFFFQPRPLKNLVLVDELDSLSPILFCQIADLANEDT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 IAHLGDDDEEPEFSSAMPLEEGDTFFFQPRPLKNLVLVDELDSLSPILFCQIADLANEDT
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD PQLYVACGRGPRSSLRVLRHGLEVSEMAVSELPGNPNAVWTVRRHIEDEFDAYIIVSFVN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PQLYVACGRGPRSSLRVLRHGLEVSEMAVSELPGNPNAVWTVRRHIEDEFDAYIIVSFVN
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD ATLVLSIGETVEEVTDSGFLGTTPTLSCSLLGDDALVQVYPDGIRHIRADKRVNEWKTPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ATLVLSIGETVEEVTDSGFLGTTPTLSCSLLGDDALVQVYPDGIRHIRADKRVNEWKTPG
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD KKTIVKCAVNQRQVVIALTGGELVYFEMDPSGQLNEYTERKEMSADVVCMSLANVPPGEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 KKTIVKCAVNQRQVVIALTGGELVYFEMDPSGQLNEYTERKEMSADVVCMSLANVPPGEQ
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD RSRFLAVGLVDNTVRIISLDPSDCLQPLSMQALPAQPESLCIVEMGGTEKQDELGERGSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RSRFLAVGLVDNTVRIISLDPSDCLQPLSMQALPAQPESLCIVEMGGTEKQDELGERGSI
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD GFLYLNIGLQNGVLLRTVLDPVTGDLSDTRTRYLGSRPVKLFRVRMQGQEAVLAMSSRSW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GFLYLNIGLQNGVLLRTVLDPVTGDLSDTRTRYLGSRPVKLFRVRMQGQEAVLAMSSRSW
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD LSYSYQSRFHLTPLSYETLEFASGFASEQCPEGIVAISTNTLRILALEKLGAVFNQVAFP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LSYSYQSRFHLTPLSYETLEFASGFASEQCPEGIVAISTNTLRILALEKLGAVFNQVAFP
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD LQYTPRKFVIHPESNNLIIIETDHNAYTEATKAQRKQQMAEEMVEAAGEDERELAAEMAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LQYTPRKFVIHPESNNLIIIETDHNAYTEATKAQRKQQMAEEMVEAAGEDERELAAEMAA
790 800 810 820 830 840
850 860 870 880 890 900
pF1KSD AFLNENLPESIFGAPKAGNGQWASVIRVMNPIQGNTLDLVQLEQNEAAFSVAVCRFSNTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 AFLNENLPESIFGAPKAGNGQWASVIRVMNPIQGNTLDLVQLEQNEAAFSVAVCRFSNTG
850 860 870 880 890 900
910 920 930 940 950 960
pF1KSD EDWYVLVGVAKDLILNPRSVAGGFVYTYKLVNNGEKLEFLHKTPVEEVPAAIAPFQGRVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 EDWYVLVGVAKDLILNPRSVAGGFVYTYKLVNNGEKLEFLHKTPVEEVPAAIAPFQGRVL
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KSD IGVGKLLRVYDLGKKKLLRKCENKHIANYISGIQTIGHRVIVSDVQESFIWVRYKRNENQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 IGVGKLLRVYDLGKKKLLRKCENKHIANYISGIQTIGHRVIVSDVQESFIWVRYKRNENQ
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KSD LIIFADDTYPRWVTTASLLDYDTVAGADKFGNICVVRLPPNTNDEVDEDPTGNKALWDRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LIIFADDTYPRWVTTASLLDYDTVAGADKFGNICVVRLPPNTNDEVDEDPTGNKALWDRG
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KSD LLNGASQKAEVIMNYHVGETVLSLQKTTLIPGGSESLVYTTLSGGIGILVPFTSHEDHDF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LLNGASQKAEVIMNYHVGETVLSLQKTTLIPGGSESLVYTTLSGGIGILVPFTSHEDHDF
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KSD FQHVEMHLRSEHPPLCGRDHLSFRSYYFPVKNVIDGDLCEQFNSMEPNKQKNVSEELDRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 FQHVEMHLRSEHPPLCGRDHLSFRSYYFPVKNVIDGDLCEQFNSMEPNKQKNVSEELDRT
1150 1160 1170 1180 1190 1200
1210
pF1KSD PPEVSKKLEDIRTRYAF
:::::::::::::::::
CCDS10 PPEVSKKLEDIRTRYAF
1210
>>CCDS31576.1 DDB1 gene_id:1642|Hs108|chr11 (1140 aa)
initn: 376 init1: 160 opt: 367 Z-score: 463.8 bits: 97.8 E(32554): 1.6e-19
Smith-Waterman score: 871; 23.5% identity (54.5% similar) in 1217 aa overlap (4-1197:5-1112)
10 20 30 40 50
pF1KSD MFLYNLTLQRATGISFAIHGNFSGTKQQEIVVSRGKILELLRPDPNTGKVHTLLTVEVF
: .: :. :... . :.:..... ....... ::. . .. . : ..
CCDS31 MSYNYVVTAQKPTAVNGCVTGHFTSAEDLNLLIAKNTRLEIYVVTAEG--LRPVKEVGMY
10 20 30 40 50
60 70 80 90 100 110
pF1KSD GVIRSLMAFRLTGGTKDYIVVGSDSGRIVILEYQPSK---NMFEKIHQETFGKSGCRRIV
: : . :: : .:: . . . . ::::. : ... . : .. . : :
CCDS31 GKIAVMELFRPKGESKDLLFILTAKYNACILEYKQSGESIDIITRAHGNVQDRIG-RPSE
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD PGQFLAVDPKGRAVMISAIEKQKLVYILNRDAAARLTISSPLEAHKANTLVYHVVGVDVG
: . .::. : . . . : :.:: .. :.: . ::. ::
CCDS31 TGIIGIIDPECRMIGLRLYDGLFKVIPLDRD-------NKELKAFNIRLEELHVI--DVK
120 130 140 150 160
180 190 200 210 220 230
pF1KSD FENPMFACLEMDYEEADNDPTGEAAANTQQTLTFYELDLGLNHVVRKYSEPLEEHGNFLI
: ...: . .:: :. . . . .: :.. : . .: .: .....:
CCDS31 F---LYGCQAPTICFVYQDPQGRHVKTYEVSLREKEFNKGPWK-----QENVEAEASMVI
170 180 190 200 210 220
240 250 260 270 280 290
pF1KSD TVPGGSDGPSGVLICSENYITYKNFGDQP-DIRCPIPRRRNDLDDPERGMIFVCSATHKT
.:: . .:..: ... :::.: ::. : :: .. . .::
CCDS31 AVP---EPFGGAIIIGQESITYHN-GDKYLAIAPPIIKQST----------IVCHNRVDP
230 240 250 260
300 310 320 330 340 350
pF1KSD KSMFFFLAQTEQGDIFKITLETDEDM---VT--EIRLKYFDTVPVAAAMCVLKTGFLFVA
.. ..:.. : : .: . :: .:.: :: ..:.. . . .: . : .: .::.
CCDS31 NGSRYLLGDME-GRLFMLLLEKEEQMDGTVTLKDLRVELLGETSIAECLTYLDNGVVFVG
270 280 290 300 310 320
360 370 380 390 400 410
pF1KSD SEFGNHYLYQIAHLGDDDEEPEFSSAMPLEEGDTFFFQPRPLKNLVLVDELDSLSPILFC
:..:. : .. :..:. . :: .:: .:.::.
CCDS31 SRLGDSQLVKLNV--DSNEQGSYVVAM-----ETF----------------TNLGPIVDM
330 340 350 360
420 430 440 450 460 470
pF1KSD QIADLANEDTPQLYVACGRGPRSSLRVLRHGLEVSEMAVSELPGNPNAVWTVRRHIEDEF
..:: . :: . : ..:::..:.:. . : : .::: ...: .: . :
CCDS31 CVVDLERQGQGQLVTCSGAFKEGSLRIIRNGIGIHEHASIDLPGI-KGLWPLRSDPNRET
370 380 390 400 410 420
480 490 500 510 520
pF1KSD DAYIIVSFVNATLVLSI-GETVEEVTDSGFLGTTPTLSCSLLGDDALVQVYPDGIRHIRA
: ...:::. : :: . :: :::. ::. :. :. .. . :.:. ..: .
CCDS31 DDTLVLSFVGQTRVLMLNGEEVEETELMGFVDDQQTFFCGNVAHQQLIQITSASVRLVSQ
430 440 450 460 470 480
530 540 550 560 570 580
pF1KSD DKR--VNEWKTPGKKTIVKCAVNQRQVVIALTGGELVYFEMDPSGQLNEYTERKEMSADV
. . :.::: : :.: . :. :::.:. : : :... :. .: . .. :: .:
CCDS31 EPKALVSEWKEPQAKNISVASCNSSQVVVAV-GRALYYLQIHPQ-ELRQISHT-EMEHEV
490 500 510 520 530
590 600 610 620 630 640
pF1KSD VCMSLANVPPGEQRSRFLAVGL-VDNTVRIISLDPSDCLQPLSMQALPAQPESLCIVEMG
.:.... . .. : . :.:: .: ..::..: :: : : . :.:. .. .
CCDS31 ACLDITPLGDSNGLSPLCAIGLWTDISARILKL-PSFELLHKEMLGGEIIPRSILMTTFE
540 550 560 570 580 590
650 660 670 680 690 700
pF1KSD GTEKQDELGERGSIGFLYLNIGLQNGVLLRTVLDPVTGDLSDTRTRYLGSRPVKLFRVRM
... :: .: .:.:. :. :: ::: . ::..:. : :
CCDS31 SSH--------------YLLCALGDGALFYFGLNIETGLLSDRKKVTLGTQPTVLRTFRS
600 610 620 630 640
710 720 730 740 750 760
pF1KSD QGQEAVLAMSSRSWLSYSYQSRFHLTPLSYETLEFASGFASEQCPEGIVAISTNTLRILA
. :.: :.: . :: . .. .. .. . ... . :. :.... ...:: : .
CCDS31 LSTTNVFACSDRPTVIYSSNHKLVFSNVNLKEVNYMCPLNSDGYPDSLALANNSTLTIGT
650 660 670 680 690 700
770 780 790 800 810 820
pF1KSD LEKLGAVFNQVAFPLQYTPRKFVIHPESNNLIIIETDHNAYTEATKAQRKQQMAEEMVEA
.... . ... :: .:::. . :. . .. . ..: . . . .
CCDS31 IDEIQKLHIRTV-PLYESPRKICYQEVSQCFGVLSSR-------IEVQDTSGGTTALRPS
710 720 730 740 750
830 840 850 860 870 880
pF1KSD AGEDERELAAEMAAAFLNENLP-ESIFGAPKAGNGQWASVIRVMNPIQGNTLDLVQLEQN
:. . .. . : . . : :. :: .. . ... ..: :. ::
CCDS31 ASTQALSSSVSSSKLFSSSTAPHETSFGEEVEVHN-----LLIIDQHTFEVLHAHQFLQN
760 770 780 790 800 810
890 900 910 920 930 940
pF1KSD EAAFSVAVCRFSNTGEDWYVLVGVAKDLILNPRSVAG--GFVYTYKLVNNGEKLEFLHKT
: :.:.. :.... . : .::.: .. :. . : . ... ..: ::. . .
CCDS31 EYALSLVSCKLGKD-PNTYFIVGTA---MVYPEEAEPKQGRIVVFQY-SDG-KLQTVAEK
820 830 840 850 860
950 960 970 980 990 1000
pF1KSD PVEEVPAAIAPFQGRVLIGVGKLLRVYDLGKKKLLRKCENKHIANYIS-GIQTIGHRVIV
:. . ... :.:..: .... .:.:. .: :: : .: : .. ..: : ..:
CCDS31 EVKGAVYSMVEFNGKLLASINSTVRLYEWTTEKELRT-ECNHYNNIMALYLKTKGDFILV
870 880 890 900 910 920
1010 1020 1030 1040 1050 1060
pF1KSD SDVQESFIWVRYKRNENQLIIFADDTYPRWVTTASLLDYDTVAGADKFGNICVVRLPPNT
.:...: . . :: :... .: : : :.... .:: :. ::.. :. : . ..
CCDS31 GDLMRSVLLLAYKPMEGNFEEIARDFNPNWMSAVEILDDDNFLGAENAFNLFVCQ--KDS
930 940 950 960 970 980
1070 1080 1090 1100 1110 1120
pF1KSD NDEVDEDPTGNKALWDRGLLNGASQKAEVIMNYHVGETVL-SLQKTTLIPGGSESLVYTT
.::. . : . ::.. .: . . : :. .: .:. :: ... :
CCDS31 AATTDEE---RQHLQEVGLFH----LGEFVNVFCHGSLVMQNLGETSTPTQGS--VLFGT
990 1000 1010 1020 1030
1130 1140 1150 1160 1170
pF1KSD LSGGIGILVPFTSHEDHDFFQHVEMHLRSEHPPLCGRDHLSFRSYYF-----PVKNVIDG
..: :: :: :. .... .. .: . . .: .::.. :. . :::
CCDS31 VNGMIG-LVTSLSESWYNLLLDMQNRLNKVIKSVGKIEHSFWRSFHTERKTEPATGFIDG
1040 1050 1060 1070 1080 1090
1180 1190 1200 1210
pF1KSD DLCEQFNSMEPNKQKNVSEELDRTPPEVSKKLEDIRTRYAF
:: :.: .. :...: .:
CCDS31 DLIESFLDISRPKMQEVVANLQYDDGSGMKREATADDLIKVVEELTRIH
1100 1110 1120 1130 1140
1217 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 23:20:46 2016 done: Wed Nov 2 23:20:47 2016
Total Scan time: 4.830 Total Display time: 0.140
Function used was FASTA [36.3.4 Apr, 2011]