FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA0017, 1217 aa 1>>>pF1KSDA0017 1217 - 1217 aa - 1217 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7221+/-0.00114; mu= 19.3611+/- 0.069 mean_var=58.7368+/-11.517, 0's: 0 Z-trim(100.9): 38 B-trim: 0 in 0/48 Lambda= 0.167347 statistics sampled from 6302 (6307) to 6302 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.544), E-opt: 0.2 (0.194), width: 16 Scan time: 4.830 The best scores are: opt bits E(32554) CCDS10894.1 SF3B3 gene_id:23450|Hs108|chr16 (1217) 8032 1948.4 0 CCDS31576.1 DDB1 gene_id:1642|Hs108|chr11 (1140) 367 97.8 1.6e-19 >>CCDS10894.1 SF3B3 gene_id:23450|Hs108|chr16 (1217 aa) initn: 8032 init1: 8032 opt: 8032 Z-score: 10464.7 bits: 1948.4 E(32554): 0 Smith-Waterman score: 8032; 100.0% identity (100.0% similar) in 1217 aa overlap (1-1217:1-1217) 10 20 30 40 50 60 pF1KSD MFLYNLTLQRATGISFAIHGNFSGTKQQEIVVSRGKILELLRPDPNTGKVHTLLTVEVFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MFLYNLTLQRATGISFAIHGNFSGTKQQEIVVSRGKILELLRPDPNTGKVHTLLTVEVFG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD VIRSLMAFRLTGGTKDYIVVGSDSGRIVILEYQPSKNMFEKIHQETFGKSGCRRIVPGQF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 VIRSLMAFRLTGGTKDYIVVGSDSGRIVILEYQPSKNMFEKIHQETFGKSGCRRIVPGQF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD LAVDPKGRAVMISAIEKQKLVYILNRDAAARLTISSPLEAHKANTLVYHVVGVDVGFENP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LAVDPKGRAVMISAIEKQKLVYILNRDAAARLTISSPLEAHKANTLVYHVVGVDVGFENP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD MFACLEMDYEEADNDPTGEAAANTQQTLTFYELDLGLNHVVRKYSEPLEEHGNFLITVPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MFACLEMDYEEADNDPTGEAAANTQQTLTFYELDLGLNHVVRKYSEPLEEHGNFLITVPG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD GSDGPSGVLICSENYITYKNFGDQPDIRCPIPRRRNDLDDPERGMIFVCSATHKTKSMFF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GSDGPSGVLICSENYITYKNFGDQPDIRCPIPRRRNDLDDPERGMIFVCSATHKTKSMFF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD FLAQTEQGDIFKITLETDEDMVTEIRLKYFDTVPVAAAMCVLKTGFLFVASEFGNHYLYQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 FLAQTEQGDIFKITLETDEDMVTEIRLKYFDTVPVAAAMCVLKTGFLFVASEFGNHYLYQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD IAHLGDDDEEPEFSSAMPLEEGDTFFFQPRPLKNLVLVDELDSLSPILFCQIADLANEDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 IAHLGDDDEEPEFSSAMPLEEGDTFFFQPRPLKNLVLVDELDSLSPILFCQIADLANEDT 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD PQLYVACGRGPRSSLRVLRHGLEVSEMAVSELPGNPNAVWTVRRHIEDEFDAYIIVSFVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 PQLYVACGRGPRSSLRVLRHGLEVSEMAVSELPGNPNAVWTVRRHIEDEFDAYIIVSFVN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD ATLVLSIGETVEEVTDSGFLGTTPTLSCSLLGDDALVQVYPDGIRHIRADKRVNEWKTPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ATLVLSIGETVEEVTDSGFLGTTPTLSCSLLGDDALVQVYPDGIRHIRADKRVNEWKTPG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD KKTIVKCAVNQRQVVIALTGGELVYFEMDPSGQLNEYTERKEMSADVVCMSLANVPPGEQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 KKTIVKCAVNQRQVVIALTGGELVYFEMDPSGQLNEYTERKEMSADVVCMSLANVPPGEQ 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD RSRFLAVGLVDNTVRIISLDPSDCLQPLSMQALPAQPESLCIVEMGGTEKQDELGERGSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 RSRFLAVGLVDNTVRIISLDPSDCLQPLSMQALPAQPESLCIVEMGGTEKQDELGERGSI 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD GFLYLNIGLQNGVLLRTVLDPVTGDLSDTRTRYLGSRPVKLFRVRMQGQEAVLAMSSRSW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GFLYLNIGLQNGVLLRTVLDPVTGDLSDTRTRYLGSRPVKLFRVRMQGQEAVLAMSSRSW 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD LSYSYQSRFHLTPLSYETLEFASGFASEQCPEGIVAISTNTLRILALEKLGAVFNQVAFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LSYSYQSRFHLTPLSYETLEFASGFASEQCPEGIVAISTNTLRILALEKLGAVFNQVAFP 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD LQYTPRKFVIHPESNNLIIIETDHNAYTEATKAQRKQQMAEEMVEAAGEDERELAAEMAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LQYTPRKFVIHPESNNLIIIETDHNAYTEATKAQRKQQMAEEMVEAAGEDERELAAEMAA 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD AFLNENLPESIFGAPKAGNGQWASVIRVMNPIQGNTLDLVQLEQNEAAFSVAVCRFSNTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 AFLNENLPESIFGAPKAGNGQWASVIRVMNPIQGNTLDLVQLEQNEAAFSVAVCRFSNTG 850 860 870 880 890 900 910 920 930 940 950 960 pF1KSD EDWYVLVGVAKDLILNPRSVAGGFVYTYKLVNNGEKLEFLHKTPVEEVPAAIAPFQGRVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 EDWYVLVGVAKDLILNPRSVAGGFVYTYKLVNNGEKLEFLHKTPVEEVPAAIAPFQGRVL 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KSD IGVGKLLRVYDLGKKKLLRKCENKHIANYISGIQTIGHRVIVSDVQESFIWVRYKRNENQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 IGVGKLLRVYDLGKKKLLRKCENKHIANYISGIQTIGHRVIVSDVQESFIWVRYKRNENQ 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KSD LIIFADDTYPRWVTTASLLDYDTVAGADKFGNICVVRLPPNTNDEVDEDPTGNKALWDRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LIIFADDTYPRWVTTASLLDYDTVAGADKFGNICVVRLPPNTNDEVDEDPTGNKALWDRG 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KSD LLNGASQKAEVIMNYHVGETVLSLQKTTLIPGGSESLVYTTLSGGIGILVPFTSHEDHDF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LLNGASQKAEVIMNYHVGETVLSLQKTTLIPGGSESLVYTTLSGGIGILVPFTSHEDHDF 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KSD FQHVEMHLRSEHPPLCGRDHLSFRSYYFPVKNVIDGDLCEQFNSMEPNKQKNVSEELDRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 FQHVEMHLRSEHPPLCGRDHLSFRSYYFPVKNVIDGDLCEQFNSMEPNKQKNVSEELDRT 1150 1160 1170 1180 1190 1200 1210 pF1KSD PPEVSKKLEDIRTRYAF ::::::::::::::::: CCDS10 PPEVSKKLEDIRTRYAF 1210 >>CCDS31576.1 DDB1 gene_id:1642|Hs108|chr11 (1140 aa) initn: 376 init1: 160 opt: 367 Z-score: 463.8 bits: 97.8 E(32554): 1.6e-19 Smith-Waterman score: 871; 23.5% identity (54.5% similar) in 1217 aa overlap (4-1197:5-1112) 10 20 30 40 50 pF1KSD MFLYNLTLQRATGISFAIHGNFSGTKQQEIVVSRGKILELLRPDPNTGKVHTLLTVEVF : .: :. :... . :.:..... ....... ::. . .. . : .. CCDS31 MSYNYVVTAQKPTAVNGCVTGHFTSAEDLNLLIAKNTRLEIYVVTAEG--LRPVKEVGMY 10 20 30 40 50 60 70 80 90 100 110 pF1KSD GVIRSLMAFRLTGGTKDYIVVGSDSGRIVILEYQPSK---NMFEKIHQETFGKSGCRRIV : : . :: : .:: . . . . ::::. : ... . : .. . : : CCDS31 GKIAVMELFRPKGESKDLLFILTAKYNACILEYKQSGESIDIITRAHGNVQDRIG-RPSE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD PGQFLAVDPKGRAVMISAIEKQKLVYILNRDAAARLTISSPLEAHKANTLVYHVVGVDVG : . .::. : . . . : :.:: .. :.: . ::. :: CCDS31 TGIIGIIDPECRMIGLRLYDGLFKVIPLDRD-------NKELKAFNIRLEELHVI--DVK 120 130 140 150 160 180 190 200 210 220 230 pF1KSD FENPMFACLEMDYEEADNDPTGEAAANTQQTLTFYELDLGLNHVVRKYSEPLEEHGNFLI : ...: . .:: :. . . . .: :.. : . .: .: .....: CCDS31 F---LYGCQAPTICFVYQDPQGRHVKTYEVSLREKEFNKGPWK-----QENVEAEASMVI 170 180 190 200 210 220 240 250 260 270 280 290 pF1KSD TVPGGSDGPSGVLICSENYITYKNFGDQP-DIRCPIPRRRNDLDDPERGMIFVCSATHKT .:: . .:..: ... :::.: ::. : :: .. . .:: CCDS31 AVP---EPFGGAIIIGQESITYHN-GDKYLAIAPPIIKQST----------IVCHNRVDP 230 240 250 260 300 310 320 330 340 350 pF1KSD KSMFFFLAQTEQGDIFKITLETDEDM---VT--EIRLKYFDTVPVAAAMCVLKTGFLFVA .. ..:.. : : .: . :: .:.: :: ..:.. . . .: . : .: .::. CCDS31 NGSRYLLGDME-GRLFMLLLEKEEQMDGTVTLKDLRVELLGETSIAECLTYLDNGVVFVG 270 280 290 300 310 320 360 370 380 390 400 410 pF1KSD SEFGNHYLYQIAHLGDDDEEPEFSSAMPLEEGDTFFFQPRPLKNLVLVDELDSLSPILFC :..:. : .. :..:. . :: .:: .:.::. CCDS31 SRLGDSQLVKLNV--DSNEQGSYVVAM-----ETF----------------TNLGPIVDM 330 340 350 360 420 430 440 450 460 470 pF1KSD QIADLANEDTPQLYVACGRGPRSSLRVLRHGLEVSEMAVSELPGNPNAVWTVRRHIEDEF ..:: . :: . : ..:::..:.:. . : : .::: ...: .: . : CCDS31 CVVDLERQGQGQLVTCSGAFKEGSLRIIRNGIGIHEHASIDLPGI-KGLWPLRSDPNRET 370 380 390 400 410 420 480 490 500 510 520 pF1KSD DAYIIVSFVNATLVLSI-GETVEEVTDSGFLGTTPTLSCSLLGDDALVQVYPDGIRHIRA : ...:::. : :: . :: :::. ::. :. :. .. . :.:. ..: . CCDS31 DDTLVLSFVGQTRVLMLNGEEVEETELMGFVDDQQTFFCGNVAHQQLIQITSASVRLVSQ 430 440 450 460 470 480 530 540 550 560 570 580 pF1KSD DKR--VNEWKTPGKKTIVKCAVNQRQVVIALTGGELVYFEMDPSGQLNEYTERKEMSADV . . :.::: : :.: . :. :::.:. : : :... :. .: . .. :: .: CCDS31 EPKALVSEWKEPQAKNISVASCNSSQVVVAV-GRALYYLQIHPQ-ELRQISHT-EMEHEV 490 500 510 520 530 590 600 610 620 630 640 pF1KSD VCMSLANVPPGEQRSRFLAVGL-VDNTVRIISLDPSDCLQPLSMQALPAQPESLCIVEMG .:.... . .. : . :.:: .: ..::..: :: : : . :.:. .. . CCDS31 ACLDITPLGDSNGLSPLCAIGLWTDISARILKL-PSFELLHKEMLGGEIIPRSILMTTFE 540 550 560 570 580 590 650 660 670 680 690 700 pF1KSD GTEKQDELGERGSIGFLYLNIGLQNGVLLRTVLDPVTGDLSDTRTRYLGSRPVKLFRVRM ... :: .: .:.:. :. :: ::: . ::..:. : : CCDS31 SSH--------------YLLCALGDGALFYFGLNIETGLLSDRKKVTLGTQPTVLRTFRS 600 610 620 630 640 710 720 730 740 750 760 pF1KSD QGQEAVLAMSSRSWLSYSYQSRFHLTPLSYETLEFASGFASEQCPEGIVAISTNTLRILA . :.: :.: . :: . .. .. .. . ... . :. :.... ...:: : . CCDS31 LSTTNVFACSDRPTVIYSSNHKLVFSNVNLKEVNYMCPLNSDGYPDSLALANNSTLTIGT 650 660 670 680 690 700 770 780 790 800 810 820 pF1KSD LEKLGAVFNQVAFPLQYTPRKFVIHPESNNLIIIETDHNAYTEATKAQRKQQMAEEMVEA .... . ... :: .:::. . :. . .. . ..: . . . . CCDS31 IDEIQKLHIRTV-PLYESPRKICYQEVSQCFGVLSSR-------IEVQDTSGGTTALRPS 710 720 730 740 750 830 840 850 860 870 880 pF1KSD AGEDERELAAEMAAAFLNENLP-ESIFGAPKAGNGQWASVIRVMNPIQGNTLDLVQLEQN :. . .. . : . . : :. :: .. . ... ..: :. :: CCDS31 ASTQALSSSVSSSKLFSSSTAPHETSFGEEVEVHN-----LLIIDQHTFEVLHAHQFLQN 760 770 780 790 800 810 890 900 910 920 930 940 pF1KSD EAAFSVAVCRFSNTGEDWYVLVGVAKDLILNPRSVAG--GFVYTYKLVNNGEKLEFLHKT : :.:.. :.... . : .::.: .. :. . : . ... ..: ::. . . CCDS31 EYALSLVSCKLGKD-PNTYFIVGTA---MVYPEEAEPKQGRIVVFQY-SDG-KLQTVAEK 820 830 840 850 860 950 960 970 980 990 1000 pF1KSD PVEEVPAAIAPFQGRVLIGVGKLLRVYDLGKKKLLRKCENKHIANYIS-GIQTIGHRVIV :. . ... :.:..: .... .:.:. .: :: : .: : .. ..: : ..: CCDS31 EVKGAVYSMVEFNGKLLASINSTVRLYEWTTEKELRT-ECNHYNNIMALYLKTKGDFILV 870 880 890 900 910 920 1010 1020 1030 1040 1050 1060 pF1KSD SDVQESFIWVRYKRNENQLIIFADDTYPRWVTTASLLDYDTVAGADKFGNICVVRLPPNT .:...: . . :: :... .: : : :.... .:: :. ::.. :. : . .. CCDS31 GDLMRSVLLLAYKPMEGNFEEIARDFNPNWMSAVEILDDDNFLGAENAFNLFVCQ--KDS 930 940 950 960 970 980 1070 1080 1090 1100 1110 1120 pF1KSD NDEVDEDPTGNKALWDRGLLNGASQKAEVIMNYHVGETVL-SLQKTTLIPGGSESLVYTT .::. . : . ::.. .: . . : :. .: .:. :: ... : CCDS31 AATTDEE---RQHLQEVGLFH----LGEFVNVFCHGSLVMQNLGETSTPTQGS--VLFGT 990 1000 1010 1020 1030 1130 1140 1150 1160 1170 pF1KSD LSGGIGILVPFTSHEDHDFFQHVEMHLRSEHPPLCGRDHLSFRSYYF-----PVKNVIDG ..: :: :: :. .... .. .: . . .: .::.. :. . ::: CCDS31 VNGMIG-LVTSLSESWYNLLLDMQNRLNKVIKSVGKIEHSFWRSFHTERKTEPATGFIDG 1040 1050 1060 1070 1080 1090 1180 1190 1200 1210 pF1KSD DLCEQFNSMEPNKQKNVSEELDRTPPEVSKKLEDIRTRYAF :: :.: .. :...: .: CCDS31 DLIESFLDISRPKMQEVVANLQYDDGSGMKREATADDLIKVVEELTRIH 1100 1110 1120 1130 1140 1217 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 23:20:46 2016 done: Wed Nov 2 23:20:47 2016 Total Scan time: 4.830 Total Display time: 0.140 Function used was FASTA [36.3.4 Apr, 2011]