FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1721, 1151 aa 1>>>pF1KSDA1721 1151 - 1151 aa - 1151 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.1672+/-0.00116; mu= 17.0607+/- 0.070 mean_var=65.3753+/-12.748, 0's: 0 Z-trim(100.8): 21 B-trim: 0 in 0/50 Lambda= 0.158624 statistics sampled from 6252 (6257) to 6252 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.534), E-opt: 0.2 (0.192), width: 16 Scan time: 4.670 The best scores are: opt bits E(32554) CCDS41872.1 XPO4 gene_id:64328|Hs108|chr13 (1151) 7447 1713.9 0 CCDS47818.1 XPO7 gene_id:23039|Hs108|chr8 (1087) 297 77.7 1.7e-13 >>CCDS41872.1 XPO4 gene_id:64328|Hs108|chr13 (1151 aa) initn: 7447 init1: 7447 opt: 7447 Z-score: 9198.3 bits: 1713.9 E(32554): 0 Smith-Waterman score: 7447; 100.0% identity (100.0% similar) in 1151 aa overlap (1-1151:1-1151) 10 20 30 40 50 60 pF1KSD MMAAALGPPEVIAQLENAAKVLMAPPSMVNNEQRQHAEHIFLSFRKSKSPFAVCKHILET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 MMAAALGPPEVIAQLENAAKVLMAPPSMVNNEQRQHAEHIFLSFRKSKSPFAVCKHILET 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD SKVDYVLFQAATAIMEAVVREWILLEKGSIESLRTFLLTYVLQRPNLQKYVREQILLAVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 SKVDYVLFQAATAIMEAVVREWILLEKGSIESLRTFLLTYVLQRPNLQKYVREQILLAVA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD VIVKRGSLDKSIDCKSIFHEVSQLISSGNPTVQTLACSILTALLSEFSSSSKTSNIGLSM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 VIVKRGSLDKSIDCKSIFHEVSQLISSGNPTVQTLACSILTALLSEFSSSSKTSNIGLSM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD EFHGNCKRVFQEEDLRQIFMLTVEVLQEFSRRENLNAQMSSVFQRYLALANQVLSWNFLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 EFHGNCKRVFQEEDLRQIFMLTVEVLQEFSRRENLNAQMSSVFQRYLALANQVLSWNFLP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD PNLGRHYIAMFESSQNVLLKPTESWRETLLDSRVMELFFTVHRKIREDSDMAQDSLQCLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 PNLGRHYIAMFESSQNVLLKPTESWRETLLDSRVMELFFTVHRKIREDSDMAQDSLQCLA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD QLASLHGPIFPDEGSQVDYLAHFIEGLLNTINGIEIEDSEAVGISSIISNLITVFPRNVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 QLASLHGPIFPDEGSQVDYLAHFIEGLLNTINGIEIEDSEAVGISSIISNLITVFPRNVL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD TAIPSELFSSFVNCLTHLTCSFGRSAALEEVLDKDDMVYMEAYDKLLESWLTLVQDDKHF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 TAIPSELFSSFVNCLTHLTCSFGRSAALEEVLDKDDMVYMEAYDKLLESWLTLVQDDKHF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD HKGFFTQHAVQVFNSYIQCHLAAPDGTRNLTANGVASREEEEISELQEDDRDQFSDQLAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 HKGFFTQHAVQVFNSYIQCHLAAPDGTRNLTANGVASREEEEISELQEDDRDQFSDQLAS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD VGMLGRIAAEHCIPLLTSLLEERVTRLHGQLQRHQQQLLASPGSSTVDNKMLDDLYEDIH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 VGMLGRIAAEHCIPLLTSLLEERVTRLHGQLQRHQQQLLASPGSSTVDNKMLDDLYEDIH 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD WLILVTGYLLADDTQGETPLIPPEIMEYSIKHSSEVDINTTLQILGSPGEKASSIPGYNR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 WLILVTGYLLADDTQGETPLIPPEIMEYSIKHSSEVDINTTLQILGSPGEKASSIPGYNR 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD TDSVIRLLSAILRVSEVESRAIRADLTHLLSPQMGKDIVWFLKRWAKTYLLVDEKLYDQI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 TDSVIRLLSAILRVSEVESRAIRADLTHLLSPQMGKDIVWFLKRWAKTYLLVDEKLYDQI 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD SLPFSTAFGADTEGSQWIIGYLLQKVISNLSVWSSEQDLANDTVQLLVTLVERRERANLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 SLPFSTAFGADTEGSQWIIGYLLQKVISNLSVWSSEQDLANDTVQLLVTLVERRERANLV 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD IQCENWWNLAKQFASRSPPLNFLSSPVQRTLMKALVLGGFAHMDTETKQQYWTEVLQPLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 IQCENWWNLAKQFASRSPPLNFLSSPVQRTLMKALVLGGFAHMDTETKQQYWTEVLQPLQ 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD QRFLRVINQENFQQMCQQEEVKQEITATLEALCGIAEATQIDNVAILFNFLMDFLTNCIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 QRFLRVINQENFQQMCQQEEVKQEITATLEALCGIAEATQIDNVAILFNFLMDFLTNCIG 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD LMEVYKNTPETVNLIIEVFVEVAHKQICYLGESKAMNLYEACLTLLQVYSKNNLGRQRID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 LMEVYKNTPETVNLIIEVFVEVAHKQICYLGESKAMNLYEACLTLLQVYSKNNLGRQRID 850 860 870 880 890 900 910 920 930 940 950 960 pF1KSD VTAEEEQYQDLLLIMELLTNLLSKEFIDFSDTDEVFRGHEPGQAANRSVSAADVVLYGVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 VTAEEEQYQDLLLIMELLTNLLSKEFIDFSDTDEVFRGHEPGQAANRSVSAADVVLYGVN 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KSD LILPLMSQDLLKFPTLCNQYYKLITFICEIFPEKIPQLPEDLFKSLMYSLELGMTSMSSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 LILPLMSQDLLKFPTLCNQYYKLITFICEIFPEKIPQLPEDLFKSLMYSLELGMTSMSSE 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KSD VCQLCLEALTPLAEQCAKAQETDSPLFLATRHFLKLVFDMLVLQKHNTEMTTAAGEAFYT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 VCQLCLEALTPLAEQCAKAQETDSPLFLATRHFLKLVFDMLVLQKHNTEMTTAAGEAFYT 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KSD LVCLHQAEYSELVETLLSSQQDPVIYQRLADAFNKLTASSTPPTLDRKQKMAFLKSLEEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 LVCLHQAEYSELVETLLSSQQDPVIYQRLADAFNKLTASSTPPTLDRKQKMAFLKSLEEF 1090 1100 1110 1120 1130 1140 1150 pF1KSD MANVGGLLCVK ::::::::::: CCDS41 MANVGGLLCVK 1150 >>CCDS47818.1 XPO7 gene_id:23039|Hs108|chr8 (1087 aa) initn: 156 init1: 77 opt: 297 Z-score: 355.8 bits: 77.7 E(32554): 1.7e-13 Smith-Waterman score: 489; 20.1% identity (53.4% similar) in 1180 aa overlap (12-1144:8-1069) 10 20 30 40 50 60 pF1KSD MMAAALGPPEVIAQLENAAKVLMAPPSMVNNEQRQHAEHIFLSFRKSKSPFAVCKHILET .::::: : :. ... : .::. .. : .: . .. :. .:: CCDS47 MADHVQSLAQLENLCKQLYET---TDTTTRLQAEKALVEFTNSPDCLSKCQLLLER 10 20 30 40 50 70 80 90 100 110 120 pF1KSD SKVDYVLFQAATAIMEAVVREWILLEKGSIESLRTFLLTYVLQRPNLQKYVREQILLAVA .. .: . ::: . . : : : . ..:...:.:. ::.: .: . .. : CCDS47 GSSSYSQLLAATCLTKLVSRTNNPLPLEQRIDIRNYVLNYLATRPKLATFVTQALIQLYA 60 70 80 90 100 110 130 140 150 160 170 180 pF1KSD VIVKRGSLDKSIDCKSIFHEVSQLISSGNPTVQTLACSILTALLSEFSSSSKTSNIGLSM :.: : .: . : . . .... . .:. : : ...::.... . .. . CCDS47 RITKLGWFDCQKDDYVFRNAITDVTRFLQDSVEY--CIIGVTILSQLTNEINQADTTHPL 120 130 140 150 160 170 190 200 210 220 230 pF1KSD EFHGNCKRVFQEEDLRQIFMLTVEVLQEFSRRE-NLNAQ-MSSVFQRYLALANQVLSWNF : . :.. .: .:: :. ..:.. : .. ::: . . ..... : :... :...: CCDS47 TKHRKIASSFRDSSLFDIFTLSCNLLKQASGKNLNLNDESQHGLLMQLLKLTHNCLNFDF 180 190 200 210 220 230 240 250 260 270 280 290 pF1KSD LPPNLGRHYIAMFESSQNV-LLKPTESWRETLLDSRVMELFFTVHRKIREDSDMAQDSLQ . . :::... .. ::: ..::: ...::: ....: ... :. CCDS47 IGTSTD-------ESSDDLCTVQIPTSWRSAFLDSSTLQLFFDLYHSI--PPSFSPLVLS 240 250 260 270 280 300 310 320 330 340 350 pF1KSD CLAQLASLHGPIFPDEGSQVDYLAHFIEGLLNTINGIEIEDSEAVGISSIISNLITVFPR ::.:.::.. .: ... .. .:.:...: .. :. : :. CCDS47 CLVQIASVRRSLF-NNAERAKFLSHLVDG-----------------VKRILEN-----PQ 290 300 310 360 370 380 390 400 410 pF1KSD NVLTAIPSELFSSFVNCLTHLTCSFGRSAALEEVLDKDDMVYMEAYDKL--LESWLTLVQ .. . :.. . : :..: .. . . : .: . ... . : . :. : .. CCDS47 SL--SDPNN-YHEFCRLLARLKSNY-QLGELVKVENYPEVIRLIANFTVTSLQHW-EFAP 320 330 340 350 360 370 420 430 440 450 460 470 pF1KSD DDKHFHKGFFTQHAVQV-FNSYIQCHLAAPDGTRNLTANGVASREEEEISELQEDDRDQF .. :. ... . :..: . . . :. : ..: ..:: : :.. .: . CCDS47 NSVHYLLSLWQRLAASVPYVKATEPHMLETY-TPEVTKAYITSRLESVHIILRDGLEDPL 380 390 400 410 420 430 480 490 500 510 520 pF1KSD SD------QLASVGMLGRIAAEHCIPLLTSLLEERVTRLHGQLQRHQQQLLASPGSSTVD : :: ... .:: :. ::..:.. : . :.:: : ..: .: CCDS47 EDTGLVQQQLDQLSTIGRCEYEKTCALLVQLFD--------QSAQSYQELLQSASASPMD 440 450 460 470 480 530 540 550 560 570 580 pF1KSD NKMLDDLYEDIHWLILVTGYLLADDTQGETPLIPPEIMEYSIKHSSEVDINTTLQILGSP . . . ::. . : ... :.. . . .. ..:. . .::.. CCDS47 IAVQEG---RLTWLVYIIGAVIG----GRVSFASTDEQD---AMDGEL-VCRVLQLM--- 490 500 510 520 530 590 600 610 620 630 640 pF1KSD GEKASSIPGYNRTDSVIRLLSAILRVSEVESRAIRADLTHLLSPQMGKDIVWFLKRWAKT : ::: :.... .. . .:. .:: :.... : CCDS47 ----------NLTDS---------RLAQAGNEKL--ELA-MLS---------FFEQFRKI 540 550 560 650 660 670 680 690 700 pF1KSD YLLVDEKLYDQISLPFSTAFGADTEGSQWIIGYLLQKVISNLSVWSSEQDLANDTVQLLV :. . . ... .: ..: . : ... .. :.:.::. :. . ... :.::: CCDS47 YIGDQVQKSSKLYRRLSEVLGLNDE--TMVLSVFIGKIITNLKYWGRCEPITSKTLQLLN 570 580 590 600 610 710 720 730 740 750 760 pF1KSD TLVERRERANLVIQCENWWNLAKQFASRSPPLNFLSSPVQRTL--MKA-----LVLGGFA : . ... . .. .:. ..::. : .: :. .:: . CCDS47 DLSIGYSSVRKLVKLSAVQFMLNNHTSEH--FSFLGINNQSNLTDMRCRTTFYTALGRLL 620 630 640 650 660 670 770 780 790 800 810 820 pF1KSD HMDTETKQQYWTEVLQPLQQRFLRVINQENFQQMCQQEEVKQEITATLEALCGIAEATQI .: .. . . . :: : : .. . ... .:: .:. ... .. : ::: : . CCDS47 MVDLGEDEDQYEQFMLPLTAAFEAVAQMFSTNSFNEQE-AKRTLVGLVRDLRGIAFAFNA 680 690 700 710 720 730 830 840 850 860 870 pF1KSD D-NVAILFNFLM-DFLTNCIGLMEVYKNTPETVNLIIEVFVEVAHKQICYL----GESKA . .::.... ... .:.. . : .. ......:..:.. : . .. CCDS47 KTSFMMLFEWIYPSYMPILQRAIELWYHDPACTTPVLKLMAELVHNRSQRLQFDVSSPNG 740 750 760 770 780 790 880 890 900 910 920 930 pF1KSD MNLYEACLTLLQVYSKN--NLGRQRIDVTAEEEQYQDLLLIMELLTNLLSKEFIDFSDTD . :.. .. .:.. .::. : . . . . . . .: :: ...:. CCDS47 ILLFRETSKMITMYGNRILTLGEVPKD-QVYALKLKGISICFSMLKAALSGSYVNFG--- 800 810 820 830 840 850 940 950 960 970 980 990 pF1KSD EVFRGHEPGQAANRSVSAADVVLYG-VNLILPLMSQDLLKFPTLCNQYYKLITFICEIFP ::: . :. .: : .: ..:.: . .::: .: : ..::.:. . . CCDS47 -VFRLY--GD------DALDNALQTFIKLLLSIPHSDLLDYPKLSQSYYSLLEVLTQDHM 860 870 880 890 900 1000 1010 1020 1030 pF1KSD EKIPQLPEDLFKSLMYSLELGMTSMSSEVCQLCLEAL----TPLAEQCAKA--------- . : .: .. .. :. :.:.... :: : : : : .: ... CCDS47 NFIASLEPHVIMYILSSISEGLTALDTMVCTGCCSCLDHIVTYLFKQLSRSTKKRTTPLN 910 920 930 940 950 960 1040 1050 1060 1070 1080 1090 pF1KSD QETDSPLFLATRH------FLKLVFDMLVLQKHNTEMTTAAGEAFYTLVCLHQAEYSELV ::.: : . .: .:. :....... .. . . . . :. :.. .:.: CCDS47 QESDRFLHIMQQHPEMIQQMLSTVLNIIIFEDCRNQWSMS--RPLLGLILLNEKYFSDLR 970 980 990 1000 1010 1020 1100 1110 1120 1130 1140 1150 pF1KSD ETLLSSQQDPVIYQRLADAFNKLTASSTPPTLDRKQKMAFLKSLEEFMANVGGLLCVK .....:: : : . :..: . .: :.. : ..: : .: CCDS47 NSIVNSQP-PEKQQAMHLCFENLMEG-IERNLLTKNRDRFTQNLSAFRREVNDSMKNSTY 1030 1040 1050 1060 1070 CCDS47 GVNSNDMMS 1080 1151 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 07:04:39 2016 done: Thu Nov 3 07:04:40 2016 Total Scan time: 4.670 Total Display time: 0.120 Function used was FASTA [36.3.4 Apr, 2011]