FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5977, 519 aa 1>>>pF1KB5977 519 - 519 aa - 519 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.0141+/-0.000925; mu= 6.1570+/- 0.056 mean_var=144.0192+/-28.663, 0's: 0 Z-trim(110.4): 29 B-trim: 0 in 0/51 Lambda= 0.106872 statistics sampled from 11553 (11578) to 11553 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.704), E-opt: 0.2 (0.356), width: 16 Scan time: 3.670 The best scores are: opt bits E(32554) CCDS34217.1 SNX2 gene_id:6643|Hs108|chr5 ( 519) 3334 525.7 4.8e-149 CCDS64234.1 SNX2 gene_id:6643|Hs108|chr5 ( 402) 2576 408.8 5.8e-114 CCDS32266.1 SNX1 gene_id:6642|Hs108|chr15 ( 522) 1894 303.7 3.3e-82 CCDS58371.1 SNX1 gene_id:6642|Hs108|chr15 ( 557) 1799 289.1 9e-78 CCDS32268.1 SNX1 gene_id:6642|Hs108|chr15 ( 457) 1766 284.0 2.6e-76 >>CCDS34217.1 SNX2 gene_id:6643|Hs108|chr5 (519 aa) initn: 3334 init1: 3334 opt: 3334 Z-score: 2789.3 bits: 525.7 E(32554): 4.8e-149 Smith-Waterman score: 3334; 100.0% identity (100.0% similar) in 519 aa overlap (1-519:1-519) 10 20 30 40 50 60 pF1KB5 MAAEREPPPLGDGKPTDFEDLEDGEDLFTSTVSTLESSPSSPEPASLPAEDISANSNGPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MAAEREPPPLGDGKPTDFEDLEDGEDLFTSTVSTLESSPSSPEPASLPAEDISANSNGPK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 PTEVVLDDDREDLFAEATEEVSLDSPEREPILSSEPSPAVTPVTPTTLIAPRIESKSMSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PTEVVLDDDREDLFAEATEEVSLDSPEREPILSSEPSPAVTPVTPTTLIAPRIESKSMSA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 PVIFDRSREEIEEEANGDIFDIEIGVSDPEKVGDGMNAYMAYRVTTKTSLSMFSKSEFSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PVIFDRSREEIEEEANGDIFDIEIGVSDPEKVGDGMNAYMAYRVTTKTSLSMFSKSEFSV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 KRRFSDFLGLHSKLASKYLHVGYIVPPAPEKSIVGMTKVKVGKEDSSSTEFVEKRRAALE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 KRRFSDFLGLHSKLASKYLHVGYIVPPAPEKSIVGMTKVKVGKEDSSSTEFVEKRRAALE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 RYLQRTVKHPTLLQDPDLRQFLESSELPRAVNTQALSGAGILRMVNKAADAVNKMTIKMN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RYLQRTVKHPTLLQDPDLRQFLESSELPRAVNTQALSGAGILRMVNKAADAVNKMTIKMN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 ESDAWFEEKQQQFENLDQQLRKLHVSVEALVCHRKELSANTAAFAKSAAMLGNSEDHTAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 ESDAWFEEKQQQFENLDQQLRKLHVSVEALVCHRKELSANTAAFAKSAAMLGNSEDHTAL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 SRALSQLAEVEEKIDQLHQEQAFADFYMFSELLSDYIRLIAAVKGVFDHRMKCWQKWEDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SRALSQLAEVEEKIDQLHQEQAFADFYMFSELLSDYIRLIAAVKGVFDHRMKCWQKWEDA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 QITLLKKREAEAKMMVANKPDKIQQAKNEIREWEAKVQQGERDFEQISKTIRKEVGRFEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 QITLLKKREAEAKMMVANKPDKIQQAKNEIREWEAKVQQGERDFEQISKTIRKEVGRFEK 430 440 450 460 470 480 490 500 510 pF1KB5 ERVKDFKTVIIKYLESLVQTQQQLIKYWEAFLPEAKAIA ::::::::::::::::::::::::::::::::::::::: CCDS34 ERVKDFKTVIIKYLESLVQTQQQLIKYWEAFLPEAKAIA 490 500 510 >>CCDS64234.1 SNX2 gene_id:6643|Hs108|chr5 (402 aa) initn: 2576 init1: 2576 opt: 2576 Z-score: 2159.4 bits: 408.8 E(32554): 5.8e-114 Smith-Waterman score: 2576; 100.0% identity (100.0% similar) in 402 aa overlap (118-519:1-402) 90 100 110 120 130 140 pF1KB5 REPILSSEPSPAVTPVTPTTLIAPRIESKSMSAPVIFDRSREEIEEEANGDIFDIEIGVS :::::::::::::::::::::::::::::: CCDS64 MSAPVIFDRSREEIEEEANGDIFDIEIGVS 10 20 30 150 160 170 180 190 200 pF1KB5 DPEKVGDGMNAYMAYRVTTKTSLSMFSKSEFSVKRRFSDFLGLHSKLASKYLHVGYIVPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 DPEKVGDGMNAYMAYRVTTKTSLSMFSKSEFSVKRRFSDFLGLHSKLASKYLHVGYIVPP 40 50 60 70 80 90 210 220 230 240 250 260 pF1KB5 APEKSIVGMTKVKVGKEDSSSTEFVEKRRAALERYLQRTVKHPTLLQDPDLRQFLESSEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 APEKSIVGMTKVKVGKEDSSSTEFVEKRRAALERYLQRTVKHPTLLQDPDLRQFLESSEL 100 110 120 130 140 150 270 280 290 300 310 320 pF1KB5 PRAVNTQALSGAGILRMVNKAADAVNKMTIKMNESDAWFEEKQQQFENLDQQLRKLHVSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 PRAVNTQALSGAGILRMVNKAADAVNKMTIKMNESDAWFEEKQQQFENLDQQLRKLHVSV 160 170 180 190 200 210 330 340 350 360 370 380 pF1KB5 EALVCHRKELSANTAAFAKSAAMLGNSEDHTALSRALSQLAEVEEKIDQLHQEQAFADFY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 EALVCHRKELSANTAAFAKSAAMLGNSEDHTALSRALSQLAEVEEKIDQLHQEQAFADFY 220 230 240 250 260 270 390 400 410 420 430 440 pF1KB5 MFSELLSDYIRLIAAVKGVFDHRMKCWQKWEDAQITLLKKREAEAKMMVANKPDKIQQAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 MFSELLSDYIRLIAAVKGVFDHRMKCWQKWEDAQITLLKKREAEAKMMVANKPDKIQQAK 280 290 300 310 320 330 450 460 470 480 490 500 pF1KB5 NEIREWEAKVQQGERDFEQISKTIRKEVGRFEKERVKDFKTVIIKYLESLVQTQQQLIKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 NEIREWEAKVQQGERDFEQISKTIRKEVGRFEKERVKDFKTVIIKYLESLVQTQQQLIKY 340 350 360 370 380 390 510 pF1KB5 WEAFLPEAKAIA :::::::::::: CCDS64 WEAFLPEAKAIA 400 >>CCDS32266.1 SNX1 gene_id:6642|Hs108|chr15 (522 aa) initn: 2007 init1: 1868 opt: 1894 Z-score: 1589.4 bits: 303.7 E(32554): 3.3e-82 Smith-Waterman score: 1971; 60.1% identity (79.6% similar) in 534 aa overlap (2-519:10-522) 10 20 30 40 pF1KB5 MAAEREPPPL-----------GDGKPTDFEDLEDGEDLFTSTVSTLESSPSS :.:: :::. : ..: .. .:::.::. ... :. .: CCDS32 MASGGGGCSASERLPPPFPGLEPESEGAAGGSEPEAGDSDTEGEDIFTG--AAVVSKHQS 10 20 30 40 50 50 60 70 80 90 pF1KB5 PEPAS--LPAEDISANSNGPKPTEVVLDDDRE--DLFAEATEEVSLDSPEREPILSSEPS :. .. :: .:: : . . ..:.: ::::.:: :.:::: . . CCDS32 PKITTSLLPI------NNGSKENGIHEEQDQEPQDLFADATVELSLDSTQNNQ------- 60 70 80 90 100 100 110 120 130 140 150 pF1KB5 PAVTPVTPTTLIA-PRIESKSMSAPVIFDRSREEIEEEANGDIFDIEIGVSDPEKVGDGM : :::. : :. . : : . . ::.::: . : ::. .:..::::.:::: CCDS32 ---KKVLAKTLISLPPQEATNSSKP---QPTYEELEEEEQEDQFDLTVGITDPEKIGDGM 110 120 130 140 150 160 170 180 190 200 210 pF1KB5 NAYMAYRVTTKTSLSMFSKSEFSVKRRFSDFLGLHSKLASKYLHVGYIVPPAPEKSIVGM :::.::.:::.::: .: ...:.:::::::::::. ::. :. . :.:::: ::::..:: CCDS32 NAYVAYKVTTQTSLPLFRSKQFAVKRRFSDFLGLYEKLSEKHSQNGFIVPPPPEKSLIGM 160 170 180 190 200 210 220 230 240 250 260 270 pF1KB5 TKVKVGKEDSSSTEFVEKRRAALERYLQRTVKHPTLLQDPDLRQFLESSELPRAVNTQAL ::::::::::::.::.::::::::::::: :.:::.:::::.:.:::. ::::::.::.: CCDS32 TKVKVGKEDSSSAEFLEKRRAALERYLQRIVNHPTMLQDPDVREFLEKEELPRAVGTQTL 220 230 240 250 260 270 280 290 300 310 320 330 pF1KB5 SGAGILRMVNKAADAVNKMTIKMNESDAWFEEKQQQFENLDQQLRKLHVSVEALVCHRKE ::::.:.: :::.:::.:::::::::: ::::: :. : .:.:::::. ::.:: :::: CCDS32 SGAGLLKMFNKATDAVSKMTIKMNESDIWFEEKLQEVECEEQRLRKLHAVVETLVNHRKE 280 290 300 310 320 330 340 350 360 370 380 390 pF1KB5 LSANTAAFAKSAAMLGNSEDHTALSRALSQLAEVEEKIDQLHQEQAFADFYMFSELLSDY :. ::: :::: ::::.:::.:::::::::::::::::.::::::: ::....:::::: CCDS32 LALNTAQFAKSLAMLGSSEDNTALSRALSQLAEVEEKIEQLHQEQANNDFFLLAELLSDY 340 350 360 370 380 390 400 410 420 430 440 450 pF1KB5 IRLIAAVKGVFDHRMKCWQKWEDAQITLLKKREAEAKMMVANKPDKIQQAKNEIREWEAK :::.: :...::.::: ::.:.::: :: :::::::... ::::::.::::.:: :::.. CCDS32 IRLLAIVRAAFDQRMKTWQRWQDAQATLQKKREAEARLLWANKPDKLQQAKDEILEWESR 400 410 420 430 440 450 460 470 480 490 500 510 pF1KB5 VQQGERDFEQISKTIRKEVGRFEKERVKDFKTVIIKYLESLVQTQQQLIKYWEAFLPEAK : : :::::.:: ..:::: :::::. ::::. .:::::.:. .:::: ::::::::::: CCDS32 VTQYERDFERISTVVRKEVIRFEKEKSKDFKNHVIKYLETLLYSQQQLAKYWEAFLPEAK 460 470 480 490 500 510 pF1KB5 AIA ::. CCDS32 AIS 520 >>CCDS58371.1 SNX1 gene_id:6642|Hs108|chr15 (557 aa) initn: 1888 init1: 1774 opt: 1799 Z-score: 1509.8 bits: 289.1 E(32554): 9e-78 Smith-Waterman score: 1876; 59.3% identity (79.7% similar) in 516 aa overlap (2-503:10-506) 10 20 30 40 pF1KB5 MAAEREPPPL-----------GDGKPTDFEDLEDGEDLFTSTVSTLESSPSS :.:: :::. : ..: .. .:::.::. ... :. .: CCDS58 MASGGGGCSASERLPPPFPGLEPESEGAAGGSEPEAGDSDTEGEDIFTG--AAVVSKHQS 10 20 30 40 50 50 60 70 80 90 pF1KB5 PEPAS--LPAEDISANSNGPKPTEVVLDDDREDLFAEATEEVSLDSPEREPILSSEPSPA :. .. :: .. : . :: . . :.. .::::.:: :.:::: . . CCDS58 PKITTSLLPINNGSKE-NGIHEEQ---DQEPQDLFADATVELSLDSTQNNQ--------- 60 70 80 90 100 100 110 120 130 140 150 pF1KB5 VTPVTPTTLIA-PRIESKSMSAPVIFDRSREEIEEEANGDIFDIEIGVSDPEKVGDGMNA : :::. : :. . : : . . ::.::: . : ::. .:..::::.:::::: CCDS58 -KKVLAKTLISLPPQEATNSSKP---QPTYEELEEEEQEDQFDLTVGITDPEKIGDGMNA 110 120 130 140 150 160 160 170 180 190 200 210 pF1KB5 YMAYRVTTKTSLSMFSKSEFSVKRRFSDFLGLHSKLASKYLHVGYIVPPAPEKSIVGMTK :.::.:::.::: .: ...:.:::::::::::. ::. :. . :.:::: ::::..:::: CCDS58 YVAYKVTTQTSLPLFRSKQFAVKRRFSDFLGLYEKLSEKHSQNGFIVPPPPEKSLIGMTK 170 180 190 200 210 220 220 230 240 250 260 270 pF1KB5 VKVGKEDSSSTEFVEKRRAALERYLQRTVKHPTLLQDPDLRQFLESSELPRAVNTQALSG ::::::::::.::.::::::::::::: :.:::.:::::.:.:::. ::::::.::.::: CCDS58 VKVGKEDSSSAEFLEKRRAALERYLQRIVNHPTMLQDPDVREFLEKEELPRAVGTQTLSG 230 240 250 260 270 280 280 290 300 310 320 330 pF1KB5 AGILRMVNKAADAVNKMTIKMNESDAWFEEKQQQFENLDQQLRKLHVSVEALVCHRKELS ::.:.: :::.:::.:::::::::: ::::: :. : .:.:::::. ::.:: :::::. CCDS58 AGLLKMFNKATDAVSKMTIKMNESDIWFEEKLQEVECEEQRLRKLHAVVETLVNHRKELA 290 300 310 320 330 340 340 350 360 370 380 390 pF1KB5 ANTAAFAKSAAMLGNSEDHTALSRALSQLAEVEEKIDQLHQEQAFADFYMFSELLSDYIR ::: :::: ::::.:::.:::::::::::::::::.::::::: ::....:::::::: CCDS58 LNTAQFAKSLAMLGSSEDNTALSRALSQLAEVEEKIEQLHQEQANNDFFLLAELLSDYIR 350 360 370 380 390 400 400 410 420 430 440 450 pF1KB5 LIAAVKGVFDHRMKCWQKWEDAQITLLKKREAEAKMMVANKPDKIQQAKNEIREWEAKVQ :.: :...::.::: ::.:.::: :: :::::::... ::::::.::::.:: :::..: CCDS58 LLAIVRAAFDQRMKTWQRWQDAQATLQKKREAEARLLWANKPDKLQQAKDEILEWESRVT 410 420 430 440 450 460 460 470 480 490 500 510 pF1KB5 QGERDFEQISKTIRKEVGRFEKERVKDFKTVIIKYLESLVQTQQQLIKYWEAFLPEAKAI : :::::.:: ..:::: :::::. ::::. .:::::.:. .::: CCDS58 QYERDFERISTVVRKEVIRFEKEKSKDFKNHVIKYLETLLYSQQQAGEQLGIRSGILLTK 470 480 490 500 510 520 pF1KB5 A CCDS58 KLPRYSKFFSTVHKFCAAASLWKWGFFLSAYLSYLF 530 540 550 >>CCDS32268.1 SNX1 gene_id:6642|Hs108|chr15 (457 aa) initn: 1844 init1: 1766 opt: 1766 Z-score: 1483.6 bits: 284.0 E(32554): 2.6e-76 Smith-Waterman score: 1773; 60.2% identity (79.5% similar) in 487 aa overlap (33-519:9-457) 10 20 30 40 50 60 pF1KB5 AEREPPPLGDGKPTDFEDLEDGEDLFTSTVSTLESSPSSPEPASLPAEDISANSNGPKPT :. : : : :. : . .:... :. CCDS32 MASGGGGCSASERLPP-PFPGLEPESEGAAGGSEPEAG 10 20 30 70 80 90 100 110 120 pF1KB5 EVVLDDDREDLFAEATEEVSLDSPEREPILSSEPSPAVTPVTPTTLIAPRIESKSMSAPV . : . ::.:. :. ..:.. :: .: :.:. : :.. : . CCDS32 DS--DTEGEDIFTGAA------------VVSKHQSPKIT----TSLL-P-INNGSKENGI 40 50 60 70 130 140 150 160 170 180 pF1KB5 IFDRSREEIEEEANGDIFDIEIGVSDPEKVGDGMNAYMAYRVTTKTSLSMFSKSEFSVKR .:: ..: . :.: .:::::::.::.:::.::: .: ...:.::: CCDS32 -----HEEQDQEPQ-DLF-----------AGDGMNAYVAYKVTTQTSLPLFRSKQFAVKR 80 90 100 110 120 190 200 210 220 230 240 pF1KB5 RFSDFLGLHSKLASKYLHVGYIVPPAPEKSIVGMTKVKVGKEDSSSTEFVEKRRAALERY ::::::::. ::. :. . :.:::: ::::..::::::::::::::.::.:::::::::: CCDS32 RFSDFLGLYEKLSEKHSQNGFIVPPPPEKSLIGMTKVKVGKEDSSSAEFLEKRRAALERY 130 140 150 160 170 180 250 260 270 280 290 300 pF1KB5 LQRTVKHPTLLQDPDLRQFLESSELPRAVNTQALSGAGILRMVNKAADAVNKMTIKMNES ::: :.:::.:::::.:.:::. ::::::.::.:::::.:.: :::.:::.::::::::: CCDS32 LQRIVNHPTMLQDPDVREFLEKEELPRAVGTQTLSGAGLLKMFNKATDAVSKMTIKMNES 190 200 210 220 230 240 310 320 330 340 350 360 pF1KB5 DAWFEEKQQQFENLDQQLRKLHVSVEALVCHRKELSANTAAFAKSAAMLGNSEDHTALSR : ::::: :. : .:.:::::. ::.:: :::::. ::: :::: ::::.:::.::::: CCDS32 DIWFEEKLQEVECEEQRLRKLHAVVETLVNHRKELALNTAQFAKSLAMLGSSEDNTALSR 250 260 270 280 290 300 370 380 390 400 410 420 pF1KB5 ALSQLAEVEEKIDQLHQEQAFADFYMFSELLSDYIRLIAAVKGVFDHRMKCWQKWEDAQI ::::::::::::.::::::: ::....:::::::::.: :...::.::: ::.:.::: CCDS32 ALSQLAEVEEKIEQLHQEQANNDFFLLAELLSDYIRLLAIVRAAFDQRMKTWQRWQDAQA 310 320 330 340 350 360 430 440 450 460 470 480 pF1KB5 TLLKKREAEAKMMVANKPDKIQQAKNEIREWEAKVQQGERDFEQISKTIRKEVGRFEKER :: :::::::... ::::::.::::.:: :::..: : :::::.:: ..:::: :::::. CCDS32 TLQKKREAEARLLWANKPDKLQQAKDEILEWESRVTQYERDFERISTVVRKEVIRFEKEK 370 380 390 400 410 420 490 500 510 pF1KB5 VKDFKTVIIKYLESLVQTQQQLIKYWEAFLPEAKAIA ::::. .:::::.:. .:::: :::::::::::::. CCDS32 SKDFKNHVIKYLETLLYSQQQLAKYWEAFLPEAKAIS 430 440 450 519 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 21:41:56 2016 done: Fri Nov 4 21:41:57 2016 Total Scan time: 3.670 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]