FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6151, 596 aa 1>>>pF1KB6151 596 - 596 aa - 596 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8452+/-0.00105; mu= 15.6100+/- 0.063 mean_var=60.4364+/-12.236, 0's: 0 Z-trim(102.9): 22 B-trim: 243 in 1/49 Lambda= 0.164978 statistics sampled from 7148 (7163) to 7148 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.581), E-opt: 0.2 (0.22), width: 16 Scan time: 2.100 The best scores are: opt bits E(32554) CCDS9231.1 VPS33A gene_id:65082|Hs108|chr12 ( 596) 3897 936.4 0 CCDS10369.1 VPS33B gene_id:26276|Hs108|chr15 ( 617) 525 133.8 6.3e-31 CCDS73783.1 VPS33B gene_id:26276|Hs108|chr15 ( 590) 464 119.3 1.4e-26 >>CCDS9231.1 VPS33A gene_id:65082|Hs108|chr12 (596 aa) initn: 3897 init1: 3897 opt: 3897 Z-score: 5006.5 bits: 936.4 E(32554): 0 Smith-Waterman score: 3897; 100.0% identity (100.0% similar) in 596 aa overlap (1-596:1-596) 10 20 30 40 50 60 pF1KB6 MAAHLSYGRVNLNVLREAVRRELREFLDKCAGSKAIVWDEYLTGPFGLIAQYSLLKEHEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 MAAHLSYGRVNLNVLREAVRRELREFLDKCAGSKAIVWDEYLTGPFGLIAQYSLLKEHEV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 EKMFTLKGNRLPAADVKNIIFFVRPRLELMDIIAENVLSEDRRGPTRDFHILFVPRRSLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 EKMFTLKGNRLPAADVKNIIFFVRPRLELMDIIAENVLSEDRRGPTRDFHILFVPRRSLL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 CEQRLKDLGVLGSFIHREEYSLDLIPFDGDLLSMESEGAFKECYLEGDQTSLYHAAKGLM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 CEQRLKDLGVLGSFIHREEYSLDLIPFDGDLLSMESEGAFKECYLEGDQTSLYHAAKGLM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 TLQALYGTIPQIFGKGECARQVANMMIRMKREFTGSQNSIFPVFDNLLLLDRNVDLLTPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 TLQALYGTIPQIFGKGECARQVANMMIRMKREFTGSQNSIFPVFDNLLLLDRNVDLLTPL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 ATQLTYEGLIDEIYGIQNSYVKLPPEKFAPKKQGDGGKDLPTEAKKLQLNSAEELYAEIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 ATQLTYEGLIDEIYGIQNSYVKLPPEKFAPKKQGDGGKDLPTEAKKLQLNSAEELYAEIR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 DKNFNAVGSVLSKKAKIISAAFEERHNAKTVGEIKQFVSQLPHMQAARGSLANHTSIAEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 DKNFNAVGSVLSKKAKIISAAFEERHNAKTVGEIKQFVSQLPHMQAARGSLANHTSIAEL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB6 IKDVTTSEDFFDKLTVEQEFMSGIDTDKVNNYIEDCIAQKHSLIKVLRLVCLQSVCNSGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 IKDVTTSEDFFDKLTVEQEFMSGIDTDKVNNYIEDCIAQKHSLIKVLRLVCLQSVCNSGL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB6 KQKVLDYYKREILQTYGYEHILTLHNLEKAGLLKPQTGGRNNYPTIRKTLRLWMDDVNEQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 KQKVLDYYKREILQTYGYEHILTLHNLEKAGLLKPQTGGRNNYPTIRKTLRLWMDDVNEQ 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB6 NPTDISYVYSGYAPLSVRLAQLLSRPGWRSIEEVLRILPGPHFEERQPLPTGLQKKRQPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 NPTDISYVYSGYAPLSVRLAQLLSRPGWRSIEEVLRILPGPHFEERQPLPTGLQKKRQPG 490 500 510 520 530 540 550 560 570 580 590 pF1KB6 ENRVTLIFFLGGVTFAEIAALRFLSQLEDGGTEYVIATTKLMNGTSWIEALMEKPF :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 ENRVTLIFFLGGVTFAEIAALRFLSQLEDGGTEYVIATTKLMNGTSWIEALMEKPF 550 560 570 580 590 >>CCDS10369.1 VPS33B gene_id:26276|Hs108|chr15 (617 aa) initn: 825 init1: 315 opt: 525 Z-score: 668.7 bits: 133.8 E(32554): 6.3e-31 Smith-Waterman score: 990; 31.6% identity (63.0% similar) in 621 aa overlap (11-593:14-614) 10 20 30 40 50 pF1KB6 MAAHLSYGRVNLNVLREAVRRELREFLDKCAGSKAIVWDEYLTGPFGLIAQYSLLKE ....:.. .: .: .:.. :.: . . : .:. ::. :.::. CCDS10 MAFPHRPDAPELPDFSMLKRLARDQLIYLLEQLPGKKDLFIEADLMSPLDRIANVSILKQ 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB6 HEVEKMFTLKGNRLPAADVKNIIFFVRPRLELMDIIAENVLSEDRRGPTRDFHILFVPRR :::.:.. .. :. .. ... :.::::.. : :: : .. : :: ....: :.. CCDS10 HEVDKLYKVE-NKPALSSNEQLCFLVRPRIKNMRYIASLVNADKLAGRTRKYKVIFSPQK 70 80 90 100 110 120 130 140 150 160 170 pF1KB6 SLLCEQRLKDLGVLGSFIHREEYSLDLIPFDGDLLSMESEGAFKECYLEGDQTSLYHAAK ::. :.. :. :. . .:....:.:.: :::::: :.. .::::: . .:. CCDS10 FYACEMVLEEEGIYGD-VSCDEWAFSLLPLDVDLLSMELPEFFRDYFLEGDQRWINTVAQ 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB6 GLMTLQALYGTIPQIFGKGECARQVANMMIRMKREFTGSQNSIFPVFDNLLLLDRNVDLL .: :..::: .:. .: :.::... .. ...: : .. : . ...::::.::.. CCDS10 ALHLLSTLYGPFPNCYGIGRCAKMAYELWRNLEEEEDGETKGRRPEIGHIFLLDRDVDFV 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB6 TPLATQLTYEGLIDEIYGIQNSYVKLPPEKFAPKKQGDGGKDLPTEAKKLQLNSAEELYA : : .:..::::.:. . :. . : . :: . : . :. ::. .... CCDS10 TALCSQVVYEGLVDDTFRIKCGSVDFGPEVTSSDK-----------SLKVLLNAEDKVFN 240 250 260 270 280 300 310 320 330 340 350 pF1KB6 EIRDKNFNAVGSVLSKKAKIISAAFEERHNAKTVGEIKQFVSQ-LPHMQAARGSLANHTS :::...:. : . ::.::. ..: ...:.. . ..:.:::: : .. . :. : . CCDS10 EIRNEHFSNVFGFLSQKARNLQAQYDRRRGMD-IKQMKNFVSQELKGLKQEHRLLSLHIG 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB6 IAELIKDVTTSEDFFDKLTVEQEFMSGIDTDKVNNYIEDCIAQKHSLIKVLRLVCLQSVC : : :..:: . . .:. .. :.. . ..:::. : .. : :. :::.:: :. CCDS10 ACESIMKKKTKQDFQELIKTEHALLEGFNIRESTSYIEEHIDRQVSPIESLRLMCLLSIT 350 360 370 380 390 400 420 430 440 450 pF1KB6 NSGLKQKVLDYYKREILQTYGYEHILTLHNLEKAGLLKPQTGG----------------- ..:: : : . ::.:: ::.::. ::..:::: :. : CCDS10 ENGLIPKDYRSLKTQYLQSYGPEHLLTFSNLRRAGLLTEQAPGDTLTAVESKVSKLVTDK 410 420 430 440 450 460 460 470 480 490 500 pF1KB6 --------------RNNYPTIRKTLRLW--MD-DVNEQNPTDISYVYSG-YAPLSVRLA- :.:. .: : : : .: . . . : :..::..: :.::: :. CCDS10 AAGKITDAFSSLAKRSNFRAISKKLNLIPRVDGEYDLKVPRDMAYVFGGAYVPLSCRIIE 470 480 490 500 510 520 510 520 530 540 550 pF1KB6 QLLSRPGWRSIEEVLRILPGPHFEERQPLPTGLQKKRQPGEN-RVTLIFFLGGVTFAEIA :.: : .:....::.:.: : . .. . .:. :. :. :::: ::.::. CCDS10 QVLERRSWQGLDEVVRLLNCSDFA----FTDMTKEDKASSESLRLILVVFLGGCTFSEIS 530 540 550 560 570 580 560 570 580 590 pF1KB6 ALRFLSQLEDGGTEYVIATTKLMNGTSWIEALMEKPF :::::.. . : .... :: . :.. .::. : CCDS10 ALRFLGR--EKGYRFIFLTTAVTNSARLMEAMSEVKA 590 600 610 >>CCDS73783.1 VPS33B gene_id:26276|Hs108|chr15 (590 aa) initn: 773 init1: 315 opt: 464 Z-score: 590.6 bits: 119.3 E(32554): 1.4e-26 Smith-Waterman score: 929; 31.9% identity (62.6% similar) in 580 aa overlap (52-593:28-587) 30 40 50 60 70 80 pF1KB6 ELREFLDKCAGSKAIVWDEYLTGPFGLIAQYSLLKEHEVEKMFTLKGNRLPAADVKNIIF : : ..:::.:.. .. :. .. ... : CCDS73 MAFPHRPDAPELPDFSMLKRLARDQLIYLLEQQHEVDKLYKVE-NKPALSSNEQLCF 10 20 30 40 50 90 100 110 120 130 140 pF1KB6 FVRPRLELMDIIAENVLSEDRRGPTRDFHILFVPRRSLLCEQRLKDLGVLGSFIHREEYS .::::.. : :: : .. : :: ....: :.. ::. :.. :. :. . .:.. CCDS73 LVRPRIKNMRYIASLVNADKLAGRTRKYKVIFSPQKFYACEMVLEEEGIYGD-VSCDEWA 60 70 80 90 100 110 150 160 170 180 190 200 pF1KB6 LDLIPFDGDLLSMESEGAFKECYLEGDQTSLYHAAKGLMTLQALYGTIPQIFGKGECARQ ..:.:.: :::::: :.. .::::: . .:..: :..::: .:. .: :.::.. CCDS73 FSLLPLDVDLLSMELPEFFRDYFLEGDQRWINTVAQALHLLSTLYGPFPNCYGIGRCAKM 120 130 140 150 160 170 210 220 230 240 250 260 pF1KB6 VANMMIRMKREFTGSQNSIFPVFDNLLLLDRNVDLLTPLATQLTYEGLIDEIYGIQNSYV . .. ...: : .. : . ...::::.::..: : .:..::::.:. . :. . : CCDS73 AYELWRNLEEEEDGETKGRRPEIGHIFLLDRDVDFVTALCSQVVYEGLVDDTFRIKCGSV 180 190 200 210 220 230 270 280 290 300 310 320 pF1KB6 KLPPEKFAPKKQGDGGKDLPTEAKKLQLNSAEELYAEIRDKNFNAVGSVLSKKAKIISAA . :: . : . :. ::. .... :::...:. : . ::.::. ..: CCDS73 DFGPEVTSSDK-----------SLKVLLNAEDKVFNEIRNEHFSNVFGFLSQKARNLQAQ 240 250 260 270 280 330 340 350 360 370 380 pF1KB6 FEERHNAKTVGEIKQFVSQ-LPHMQAARGSLANHTSIAELIKDVTTSEDFFDKLTVEQEF ...:.. . ..:.:::: : .. . :. : . : : :..:: . . .:. . CCDS73 YDRRRGMD-IKQMKNFVSQELKGLKQEHRLLSLHIGACESIMKKKTKQDFQELIKTEHAL 290 300 310 320 330 340 390 400 410 420 430 440 pF1KB6 MSGIDTDKVNNYIEDCIAQKHSLIKVLRLVCLQSVCNSGLKQKVLDYYKREILQTYGYEH . :.. . ..:::. : .. : :. :::.:: :. ..:: : : . ::.:: :: CCDS73 LEGFNIRESTSYIEEHIDRQVSPIESLRLMCLLSITENGLIPKDYRSLKTQYLQSYGPEH 350 360 370 380 390 400 450 460 pF1KB6 ILTLHNLEKAGLLKPQTGG-------------------------------RNNYPTIRKT .::. ::..:::: :. : :.:. .: : CCDS73 LLTFSNLRRAGLLTEQAPGDTLTAVESKVSKLVTDKAAGKITDAFSSLAKRSNFRAISKK 410 420 430 440 450 460 470 480 490 500 510 520 pF1KB6 LRLW--MD-DVNEQNPTDISYVYSG-YAPLSVRLA-QLLSRPGWRSIEEVLRILPGPHFE : : .: . . . : :..::..: :.::: :. :.: : .:....::.:.: : CCDS73 LNLIPRVDGEYDLKVPRDMAYVFGGAYVPLSCRIIEQVLERRSWQGLDEVVRLLNCSDFA 470 480 490 500 510 520 530 540 550 560 570 580 pF1KB6 ERQPLPTGLQKKRQPGEN-RVTLIFFLGGVTFAEIAALRFLSQLEDGGTEYVIATTKLMN . .. . .:. :. :. :::: ::.::.:::::.. . : .... :: . : CCDS73 ----FTDMTKEDKASSESLRLILVVFLGGCTFSEISALRFLGR--EKGYRFIFLTTAVTN 530 540 550 560 570 590 pF1KB6 GTSWIEALMEKPF .. .::. : CCDS73 SARLMEAMSEVKA 580 590 596 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 13:37:03 2016 done: Sat Nov 5 13:37:04 2016 Total Scan time: 2.100 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]