FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5309, 423 aa 1>>>pF1KB5309 423 - 423 aa - 423 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4663+/-0.000775; mu= 16.3280+/- 0.047 mean_var=66.2267+/-13.197, 0's: 0 Z-trim(108.4): 13 B-trim: 0 in 0/49 Lambda= 0.157601 statistics sampled from 10185 (10193) to 10185 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.687), E-opt: 0.2 (0.313), width: 16 Scan time: 3.070 The best scores are: opt bits E(32554) CCDS13879.1 GAL3ST1 gene_id:9514|Hs108|chr22 ( 423) 2908 669.9 1.3e-192 CCDS33427.1 GAL3ST2 gene_id:64090|Hs108|chr2 ( 398) 824 196.1 5.2e-50 CCDS8128.1 GAL3ST3 gene_id:89792|Hs108|chr11 ( 431) 759 181.3 1.6e-45 CCDS5688.1 GAL3ST4 gene_id:79690|Hs108|chr7 ( 486) 295 75.8 1e-13 >>CCDS13879.1 GAL3ST1 gene_id:9514|Hs108|chr22 (423 aa) initn: 2908 init1: 2908 opt: 2908 Z-score: 3571.7 bits: 669.9 E(32554): 1.3e-192 Smith-Waterman score: 2908; 99.8% identity (100.0% similar) in 423 aa overlap (1-423:1-423) 10 20 30 40 50 60 pF1KB5 MLPPQKKPWESMAKGLVLGALFTSFLLLMYSYAVPPLHAGLASTTPEAAASCSPPALEPE ::::::::::::::::::::::::::::.::::::::::::::::::::::::::::::: CCDS13 MLPPQKKPWESMAKGLVLGALFTSFLLLVYSYAVPPLHAGLASTTPEAAASCSPPALEPE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 AVIRANGSAGECQPRRNIVFLKTHKTASSTLLNILFRFGQKHRLKFAFPNGRNDFDYPTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 AVIRANGSAGECQPRRNIVFLKTHKTASSTLLNILFRFGQKHRLKFAFPNGRNDFDYPTF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 FARSLVQDYRPGACFNIICNHMRFHYDEVRGLVPTNAIFITVLRDPARLFESSFHYFGPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 FARSLVQDYRPGACFNIICNHMRFHYDEVRGLVPTNAIFITVLRDPARLFESSFHYFGPV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 VPLTWKLSAGDKLTEFLQDPDRYYDPNGFNAHYLRNLLFFDLGYDNSLDPSSPQVQEHIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 VPLTWKLSAGDKLTEFLQDPDRYYDPNGFNAHYLRNLLFFDLGYDNSLDPSSPQVQEHIL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 EVERRFHLVLLQEYFDESLVLLKDLLCWELEDVLYFKLNARRDSPVPRLSGELYGRATAW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 EVERRFHLVLLQEYFDESLVLLKDLLCWELEDVLYFKLNARRDSPVPRLSGELYGRATAW 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 NMLDSHLYRHFNASFWRKVEAFGRERMAREVAALRHANERMRTICIDGGHAVDAAAIQDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 NMLDSHLYRHFNASFWRKVEAFGRERMAREVAALRHANERMRTICIDGGHAVDAAAIQDE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 AMQPWQPLGTKSILGYNLKKSIGQRHAQLCRRMLTPEIQYLMDLGANLWVTKLWKFIRDF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 AMQPWQPLGTKSILGYNLKKSIGQRHAQLCRRMLTPEIQYLMDLGANLWVTKLWKFIRDF 370 380 390 400 410 420 pF1KB5 LRW ::: CCDS13 LRW >>CCDS33427.1 GAL3ST2 gene_id:64090|Hs108|chr2 (398 aa) initn: 736 init1: 323 opt: 824 Z-score: 1011.3 bits: 196.1 E(32554): 5.2e-50 Smith-Waterman score: 824; 39.8% identity (66.6% similar) in 344 aa overlap (67-406:43-382) 40 50 60 70 80 90 pF1KB5 LHAGLASTTPEAAASCSPPALEPEAVIRANGSAGECQPRRNIVFLKTHKTASSTLLNILF :. .: : ::.:::::::::::.::::. CCDS33 RVILLLLLALTLLLLAGFLHSDLELDTPLFGGQAEGPPVTNIMFLKTHKTASSTVLNILY 20 30 40 50 60 70 100 110 120 130 140 150 pF1KB5 RFGQKHRLKFAFPNG-RNDFDYPTFFARSLVQDYRPGACFNIICNHMRFHYDEVRGLVPT ::.. : :. :.: : : . :: .: :. :::.:::.::. .:. ..:. CCDS33 RFAETHNLSVALPAGSRVHLGYPWLFLARYVEGVGSQQRFNIMCNHLRFNLPQVQKVMPN 80 90 100 110 120 130 160 170 180 190 200 210 pF1KB5 NAIFITVLRDPARLFESSFHYFGPVVPLTWKLSAGDKLTEFLQDPDRYY-DPNGFNAHYL .......::.:. .:::: :. .: . .. .: :: .: .: : . : CCDS33 DTFYFSILRNPVFQLESSFIYYKTYAP---AFRGAPSLDAFLASPRTFYNDSRHLRNVYA 140 150 160 170 180 220 230 240 250 260 270 pF1KB5 RNLLFFDLGYDNSLDPSSPQVQEHILEVERRFHLVLLQEYFDESLVLLKDLLCWELEDVL .: ..::.:.: . . :. .: ::::::.:::. :..:::::::. : : :.::. CCDS33 KNNMWFDFGFDPNAQCEEGYVRARIAEVERRFRLVLIAEHLDESLVLLRRRLRWALDDVV 190 200 210 220 230 240 280 290 300 310 320 330 pF1KB5 YFKLNARRDSPVPRLSGELYGRATAWNMLDSHLYRHFNASFWRKVEA-FGRERMAREVAA :.::.: : ::: : :: .: :: .::.::: ..: ...: .: .:. :: CCDS33 AFRLNSRSARSVARLSPETRERARSWCALDWRLYEHFNRTLWAQLRAELGPRRLRGEVER 250 260 270 280 290 300 340 350 360 370 380 390 pF1KB5 LRHANERMRTICI-DGGHAVDAAAIQDEAMQPWQPLGTKSILGYNLKKSIGQRHAQLCRR :: ... ..:. ::: . . :.: ..:.: : .::::::. .. .. .:.: CCDS33 LRARRRELASLCLQDGGALKNHTQIRDPRLRPYQS-GKADILGYNLRPGLDNQTLGVCQR 310 320 330 340 350 360 400 410 420 pF1KB5 MLTPEIQYLMDLGANLWVTKLWKFIRDFLRW .. ::.::. : : CCDS33 LVMPELQYMARLYALQFPEKPLKNIPFLGA 370 380 390 >>CCDS8128.1 GAL3ST3 gene_id:89792|Hs108|chr11 (431 aa) initn: 734 init1: 238 opt: 759 Z-score: 930.9 bits: 181.3 E(32554): 1.6e-45 Smith-Waterman score: 762; 39.1% identity (62.9% similar) in 345 aa overlap (72-400:51-391) 50 60 70 80 90 pF1KB5 ASTTPEAAASCSPPALEPEAVIRANGSAGECQPRRN---------IVFLKTHKTASSTLL : : :: ..::::::::..:. CCDS81 LLLVLGCSTVSLLIHQGAQLSWYPKLFPLSCPPLRNSPPRPKHMTVAFLKTHKTAGTTVQ 30 40 50 60 70 80 100 110 120 130 140 pF1KB5 NILFRFGQKHRLKFAFPNG--RNDFDYPTFFARSLVQDY-RPGACFNIICNHMRFHYDEV ::::::...: : :.:. ...: :: :. .:. :: ... .:.:: :. CCDS81 NILFRFAERHNLTVALPHPSCEHQFCYPRNFSAHFVHPATRPP---HVLASHLRFDRAEL 90 100 110 120 130 150 160 170 180 190 200 pF1KB5 RGLVPTNAIFITVLRDPARLFESSFHYFGPVVPLTWKLSAGDKLTEFLQDPDRYYDPNGF . :.: .....:.::.:: .::: : :.. : ... . .: ::. :. :: . CCDS81 ERLMPPSTVYVTILREPAAMFESLFSYYNQYCP-AFRRVPNASLEAFLRAPEAYYRAGEH 140 150 160 170 180 190 210 220 230 240 250 260 pF1KB5 NAHYLRNLLFFDLGYDNSLDP--SSPQVQEHILEVERRFHLVLLQEYFDESLVLLKDLLC : . .: : .::: :: .: .. . : .::. : ::.. ::::::::::. :: CCDS81 FAMFAHNTLAYDLGGDNERSPRDDAAYLAGLIRQVEEVFSLVMIAEYFDESLVLLRRLLA 200 210 220 230 240 250 270 280 290 300 310 320 pF1KB5 WELEDVLYFKLNARRDSP-VPRLSGELYGRATAWNMLDSHLYRHFNASFWRKVEAFGRER :.:.:::: ::::: : . . . : : .:: ::. :: ::::.:::.: :: CCDS81 WDLDDVLYAKLNARAASSRLAAIPAALARAARTWNALDAGLYDHFNATFWRHVARAGRAC 260 270 280 290 300 310 330 340 350 360 370 380 pF1KB5 MAREVAALRHANERMRTICI-DGGHAVDAAAIQDEAMQPWQPLGTKSILGYNLKKSIGQR . ::. ::.: .:. :. : :: :. . .::::: .:.::.: . . CCDS81 VEREARELREARQRLLRRCFGDEPLLRPAAQIRTKQLQPWQPSRKVDIMGYDLPGGGAGP 320 330 340 350 360 370 390 400 410 420 pF1KB5 HAQLCRRMLTPEIQYLMDLGANLWVTKLWKFIRDFLRW .. : .. ::.:: CCDS81 ATEACLKLAMPEVQYSNYLLRKQKRRGGARARPEPVLDNPPPRPIRVLPRGPQGP 380 390 400 410 420 430 >>CCDS5688.1 GAL3ST4 gene_id:79690|Hs108|chr7 (486 aa) initn: 817 init1: 203 opt: 295 Z-score: 359.9 bits: 75.8 E(32554): 1e-13 Smith-Waterman score: 735; 34.6% identity (56.8% similar) in 410 aa overlap (72-406:63-467) 50 60 70 80 90 100 pF1KB5 ASTTPEAAASCSPPALEPEAVIRANGSAGECQPRRNIVFLKTHKTASSTLLNILFRFGQK : ::. .:::::::..::..:..: :.:.. CCDS56 QLLGGPFQRRLPGLQLRQPSAPSLRPALPSCPPRQRLVFLKTHKSGSSSVLSLLHRYGDQ 40 50 60 70 80 90 110 120 130 140 150 pF1KB5 HRLKFAFPNGRNDFDYPTFFARSLVQDYRP--GAC---FNIICNHMRFHYDEVRGLVPTN : :.::.: .: .: :: .: : :. ::: :. :.:.:.::::. :: ..:.. CCDS56 HGLRFALP-ARYQFGYPKLFQASRVKGYRPQGGGTQLPFHILCHHMRFNLKEVLQVMPSD 100 110 120 130 140 150 160 170 180 190 200 210 pF1KB5 AIFITVLRDPARLFESSFHYFGPVVPLTWKLSAGDKLTEFLQDPDRYYDPNGFNAHYLRN ..:....:::: : .:.: :. . . . . .:. :: .: .: :.. . :: :: CCDS56 SFFFSIVRDPAALARSAFSYYKST---SSAFRKSPSLAAFLANPRGFYRPGARGDHYARN 160 170 180 190 200 220 230 pF1KB5 LLFFDLGYD-------------NSLDPSSPQVQ--------------------------E ::.::.: ::. ::.: . CCDS56 LLWFDFGLPFPPEKRAKRGNIHPPRDPNPPQLQVLPSGAGPRAQTLNPNALIHPVSTVTD 210 220 230 240 250 260 240 250 260 270 pF1KB5 HILEV---------------------ERRFHLVLLQEYFDESLVLLKDLLCWELEDVLYF : .. . : ::.. :::::::::: : ::: :.::. : CCDS56 HRSQISSPASFDLGSSSFIQWGLAWLDSVFDLVMVAEYFDESLVLLADALCWGLDDVVGF 270 280 290 300 310 320 280 290 300 310 320 pF1KB5 KLNAR----------RDSPVPRLSGELYGRATAWNMLDSHLYRHFNASFWRKVEAFGRER ::. .: . . .: .:: ::: :: :: ::: :.: ..: .:. : CCDS56 MHNAQAGHKQGLSTVSNSGLTAEDRQLTARARAWNNLDWALYVHFNRSLWARIEKYGQGR 330 340 350 360 370 380 330 340 350 360 370 380 pF1KB5 MAREVAALRHANERMRTICIDGGHAVDAAAIQDEAMQPWQPLGTKSILGYNLKKSIGQRH . :: :: : . :. ::.: : : :. ..:.: .:. ..::: :..... . CCDS56 LQTAVAELRARREALAKHCLVGGEASDPKYITDRRFRPFQ-FGSAKVLGYILRSGLSPQD 390 400 410 420 430 440 390 400 410 420 pF1KB5 AQLCRRMLTPEIQYLMDLGANLWVTKLWKFIRDFLRW . :.:. :::.:: : : CCDS56 QEECERLATPELQYKDKLDAKQFPPTVSLPLKTSRPLSP 450 460 470 480 423 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 03:32:55 2016 done: Fri Nov 4 03:32:56 2016 Total Scan time: 3.070 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]