FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1848, 404 aa 1>>>pF1KSDA1848 404 - 404 aa - 404 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.6554+/-0.000902; mu= 6.8044+/- 0.054 mean_var=127.5453+/-26.052, 0's: 0 Z-trim(110.2): 50 B-trim: 392 in 1/50 Lambda= 0.113564 statistics sampled from 11382 (11431) to 11382 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.706), E-opt: 0.2 (0.351), width: 16 Scan time: 2.910 The best scores are: opt bits E(32554) CCDS69680.1 SH3GLB2 gene_id:56904|Hs108|chr9 ( 404) 2611 438.8 4.3e-123 CCDS6916.1 SH3GLB2 gene_id:56904|Hs108|chr9 ( 395) 1812 307.9 1.1e-83 CCDS72819.1 SH3GLB1 gene_id:51100|Hs108|chr1 ( 394) 1228 212.2 6.8e-55 CCDS55612.1 SH3GLB1 gene_id:51100|Hs108|chr1 ( 386) 900 158.5 1e-38 CCDS710.1 SH3GLB1 gene_id:51100|Hs108|chr1 ( 365) 897 158.0 1.3e-38 CCDS55613.1 SH3GLB1 gene_id:51100|Hs108|chr1 ( 265) 387 74.3 1.5e-13 >>CCDS69680.1 SH3GLB2 gene_id:56904|Hs108|chr9 (404 aa) initn: 2611 init1: 2611 opt: 2611 Z-score: 2323.4 bits: 438.8 E(32554): 4.3e-123 Smith-Waterman score: 2611; 100.0% identity (100.0% similar) in 404 aa overlap (1-404:1-404) 10 20 30 40 50 60 pF1KSD MDFNMKKLASDAGIFFTRAVQFTEEKFGQAEKTELDAHFENLLARADSTKNWTEKILRQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 MDFNMKKLASDAGIFFTRAVQFTEEKFGQAEKTELDAHFENLLARADSTKNWTEKILRQT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD EVLLQPNPSARVEEFLYEKLDRKVPSRVTNGELLAQYMADAASELGPTTPYGKTLIKVAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 EVLLQPNPSARVEEFLYEKLDRKVPSRVTNGELLAQYMADAASELGPTTPYGKTLIKVAE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD AEKQLGAAERDFIHTASISFLTPLRNFLEGDWKTISKERRLLQNRRLDLDACKARLKKAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 AEKQLGAAERDFIHTASISFLTPLRNFLEGDWKTISKERRLLQNRRLDLDACKARLKKAK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD AAEAKATCEGDTVPDFQETRPRNYILSASASALWNDEVDKAEQELRVAQTEFDRQAEVTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 AAEAKATCEGDTVPDFQETRPRNYILSASASALWNDEVDKAEQELRVAQTEFDRQAEVTR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD LLLEGISSTHVNHLRCLHEFVKSQTTYYAQCYRHMLDLQKQLGSSQGAIFPGTFVGTTEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 LLLEGISSTHVNHLRCLHEFVKSQTTYYAQCYRHMLDLQKQLGSSQGAIFPGTFVGTTEP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD ASPPLSSTSPTTAAATMPVVPSVASLAPPGEASLCLEEVAPPASGTRKARVLYDYEAADS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 ASPPLSSTSPTTAAATMPVVPSVASLAPPGEASLCLEEVAPPASGTRKARVLYDYEAADS 310 320 330 340 350 360 370 380 390 400 pF1KSD SELALLADELITVYSLPGMDPDWLIGERGNKKGKVPVTYLELLS :::::::::::::::::::::::::::::::::::::::::::: CCDS69 SELALLADELITVYSLPGMDPDWLIGERGNKKGKVPVTYLELLS 370 380 390 400 >>CCDS6916.1 SH3GLB2 gene_id:56904|Hs108|chr9 (395 aa) initn: 1922 init1: 1191 opt: 1812 Z-score: 1616.1 bits: 307.9 E(32554): 1.1e-83 Smith-Waterman score: 2502; 97.5% identity (97.5% similar) in 404 aa overlap (1-404:1-395) 10 20 30 40 50 60 pF1KSD MDFNMKKLASDAGIFFTRAVQFTEEKFGQAEKTELDAHFENLLARADSTKNWTEKILRQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 MDFNMKKLASDAGIFFTRAVQFTEEKFGQAEKTELDAHFENLLARADSTKNWTEKILRQT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD EVLLQPNPSARVEEFLYEKLDRKVPSRVTNGELLAQYMADAASELGPTTPYGKTLIKVAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 EVLLQPNPSARVEEFLYEKLDRKVPSRVTNGELLAQYMADAASELGPTTPYGKTLIKVAE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD AEKQLGAAERDFIHTASISFLTPLRNFLEGDWKTISKERRLLQNRRLDLDACKARLKKAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 AEKQLGAAERDFIHTASISFLTPLRNFLEGDWKTISKERRLLQNRRLDLDACKARLKKAK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD AAEAKATCEGDTVPDFQETRPRNYILSASASALWNDEVDKAEQELRVAQTEFDRQAEVTR ::::::: ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 AAEAKAT----TVPDFQETRPRNYILSASASALWNDEVDKAEQELRVAQTEFDRQAEVTR 190 200 210 220 230 250 260 270 280 290 300 pF1KSD LLLEGISSTHVNHLRCLHEFVKSQTTYYAQCYRHMLDLQKQLGSSQGAIFPGTFVGTTEP ::::::::::::::::::::::::::::::::::::::::::: ::::::::::: CCDS69 LLLEGISSTHVNHLRCLHEFVKSQTTYYAQCYRHMLDLQKQLGR-----FPGTFVGTTEP 240 250 260 270 280 290 310 320 330 340 350 360 pF1KSD ASPPLSSTSPTTAAATMPVVPSVASLAPPGEASLCLEEVAPPASGTRKARVLYDYEAADS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 ASPPLSSTSPTTAAATMPVVPSVASLAPPGEASLCLEEVAPPASGTRKARVLYDYEAADS 300 310 320 330 340 350 370 380 390 400 pF1KSD SELALLADELITVYSLPGMDPDWLIGERGNKKGKVPVTYLELLS :::::::::::::::::::::::::::::::::::::::::::: CCDS69 SELALLADELITVYSLPGMDPDWLIGERGNKKGKVPVTYLELLS 360 370 380 390 >>CCDS72819.1 SH3GLB1 gene_id:51100|Hs108|chr1 (394 aa) initn: 1551 init1: 892 opt: 1228 Z-score: 1099.0 bits: 212.2 E(32554): 6.8e-55 Smith-Waterman score: 1539; 60.2% identity (84.2% similar) in 412 aa overlap (1-404:4-394) 10 20 30 40 50 pF1KSD MDFNMKKLASDAGIFFTRAVQFTEEKFGQAEKTELDAHFENLLARADSTKNWTEKIL ::::.::::.::: :..:::::::::.:::::::::::.::::..:. :: :::::. CCDS72 MNIMDFNVKKLAADAGTFLSRAVQFTEEKLGQAEKTELDAHLENLLSKAECTKIWTEKIM 10 20 30 40 50 60 60 70 80 90 100 110 pF1KSD RQTEVLLQPNPSARVEEFLYEKLDRKVPSRVTNGELLAQYMADAASELGPTTPYGKTLIK .::::::::::.::.:::.:::::::.:::..: :::.::: ::..:.:: : ::..::: CCDS72 KQTEVLLQPNPNARIEEFVYEKLDRKAPSRINNPELLGQYMIDAGTEFGPGTAYGNALIK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KSD VAEAEKQLGAAERDFIHTASISFLTPLRNFLEGDWKTISKERRLLQNRRLDLDACKARLK .:..:..:.:.:..:.:....::::::::.:::.:::.:::.::::.:::::: :.::: CCDS72 CGETQKRIGTADRELIQTSALNFLTPLRNFIEGDYKTIAKERKLLQNKRLDLDAAKTRLK 130 140 150 160 170 180 180 190 200 210 220 230 pF1KSD KAKAAEAK------ATCEGDTVP-DFQETRPRNYILSASASALWNDEVDKAEQELRVAQT ::::::.. : :::.. .: .:.:. . : :.:::::..:. CCDS72 KAKAAETRNSQLNSARLEGDNIMVNF------SYMLNF-LHVKWL----KSEQELRITQS 190 200 210 220 240 250 260 270 280 290 pF1KSD EFDRQAEVTRLLLEGISSTHVNHLRCLHEFVKSQTTYYAQCYRHMLDLQKQLGSSQGAIF :::::::.::::::::::::..:::::..::..: :::::::..:::::::::: : CCDS72 EFDRQAEITRLLLEGISSTHAHHLRCLNDFVEAQMTYYAQCYQYMLDLQKQLGS-----F 230 240 250 260 270 280 300 310 320 330 340 pF1KSD PGTFVGTTEPAS-PPLSSTSPTTAAATMPVVPSVASLAPPGEASLCLEEVAPPASGTRKA :........ .: :. :. :.. ... . : .. :.. : :.: ::.::: CCDS72 PSNYLSNNNQTSVTPVPSVLPNAIGSSAMASTSGLVITSPSNLSD-LKEC----SGSRKA 290 300 310 320 330 350 360 370 380 390 400 pF1KSD RVLYDYEAADSSELALLADELITVYSLPGMDPDWLIGERGNKKGKVPVTYLELLS ::::::.::.:.::.:::::.:::.:. ::: :::.:::::.:::::.::::::. CCDS72 RVLYDYDAANSTELSLLADEVITVFSVVGMDSDWLMGERGNQKGKVPITYLELLN 340 350 360 370 380 390 >>CCDS55612.1 SH3GLB1 gene_id:51100|Hs108|chr1 (386 aa) initn: 1579 init1: 892 opt: 900 Z-score: 808.7 bits: 158.5 E(32554): 1e-38 Smith-Waterman score: 1564; 60.7% identity (84.9% similar) in 405 aa overlap (1-404:4-386) 10 20 30 40 50 pF1KSD MDFNMKKLASDAGIFFTRAVQFTEEKFGQAEKTELDAHFENLLARADSTKNWTEKIL ::::.::::.::: :..:::::::::.:::::::::::.::::..:. :: :::::. CCDS55 MNIMDFNVKKLAADAGTFLSRAVQFTEEKLGQAEKTELDAHLENLLSKAECTKIWTEKIM 10 20 30 40 50 60 60 70 80 90 100 110 pF1KSD RQTEVLLQPNPSARVEEFLYEKLDRKVPSRVTNGELLAQYMADAASELGPTTPYGKTLIK .::::::::::.::.:::.:::::::.:::..: :::.::: ::..:.:: : ::..::: CCDS55 KQTEVLLQPNPNARIEEFVYEKLDRKAPSRINNPELLGQYMIDAGTEFGPGTAYGNALIK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KSD VAEAEKQLGAAERDFIHTASISFLTPLRNFLEGDWKTISKERRLLQNRRLDLDACKARLK .:..:..:.:.:..:.:....::::::::.:::.:::.:::.::::.:::::: :.::: CCDS55 CGETQKRIGTADRELIQTSALNFLTPLRNFIEGDYKTIAKERKLLQNKRLDLDAAKTRLK 130 140 150 160 170 180 180 190 200 210 220 230 pF1KSD KAKAAEAKATCEGDTVPDFQETRPRNYILSASASALWNDEVDKAEQELRVAQTEFDRQAE ::::::.. . : . : : .. .: .:: :.:::::..:.::::::: CCDS55 KAKAAETRNS---------QLNSAR---LEGDNIMIWAEEVTKSEQELRITQSEFDRQAE 190 200 210 220 240 250 260 270 280 290 pF1KSD VTRLLLEGISSTHVNHLRCLHEFVKSQTTYYAQCYRHMLDLQKQLGSSQGAIFPGTFVGT .::::::::::::..:::::..::..: :::::::..:::::::::: ::...... CCDS55 ITRLLLEGISSTHAHHLRCLNDFVEAQMTYYAQCYQYMLDLQKQLGS-----FPSNYLSN 230 240 250 260 270 280 300 310 320 330 340 350 pF1KSD TEPAS-PPLSSTSPTTAAATMPVVPSVASLAPPGEASLCLEEVAPPASGTRKARVLYDYE .. .: :. :. :.. ... . : .. :.. : :.: ::.:::::::::. CCDS55 NNQTSVTPVPSVLPNAIGSSAMASTSGLVITSPSNLSD-LKEC----SGSRKARVLYDYD 290 300 310 320 330 360 370 380 390 400 pF1KSD AADSSELALLADELITVYSLPGMDPDWLIGERGNKKGKVPVTYLELLS ::.:.::.:::::.:::.:. ::: :::.:::::.:::::.::::::. CCDS55 AANSTELSLLADEVITVFSVVGMDSDWLMGERGNQKGKVPITYLELLN 340 350 360 370 380 >>CCDS710.1 SH3GLB1 gene_id:51100|Hs108|chr1 (365 aa) initn: 1228 init1: 897 opt: 897 Z-score: 806.4 bits: 158.0 E(32554): 1.3e-38 Smith-Waterman score: 1491; 59.0% identity (82.2% similar) in 405 aa overlap (1-404:4-365) 10 20 30 40 50 pF1KSD MDFNMKKLASDAGIFFTRAVQFTEEKFGQAEKTELDAHFENLLARADSTKNWTEKIL ::::.::::.::: :..:::::::::.:::::::::::.::::..:. :: :::::. CCDS71 MNIMDFNVKKLAADAGTFLSRAVQFTEEKLGQAEKTELDAHLENLLSKAECTKIWTEKIM 10 20 30 40 50 60 60 70 80 90 100 110 pF1KSD RQTEVLLQPNPSARVEEFLYEKLDRKVPSRVTNGELLAQYMADAASELGPTTPYGKTLIK .::::::::::.::.:::.:::::::.:::..: :::.::: ::..:.:: : ::..::: CCDS71 KQTEVLLQPNPNARIEEFVYEKLDRKAPSRINNPELLGQYMIDAGTEFGPGTAYGNALIK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KSD VAEAEKQLGAAERDFIHTASISFLTPLRNFLEGDWKTISKERRLLQNRRLDLDACKARLK .:..:..:.:.:..:.:....::::::::.:::.:::.:::.::::.:::::: :.::: CCDS71 CGETQKRIGTADRELIQTSALNFLTPLRNFIEGDYKTIAKERKLLQNKRLDLDAAKTRLK 130 140 150 160 170 180 180 190 200 210 220 230 pF1KSD KAKAAEAKATCEGDTVPDFQETRPRNYILSASASALWNDEVDKAEQELRVAQTEFDRQAE ::::::.. ...:::::..:.::::::: CCDS71 KAKAAETR---------------------------------NSSEQELRITQSEFDRQAE 190 200 240 250 260 270 280 290 pF1KSD VTRLLLEGISSTHVNHLRCLHEFVKSQTTYYAQCYRHMLDLQKQLGSSQGAIFPGTFVGT .::::::::::::..:::::..::..: :::::::..:::::::::: ::...... CCDS71 ITRLLLEGISSTHAHHLRCLNDFVEAQMTYYAQCYQYMLDLQKQLGS-----FPSNYLSN 210 220 230 240 250 260 300 310 320 330 340 350 pF1KSD TEPAS-PPLSSTSPTTAAATMPVVPSVASLAPPGEASLCLEEVAPPASGTRKARVLYDYE .. .: :. :. :.. ... . : .. :.. : :.: ::.:::::::::. CCDS71 NNQTSVTPVPSVLPNAIGSSAMASTSGLVITSPSNLSD-LKEC----SGSRKARVLYDYD 270 280 290 300 310 360 370 380 390 400 pF1KSD AADSSELALLADELITVYSLPGMDPDWLIGERGNKKGKVPVTYLELLS ::.:.::.:::::.:::.:. ::: :::.:::::.:::::.::::::. CCDS71 AANSTELSLLADEVITVFSVVGMDSDWLMGERGNQKGKVPITYLELLN 320 330 340 350 360 >>CCDS55613.1 SH3GLB1 gene_id:51100|Hs108|chr1 (265 aa) initn: 709 init1: 381 opt: 387 Z-score: 357.0 bits: 74.3 E(32554): 1.5e-13 Smith-Waterman score: 981; 53.2% identity (77.9% similar) in 308 aa overlap (98-404:1-265) 70 80 90 100 110 120 pF1KSD PSARVEEFLYEKLDRKVPSRVTNGELLAQYMADAASELGPTTPYGKTLIKVAEAEKQLGA : ::..:.:: : ::..::: .:..:..:. CCDS55 MIDAGTEFGPGTAYGNALIKCGETQKRIGT 10 20 30 130 140 150 160 170 180 pF1KSD AERDFIHTASISFLTPLRNFLEGDWKTISKERRLLQNRRLDLDACKARLKKAKAAEAKAT :.:..:.:....::::::::.:::.:::.:::.::::.:::::: :.:::::::::.. CCDS55 ADRELIQTSALNFLTPLRNFIEGDYKTIAKERKLLQNKRLDLDAAKTRLKKAKAAETR-- 40 50 60 70 80 190 200 210 220 230 240 pF1KSD CEGDTVPDFQETRPRNYILSASASALWNDEVDKAEQELRVAQTEFDRQAEVTRLLLEGIS ...:::::..:.:::::::.::::::::: CCDS55 -------------------------------NSSEQELRITQSEFDRQAEITRLLLEGIS 90 100 110 250 260 270 280 290 300 pF1KSD STHVNHLRCLHEFVKSQTTYYAQCYRHMLDLQKQLGSSQGAIFPGTFVGTTEPAS-PPLS :::..:::::..::..: :::::::..:::::::::: ::........ .: :. CCDS55 STHAHHLRCLNDFVEAQMTYYAQCYQYMLDLQKQLGS-----FPSNYLSNNNQTSVTPVP 120 130 140 150 160 170 310 320 330 340 350 360 pF1KSD STSPTTAAATMPVVPSVASLAPPGEASLCLEEVAPPASGTRKARVLYDYEAADSSELALL :. :.. ... . : .. :.. : :.: ::.:::::::::.::.:.::.:: CCDS55 SVLPNAIGSSAMASTSGLVITSPSNLSD-LKEC----SGSRKARVLYDYDAANSTELSLL 180 190 200 210 220 370 380 390 400 pF1KSD ADELITVYSLPGMDPDWLIGERGNKKGKVPVTYLELLS :::.:::.:. ::: :::.:::::.:::::.::::::. CCDS55 ADEVITVFSVVGMDSDWLMGERGNQKGKVPITYLELLN 230 240 250 260 404 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 07:29:17 2016 done: Thu Nov 3 07:29:18 2016 Total Scan time: 2.910 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]