FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0913, 254 aa 1>>>pF1KE0913 254 - 254 aa - 254 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5895+/-0.000852; mu= 13.0231+/- 0.051 mean_var=73.1291+/-14.339, 0's: 0 Z-trim(106.7): 61 B-trim: 3 in 1/52 Lambda= 0.149979 statistics sampled from 9061 (9124) to 9061 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.668), E-opt: 0.2 (0.28), width: 16 Scan time: 2.250 The best scores are: opt bits E(32554) CCDS4750.1 DRA gene_id:3122|Hs108|chr6 ( 254) 1707 378.5 2.4e-105 CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 ( 260) 998 225.1 3.8e-59 CCDS4763.1 DOA gene_id:3111|Hs108|chr6 ( 250) 943 213.2 1.4e-55 CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 ( 255) 929 210.1 1.2e-54 CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 ( 255) 901 204.1 7.7e-53 CCDS4761.1 DMA gene_id:3108|Hs108|chr6 ( 261) 339 82.5 3.2e-16 CCDS4760.1 DMB gene_id:3109|Hs108|chr6 ( 263) 263 66.0 2.9e-11 >>CCDS4750.1 DRA gene_id:3122|Hs108|chr6 (254 aa) initn: 1707 init1: 1707 opt: 1707 Z-score: 2004.6 bits: 378.5 E(32554): 2.4e-105 Smith-Waterman score: 1707; 100.0% identity (100.0% similar) in 254 aa overlap (1-254:1-254) 10 20 30 40 50 60 pF1KE0 MAISGVPVLGFFIIAVLMSAQESWAIKEEHVIIQAEFYLNPDQSGEFMFDFDGDEIFHVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MAISGVPVLGFFIIAVLMSAQESWAIKEEHVIIQAEFYLNPDQSGEFMFDFDGDEIFHVD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 MAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTVLTNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTVLTNS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 PVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFHYLPFLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFHYLPFLP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 STEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTIFIIK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 STEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTIFIIK 190 200 210 220 230 240 250 pF1KE0 GLRKSNAAERRGPL :::::::::::::: CCDS47 GLRKSNAAERRGPL 250 >>CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 (260 aa) initn: 1002 init1: 976 opt: 998 Z-score: 1175.4 bits: 225.1 E(32554): 3.8e-59 Smith-Waterman score: 998; 59.9% identity (80.6% similar) in 247 aa overlap (8-254:14-260) 10 20 30 40 50 pF1KE0 MAISGVPVLGFFIIAVLMSAQESWAIKEEHVIIQAEFYLNPDQSGEFMFDFDGD .: . .: :.: . . ::: .:: : : . .:::::.:: : CCDS47 MRPEDRMFHIRAVILRALSLAFLLSLRGAGAIKADHVSTYAAFVQTHRPTGEFMFEFDED 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE0 EIFHVDMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEV :.:.::. ::::::.:::::. ::::::.:::::. . ::. . .:::.: :: :::: CCDS47 EMFYVDLDKKETVWHLEEFGQAFSFEAQGGLANIAILNNNLNTLIQRSNHTQATNDPPEV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE0 TVLTNSPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFH ::. . :::: .::.::: :::: :::.::::: ::. :: ::.:..:::: :. :.::: CCDS47 TVFPKEPVELGQPNTLICHIDKFFPPVLNVTWLCNGELVTEGVAESLFLPRTDYSFHKFH 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE0 YLPFLPSTEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIG :: :.::.:: :::::::::::.::::::: . : .:::::.:.:::::..::::::.: CCDS47 YLTFVPSAEDFYDCRVEHWGLDQPLLKHWEAQEPIQMPETTETVLCALGLVLGLVGIIVG 190 200 210 220 230 240 240 250 pF1KE0 TIFIIKGLRKSNAAERRGPL :..:::.::... . .: : CCDS47 TVLIIKSLRSGHDPRAQGTL 250 260 >>CCDS4763.1 DOA gene_id:3111|Hs108|chr6 (250 aa) initn: 1000 init1: 887 opt: 943 Z-score: 1111.3 bits: 213.2 E(32554): 1.4e-55 Smith-Waterman score: 943; 54.7% identity (78.9% similar) in 247 aa overlap (1-246:1-247) 10 20 30 40 50 pF1KE0 MAISGVPVLGFFIIAVLMSAQESWAIKEEHV-IIQAEFYLNPDQSGEFMFDFDGDEIFHV ::. . :::: . .:.: ::. : : .:. :: . ::.: .:: ...: : CCDS47 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE0 DMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTVLTN :. :.:.:::: ::: :: :. ::.::.::. ::.:.:...::: . ::::.:::: . CCDS47 DLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE0 SPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFHYLPFL : ::: .::.:::..:.. :::.:.::::::. :: ::..: : . ::::::::::::. CCDS47 SRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFV 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE0 PSTEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTIFII ::.::::::.::::::: :::.:::...: : :.. :..::::::..::::...::..:: CCDS47 PSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLII 190 200 210 220 230 240 240 250 pF1KE0 KGLRKSNAAERRGPL : :. CCDS47 MGTYVSSVPR 250 >>CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 (255 aa) initn: 931 init1: 913 opt: 929 Z-score: 1094.8 bits: 210.1 E(32554): 1.2e-54 Smith-Waterman score: 929; 53.3% identity (78.0% similar) in 255 aa overlap (1-254:1-255) 10 20 30 40 50 pF1KE0 MAISGVPVLGFFIIAVLMSAQESWAIKEEHVI-IQAEFYLNPDQSGEFMFDFDGDEIFHV : .. . .:: . ....:: . : .:: ...: ::.. .::::: :.: CCDS47 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQYTHEFDGDEQFYV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE0 DMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTVLTN :. .:::.:: ::..:..:. :::: :.:: : ::.:: :: : : :: :::::... CCDS47 DLERKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPEVTVFSK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE0 SPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFHYLPFL ::: : .::.:::..:.. :::::.::: ::. :: ::::: :: . :: : :. :: :: CCDS47 SPVTLGQPNTLICLVDNIFPPVVNITWLSNGQSVTEGVSETSFLSKSDHSFFKISYLTFL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE0 PSTEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTIFII ::....:::.:::::::.::::::: . :.:. : ::.:::::::.:::.::..::.::: CCDS47 PSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLMGIVVGTVFII 190 200 210 220 230 240 240 250 pF1KE0 KGLRKSNAAERRGPL .:::. .:....::: CCDS47 QGLRSVGASRHQGPL 250 >>CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 (255 aa) initn: 976 init1: 882 opt: 901 Z-score: 1062.1 bits: 204.1 E(32554): 7.7e-53 Smith-Waterman score: 901; 52.2% identity (77.3% similar) in 255 aa overlap (1-254:1-255) 10 20 30 40 50 pF1KE0 MAISGVPVLGFFIIAVLMSAQESWAIKEEHVI-IQAEFYLNPDQSGEFMFDFDGDEIFHV : .. . .:: . ....:: . : .:: ..:: . ::.. .::::: :.: CCDS47 MILNKALLLGALALTAVMSPCGGEDIVADHVASYGVNFYQSHGPSGQYTHEFDGDEEFYV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE0 DMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTVLTN :. :::::.: :..: ::. :.:: :.:: : .::.: ..:: : :: :::::... CCDS47 DLETKETVWQLPMFSKFISFDPQSALRNMAVGKHTLEFMMRQSNSTAATNEVPEVTVFSK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE0 SPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFHYLPFL :: : .::.:::..:.. :::::.::: ::. :: ::::: :: . :: : :. :: :: CCDS47 FPVTLGQPNTLICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTFL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE0 PSTEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTIFII ::....:::.::::::::::::::: . :.:. : ::..::::::.:::.::..::.::: CCDS47 PSADEIYDCKVEHWGLDEPLLKHWEPEIPAPMSELTETLVCALGLSVGLMGIVVGTVFII 190 200 210 220 230 240 240 250 pF1KE0 KGLRKSNAAERRGPL .:::. .:....: : CCDS47 QGLRSVGASRHQGLL 250 >>CCDS4761.1 DMA gene_id:3108|Hs108|chr6 (261 aa) initn: 199 init1: 126 opt: 339 Z-score: 404.7 bits: 82.5 E(32554): 3.2e-16 Smith-Waterman score: 341; 28.9% identity (58.1% similar) in 246 aa overlap (13-239:14-252) 10 20 30 40 pF1KE0 MAISGVPVLGFFIIAVLMSAQESWAIKE-----------EHVIIQAEFYLNPDQSGEFM .. .: .:::. : .:..... . . . : . CCDS47 MGHEQNQGAALLQMLPLLWLLPHSWAVPEAPTPMWPDDLQNHTFLHTVYCQDGSPSVGLS 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE0 FDFDGDEIFHVDMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKR-----SN .: :..: :.... : :: ::. .: . :: : :: : : .. .. CCDS47 EAYDEDQLFFFDFSQNTRVPRLPEFADWA--QEQGDAPAILFDKEFCEWMIQQIGPKLDG 70 80 90 100 110 110 120 130 140 150 160 pF1KE0 YTPITNVPPEVTVLTNSPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFL :.. : . :.: .:.:. .::.:.::.... ::...:.: ... :: : . : :. CCDS47 KIPVSRGFPIAEVFTLKPLEFGKPNTLVCFVSNLFPPMLTVNWQHHSVPVE-GFGPT-FV 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE0 PREDHL-FRKFHYLPFLPSTEDVYDCRVEHWGLDEPLLKHWEFDAP-SPLP-ETTENVVC : : :. : :: : : :...: : : . .: .: . :: . :::.: CCDS47 SAVDGLSFQAFSYLNFTPEPSDIFSCIVTHEIDRYTAIAYW---VPRNALPSDLLENVLC 180 190 200 210 220 230 230 240 250 pF1KE0 ALGLTVGLVGIIIGTIFIIKGLRKSNAAERRGPL .... .:..:::.: ..:: CCDS47 GVAFGLGVLGIIVGIVLIIYFRKPCSGD 240 250 260 >>CCDS4760.1 DMB gene_id:3109|Hs108|chr6 (263 aa) initn: 241 init1: 137 opt: 263 Z-score: 315.8 bits: 66.0 E(32554): 2.9e-11 Smith-Waterman score: 263; 36.2% identity (59.1% similar) in 127 aa overlap (111-236:114-238) 90 100 110 120 130 140 pF1KE0 AQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTVLTNSPVELREPNVLICFIDKFTPP :: : : ..: . ::: .: :.. : : CCDS47 DTLMQRLRNGLQNCATHTQPFWGSLTNRTRPPSVQVAKTTPFNTREPVMLACYVWGFYPA 90 100 110 120 130 140 150 160 170 180 190 pF1KE0 VVNVTWLRNGKPVTTGVS-ETVFLPREDHLFRKFHYLPFLPSTEDVYDCRVEHWGLDEPL :..:: .::: : : . . : : .. . .: . :: :.: : ::: : ::. CCDS47 EVTITWRKNGKLVMPHSSAHKTAQPNGDWTYQTLSHLALTPSYGDTYTCVVEHTGAPEPI 150 160 170 180 190 200 200 210 220 230 240 250 pF1KE0 LKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTIFIIKGLRKSNAAERRGPL :. : . ::. .: . : :. : .::. . .:.: CCDS47 LRDWT-PGLSPM-QTLKVSVSAVTLGLGLIIFSLGVISWRRAGHSSYTPLPGSNYSEGWH 210 220 230 240 250 260 CCDS47 IS 254 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 04:28:26 2016 done: Sat Nov 5 04:28:27 2016 Total Scan time: 2.250 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]