FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA0609, 704 aa 1>>>pF1KA0609 704 - 704 aa - 704 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.2622+/-0.00115; mu= 14.9169+/- 0.069 mean_var=80.6138+/-15.743, 0's: 0 Z-trim(102.7): 21 B-trim: 0 in 0/49 Lambda= 0.142846 statistics sampled from 7071 (7081) to 7071 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.575), E-opt: 0.2 (0.218), width: 16 Scan time: 2.800 The best scores are: opt bits E(32554) CCDS13912.1 LARGE1 gene_id:9215|Hs108|chr22 ( 756) 2531 532.0 1.2e-150 CCDS31473.1 LARGE2 gene_id:120071|Hs108|chr11 ( 721) 1333 285.1 2.4e-76 CCDS76399.1 LARGE2 gene_id:120071|Hs108|chr11 ( 690) 1332 284.9 2.7e-76 CCDS8136.1 B4GAT1 gene_id:11041|Hs108|chr11 ( 415) 359 84.3 3.9e-16 >>CCDS13912.1 LARGE1 gene_id:9215|Hs108|chr22 (756 aa) initn: 2530 init1: 2530 opt: 2531 Z-score: 2818.0 bits: 532.0 E(32554): 1.2e-150 Smith-Waterman score: 4502; 92.9% identity (92.9% similar) in 736 aa overlap (1-684:1-736) 10 20 30 40 50 60 pF1KA0 MLGICRGRRKFLAASLSLLCIPAITWIYLFSGSFEDGKPVSLSPLESQAHSPRYTASSQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MLGICRGRRKFLAASLSLLCIPAITWIYLFSGSFEDGKPVSLSPLESQAHSPRYTASSQR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA0 ERESLEVRMREVEEENRALRRQLSLAQGRAPSHRRGNHSKTYSMEEGTGDSENLRAGIVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 ERESLEVRMREVEEENRALRRQLSLAQGRAPSHRRGNHSKTYSMEEGTGDSENLRAGIVA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA0 GNSSECGQQPVVEKCETIHVAIVCAGYNASRDVVTLVKSVLFHRRNPLHFHLIADSIAEQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GNSSECGQQPVVEKCETIHVAIVCAGYNASRDVVTLVKSVLFHRRNPLHFHLIADSIAEQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA0 ILATLFQTWMVPAVRVDFYNADELKSEVSWIPNKHYSGIYGLMKLVLTKTLPANLERVIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 ILATLFQTWMVPAVRVDFYNADELKSEVSWIPNKHYSGIYGLMKLVLTKTLPANLERVIV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA0 LDTDITFATDIAELWAVFHKFKGQQVLGLVENQSDWYLGNLWKNHRPWPALGRGYNTGVI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LDTDITFATDIAELWAVFHKFKGQQVLGLVENQSDWYLGNLWKNHRPWPALGRGYNTGVI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA0 LLLLDKLRKMKWEQMWRLTAERELMGMLSTSLADQDIFNAVIKQNPFLVYQLPCFWNVQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LLLLDKLRKMKWEQMWRLTAERELMGMLSTSLADQDIFNAVIKQNPFLVYQLPCFWNVQL 310 320 330 340 350 360 370 pF1KA0 SDHTRSEQCYRDVSDLK------------------------------------------- ::::::::::::::::: CCDS13 SDHTRSEQCYRDVSDLKVIHWNSPKKLRVKNKHVEFFRNLYLTFLEYDGNLLRRELFGCP 370 380 390 400 410 420 380 390 400 410 420 pF1KA0 ---------LQKQLSELDEDDLCYEFRRERFTVHRTHLYFLHYEYEPAADSTDVTLVAQL ::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SEADVNSENLQKQLSELDEDDLCYEFRRERFTVHRTHLYFLHYEYEPAADSTDVTLVAQL 430 440 450 460 470 480 430 440 450 460 470 480 pF1KA0 SMDRLQMLEAICKHWEGPISLALYLSDAEAQQFLRYAQGSEVLMSRHNVGYHIVYKEGQF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SMDRLQMLEAICKHWEGPISLALYLSDAEAQQFLRYAQGSEVLMSRHNVGYHIVYKEGQF 490 500 510 520 530 540 490 500 510 520 530 540 pF1KA0 YPVNLLRNVAMKHISTPYMFLSDIDFLPMYGLYEYLRKSVIQLDLANTKKAMIVPAFETL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 YPVNLLRNVAMKHISTPYMFLSDIDFLPMYGLYEYLRKSVIQLDLANTKKAMIVPAFETL 550 560 570 580 590 600 550 560 570 580 590 600 pF1KA0 RYRLSFPKSKAELLSMLDMGTLFTFRYHVWTKGHAPTNFAKWRTATTPYRVEWEADFEPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 RYRLSFPKSKAELLSMLDMGTLFTFRYHVWTKGHAPTNFAKWRTATTPYRVEWEADFEPY 610 620 630 640 650 660 610 620 630 640 650 660 pF1KA0 VVVRRDCPEYDRRFVGFGWNKVAHIMELDVQEYEFIVLPNAYMIHMPHAPSFDITKFRSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 VVVRRDCPEYDRRFVGFGWNKVAHIMELDVQEYEFIVLPNAYMIHMPHAPSFDITKFRSN 670 680 690 700 710 720 670 680 690 700 pF1KA0 KQYRICLKTLKEEFQQDMSRRYGFAALKYLTAENNS :::::::::::::::: CCDS13 KQYRICLKTLKEEFQQDMSRRYGFAALKYLTAENNS 730 740 750 >>CCDS31473.1 LARGE2 gene_id:120071|Hs108|chr11 (721 aa) initn: 2724 init1: 1298 opt: 1333 Z-score: 1484.0 bits: 285.1 E(32554): 2.4e-76 Smith-Waterman score: 2671; 60.6% identity (80.0% similar) in 650 aa overlap (89-684:55-695) 60 70 80 90 100 110 pF1KA0 QRERESLEVRMREVEEENRALRRQLSLAQGRAPSHRRGNHSKTYSMEEGTGDSENLRAGI :.: : .. . . . :.: ... CCDS31 LLFGGDLGCERREPGGRAGAPGCFPGPLMPRVPPDGRLRRAAALDGDPGAGPGDH----- 30 40 50 60 70 120 130 140 150 160 170 pF1KA0 VAGNSSECGQQPVVE-KCETIHVAIVCAGYNASRDVVTLVKSVLFHRRNPLHFHLIADSI : :.:: :: ::: .::::::::.:.::::.:::::.::.:.::::.::..:.. CCDS31 ---NRSDCGPQPPPPPKCELLHVAIVCAGHNSSRDVITLVKSMLFYRKNPLHLHLVTDAV 80 90 100 110 120 130 180 190 200 210 220 230 pF1KA0 AEQILATLFQTWMVPAVRVDFYNADELKSEVSWIPNKHYSGIYGLMKLVLTKTLPANLER :..:: :::.:::::::::.::.::.:: .:::::::::::.:::::::: ..:::.: : CCDS31 ARNILETLFHTWMVPAVRVSFYHADQLKPQVSWIPNKHYSGLYGLMKLVLPSALPAELAR 140 150 160 170 180 190 240 250 260 270 280 290 pF1KA0 VIVLDTDITFATDIAELWAVFHKFKGQQVLGLVENQSDWYLGNLWKNHRPWPALGRGYNT :::::::.:::.::.::::.: .:. :..:::::::::::::::::::::::::::.:: CCDS31 VIVLDTDVTFASDISELWALFAHFSDTQAIGLVENQSDWYLGNLWKNHRPWPALGRGFNT 200 210 220 230 240 250 300 310 320 330 340 350 pF1KA0 GVILLLLDKLRKMKWEQMWRLTAERELMGMLSTSLADQDIFNAVIKQNPFLVYQLPCFWN ::::: ::.::. :::::::::.:::... .::::::::::::::..: :: .::: :: CCDS31 GVILLRLDRLRQAGWEQMWRLTARRELLSLPATSLADQDIFNAVIKEHPGLVQRLPCVWN 260 270 280 290 300 310 360 370 pF1KA0 VQLSDHTRSEQCYRDVSDLK---------------------------------------- ::::::: .:.:: ..:::: CCDS31 VQLSDHTLAERCYSEASDLKVIHWNSPKKLRVKNKHVEFFRNFYLTFLEYDGNLLRRELF 320 330 340 350 360 370 380 390 400 410 420 pF1KA0 ------------LQKQLSELDEDDLCYEFRRERFTVHRTHLYFLHYEYEPAADSTDVTLV ::. :..:::.: :.:::....::::.:. :: .: : ::::: CCDS31 VCPSQPPPGAEQLQQALAQLDEEDPCFEFRQQQLTVHRVHVTFLPHE-PPPPRPHDVTLV 380 390 400 410 420 430 430 440 450 460 470 480 pF1KA0 AQLSMDRLQMLEAICKHWEGPISLALYLSDAEAQQFLRYAQGSEVLMSRHNVGYHIVYKE :::::::::::::.:.:: ::.::::::.::::::::.....: :: .:..:.::.::.: CCDS31 AQLSMDRLQMLEALCRHWPGPMSLALYLTDAEAQQFLHFVEASPVLAARQDVAYHVVYRE 440 450 460 470 480 490 490 500 510 520 530 540 pF1KA0 GQFYPVNLLRNVAMKHISTPYMFLSDIDFLPMYGLYEYLRKSVIQLDLANTKKA-MIVPA : .:::: :::::. . :::.::::::::: :.::.::: :. :: :.. .:: ..::: CCDS31 GPLYPVNQLRNVALAQALTPYVFLSDIDFLPAYSLYDYLRASIEQLGLGSRRKAALVVPA 500 510 520 530 540 550 550 560 570 580 590 600 pF1KA0 FETLRYRLSFPKSKAELLSMLDMGTLFTFRYHVWTKGHAPTNFAKWRTATTPYRVEWEAD :::::::.:::.::.:::..:: :::.::::: : .:::::..:.:: : .::::.: :. CCDS31 FETLRYRFSFPHSKVELLALLDAGTLYTFRYHEWPRGHAPTDYARWREAQAPYRVQWAAN 560 570 580 590 600 610 610 620 630 640 650 660 pF1KA0 FEPYVVVRRDCPEYDRRFVGFGWNKVAHIMELDVQEYEFIVLPNAYMIHMPHAPSFDITK .:::::: ::::.:: :::::::::::::.:::.::::..:::.:. ::.:::::.::.. CCDS31 YEPYVVVPRDCPRYDPRFVGFGWNKVAHIVELDAQEYELLVLPEAFTIHLPHAPSLDISR 620 630 640 650 660 670 670 680 690 700 pF1KA0 FRSNKQYRICLKTLKEEFQQDMSRRYGFAALKYLTAENNS :::. :: ::..::.::.: CCDS31 FRSSPTYRDCLQALKDEFHQDLSRHHGAAALKYLPALQQPQSPARG 680 690 700 710 720 >>CCDS76399.1 LARGE2 gene_id:120071|Hs108|chr11 (690 aa) initn: 2724 init1: 1298 opt: 1332 Z-score: 1483.2 bits: 284.9 E(32554): 2.7e-76 Smith-Waterman score: 2670; 62.8% identity (81.4% similar) in 623 aa overlap (116-684:43-664) 90 100 110 120 130 140 pF1KA0 AQGRAPSHRRGNHSKTYSMEEGTGDSENLRAGIVAGNSSECGQQPVVE-KCETIHVAIVC :: : :.:: :: ::: .:::::: CCDS76 AALLLLLLLLGFLLFDGRLRRAAALDGDPGAGPGDHNRSDCGPQPPPPPKCELLHVAIVC 20 30 40 50 60 70 150 160 170 180 190 200 pF1KA0 AGYNASRDVVTLVKSVLFHRRNPLHFHLIADSIAEQILATLFQTWMVPAVRVDFYNADEL ::.:.::::.:::::.::.:.::::.::..:..:..:: :::.:::::::::.::.::.: CCDS76 AGHNSSRDVITLVKSMLFYRKNPLHLHLVTDAVARNILETLFHTWMVPAVRVSFYHADQL 80 90 100 110 120 130 210 220 230 240 250 260 pF1KA0 KSEVSWIPNKHYSGIYGLMKLVLTKTLPANLERVIVLDTDITFATDIAELWAVFHKFKGQ : .:::::::::::.:::::::: ..:::.: ::::::::.:::.::.::::.: .:. CCDS76 KPQVSWIPNKHYSGLYGLMKLVLPSALPAELARVIVLDTDVTFASDISELWALFAHFSDT 140 150 160 170 180 190 270 280 290 300 310 320 pF1KA0 QVLGLVENQSDWYLGNLWKNHRPWPALGRGYNTGVILLLLDKLRKMKWEQMWRLTAEREL :..:::::::::::::::::::::::::::.::::::: ::.::. :::::::::.::: CCDS76 QAIGLVENQSDWYLGNLWKNHRPWPALGRGFNTGVILLRLDRLRQAGWEQMWRLTARREL 200 210 220 230 240 250 330 340 350 360 370 pF1KA0 MGMLSTSLADQDIFNAVIKQNPFLVYQLPCFWNVQLSDHTRSEQCYRDVSDLK------- ... .::::::::::::::..: :: .::: ::::::::: .:.:: ..:::: CCDS76 LSLPATSLADQDIFNAVIKEHPGLVQRLPCVWNVQLSDHTLAERCYSEASDLKVIHWNSP 260 270 280 290 300 310 380 390 pF1KA0 ---------------------------------------------LQKQLSELDEDDLCY ::. :..:::.: :. CCDS76 KKLRVKNKHVEFFRNFYLTFLEYDGNLLRRELFVCPSQPPPGAEQLQQALAQLDEEDPCF 320 330 340 350 360 370 400 410 420 430 440 450 pF1KA0 EFRRERFTVHRTHLYFLHYEYEPAADSTDVTLVAQLSMDRLQMLEAICKHWEGPISLALY :::....::::.:. :: .: : ::::::::::::::::::.:.:: ::.::::: CCDS76 EFRQQQLTVHRVHVTFLPHE-PPPPRPHDVTLVAQLSMDRLQMLEALCRHWPGPMSLALY 380 390 400 410 420 430 460 470 480 490 500 510 pF1KA0 LSDAEAQQFLRYAQGSEVLMSRHNVGYHIVYKEGQFYPVNLLRNVAMKHISTPYMFLSDI :.::::::::.....: :: .:..:.::.::.:: .:::: :::::. . :::.::::: CCDS76 LTDAEAQQFLHFVEASPVLAARQDVAYHVVYREGPLYPVNQLRNVALAQALTPYVFLSDI 440 450 460 470 480 490 520 530 540 550 560 570 pF1KA0 DFLPMYGLYEYLRKSVIQLDLANTKKA-MIVPAFETLRYRLSFPKSKAELLSMLDMGTLF :::: :.::.::: :. :: :.. .:: ..::::::::::.:::.::.:::..:: :::. CCDS76 DFLPAYSLYDYLRASIEQLGLGSRRKAALVVPAFETLRYRFSFPHSKVELLALLDAGTLY 500 510 520 530 540 550 580 590 600 610 620 630 pF1KA0 TFRYHVWTKGHAPTNFAKWRTATTPYRVEWEADFEPYVVVRRDCPEYDRRFVGFGWNKVA ::::: : .:::::..:.:: : .::::.: :..:::::: ::::.:: ::::::::::: CCDS76 TFRYHEWPRGHAPTDYARWREAQAPYRVQWAANYEPYVVVPRDCPRYDPRFVGFGWNKVA 560 570 580 590 600 610 640 650 660 670 680 690 pF1KA0 HIMELDVQEYEFIVLPNAYMIHMPHAPSFDITKFRSNKQYRICLKTLKEEFQQDMSRRYG ::.:::.::::..:::.:. ::.:::::.::..:::. :: ::..::.::.: CCDS76 HIVELDAQEYELLVLPEAFTIHLPHAPSLDISRFRSSPTYRDCLQALKDEFHQDLSRHHG 620 630 640 650 660 670 700 pF1KA0 FAALKYLTAENNS CCDS76 AAALKYLPALQQPQSPARG 680 690 >>CCDS8136.1 B4GAT1 gene_id:11041|Hs108|chr11 (415 aa) initn: 339 init1: 123 opt: 359 Z-score: 403.1 bits: 84.3 E(32554): 3.9e-16 Smith-Waterman score: 395; 28.7% identity (54.9% similar) in 328 aa overlap (418-690:91-408) 390 400 410 420 430 440 pF1KA0 DDLCYEFRRERFTVHRTHLYFLHYEYEPAADSTDVTLVAQLSMDRLQMLEAICKHWEGPI : .:: :... :.: : : .. ..::::. CCDS81 AQLRTALASGGVLDASGDYRVYRGLLKTTMDPNDVILATHASVDNLLHLSGLLERWEGPL 70 80 90 100 110 120 450 460 470 480 pF1KA0 SLALYLSDAEAQQF---LRYAQGSEVLMSRHNVGYHIV------------YKEGQF---- :.... . : :. : :: .:. : :..:.: . :.: CCDS81 SVSVFAATKEEAQLATVLAYALSSHCPDMRARVAMHLVCPSRYEAAVPDPREPGEFALLR 130 140 150 160 170 180 490 500 510 520 pF1KA0 --------------------------YPVNLLRNVAMKHISTPYMFLSDIDFLPMYGLYE :: :::::.: . .. : .. :.:..: ::.. CCDS81 SCQEVFDKLARVAQPGINYALGTNVSYPNNLLRNLARE--GANYALVIDVDMVPSEGLWR 190 200 210 220 230 530 540 550 560 570 580 pF1KA0 YLRKSVIQLDLANT--KKAMIVPAFETLRYRLSFPKSKAELLSMLDMGTLFTFRYHVWTK ::. .:: .: :..::::: : : .: .: ::... ..: . : : . : CCDS81 GLRE---MLDQSNQWGGTALVVPAFEIRRAR-RMPMNKNELVQLYQVGEVRPFYYGLCTP 240 250 260 270 280 290 590 600 610 620 630 pF1KA0 GHAPTNFAKW-----RTATTP-YRVEWEADFEPYVVVRRDCPEYDRRFVGFGWNKVAHIM .::::...: .. : : : :. .::. :. : .:.:: .:.:.... CCDS81 CQAPTNYSRWVNLPEESLLRPAYVVPWQDPWEPFYVAGGKVPTFDERFRQYGFNRISQAC 300 310 320 330 340 350 640 650 660 670 680 690 pF1KA0 ELDVQEYEFIVLPNAYMIH--MPHAPSFDITKFRSNKQYRICLKTLKEEFQQDMSRRYGF :: : ..: :: .....: . .: .: : :.. .: : ..:.:... .: CCDS81 ELHVAGFDFEVLNEGFLVHKGFKEALKFHPQKEAENQHNKI----LYRQFKQELKAKYPN 360 370 380 390 400 410 700 pF1KA0 AALKYLTAENNS CCDS81 SPRRC 704 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 19:25:16 2016 done: Wed Nov 2 19:25:17 2016 Total Scan time: 2.800 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]