FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1226, 704 aa 1>>>pF1KA1226 704 - 704 aa - 704 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8611+/-0.00117; mu= 16.8888+/- 0.070 mean_var=69.6644+/-13.890, 0's: 0 Z-trim(101.8): 30 B-trim: 0 in 0/49 Lambda= 0.153663 statistics sampled from 6685 (6690) to 6685 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.559), E-opt: 0.2 (0.206), width: 16 Scan time: 3.440 The best scores are: opt bits E(32554) CCDS3989.1 NLN gene_id:57486|Hs108|chr5 ( 704) 4666 1044.2 0 CCDS12095.1 THOP1 gene_id:7064|Hs108|chr19 ( 689) 2999 674.6 1.3e-193 CCDS9303.1 MIPEP gene_id:4285|Hs108|chr13 ( 713) 632 149.9 1.2e-35 >>CCDS3989.1 NLN gene_id:57486|Hs108|chr5 (704 aa) initn: 4666 init1: 4666 opt: 4666 Z-score: 5586.4 bits: 1044.2 E(32554): 0 Smith-Waterman score: 4666; 100.0% identity (100.0% similar) in 704 aa overlap (1-704:1-704) 10 20 30 40 50 60 pF1KA1 MIARCLLAVRSLRRVGGSRILLRMTLGREVMSPLQAMSSYTVAGRNVLRWDLSPEQIKTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 MIARCLLAVRSLRRVGGSRILLRMTLGREVMSPLQAMSSYTVAGRNVLRWDLSPEQIKTR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 TEELIVQTKQVYDAVGMLGIEEVTYENCLQALADVEVKYIVERTMLDFPQHVSSDKEVRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 TEELIVQTKQVYDAVGMLGIEEVTYENCLQALADVEVKYIVERTMLDFPQHVSSDKEVRA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 ASTEADKRLSRFDIEMSMRGDIFERIVHLQETCDLGKIKPEARRYLEKSIKMGKRNGLHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 ASTEADKRLSRFDIEMSMRGDIFERIVHLQETCDLGKIKPEARRYLEKSIKMGKRNGLHL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 PEQVQNEIKSMKKRMSELCIDFNKNLNEDDTFLVFSKAELGALPDDFIDSLEKTDDDKYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 PEQVQNEIKSMKKRMSELCIDFNKNLNEDDTFLVFSKAELGALPDDFIDSLEKTDDDKYK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 ITLKYPHYFPVMKKCCIPETRRRMEMAFNTRCKEENTIILQQLLPLRTKVAKLLGYSTHA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 ITLKYPHYFPVMKKCCIPETRRRMEMAFNTRCKEENTIILQQLLPLRTKVAKLLGYSTHA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 DFVLEMNTAKSTSRVTAFLDDLSQKLKPLGEAEREFILNLKKKECKDRGFEYDGKINAWD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 DFVLEMNTAKSTSRVTAFLDDLSQKLKPLGEAEREFILNLKKKECKDRGFEYDGKINAWD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 LYYYMTQTEELKYSIDQEFLKEYFPIEVVTEGLLNTYQELLGLSFEQMTDAHVWNKSVTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 LYYYMTQTEELKYSIDQEFLKEYFPIEVVTEGLLNTYQELLGLSFEQMTDAHVWNKSVTL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 YTVKDKATGEVLGQFYLDLYPREGKYNHAACFGLQPGCLLPDGSRMMAVAALVVNFSQPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 YTVKDKATGEVLGQFYLDLYPREGKYNHAACFGLQPGCLLPDGSRMMAVAALVVNFSQPV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 AGRPSLLRHDEVRTYFHEFGHVMHQICAQTDFARFSGTNVETDFVEVPSQMLENWVWDVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 AGRPSLLRHDEVRTYFHEFGHVMHQICAQTDFARFSGTNVETDFVEVPSQMLENWVWDVD 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 SLRRLSKHYKDGSPIADDLLEKLVASRLVNTGLLTLRQIVLSKVDQSLHTNTSLDAASEY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 SLRRLSKHYKDGSPIADDLLEKLVASRLVNTGLLTLRQIVLSKVDQSLHTNTSLDAASEY 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA1 AKYCSEILGVAATPGTNMPATFGHLAGGYDGQYYGYLWSEVFSMDMFYSCFKKEGIMNPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS39 AKYCSEILGVAATPGTNMPATFGHLAGGYDGQYYGYLWSEVFSMDMFYSCFKKEGIMNPE 610 620 630 640 650 660 670 680 690 700 pF1KA1 VGMKYRNLILKPGGSLDGMDMLHNFLKREPNQKAFLMSRGLHAP :::::::::::::::::::::::::::::::::::::::::::: CCDS39 VGMKYRNLILKPGGSLDGMDMLHNFLKREPNQKAFLMSRGLHAP 670 680 690 700 >>CCDS12095.1 THOP1 gene_id:7064|Hs108|chr19 (689 aa) initn: 3024 init1: 2996 opt: 2999 Z-score: 3589.3 bits: 674.6 E(32554): 1.3e-193 Smith-Waterman score: 2999; 64.8% identity (86.9% similar) in 657 aa overlap (46-702:22-678) 20 30 40 50 60 70 pF1KA1 GGSRILLRMTLGREVMSPLQAMSSYTVAGRNVLRWDLSPEQIKTRTEELIVQTKQVYDAV : :::::: .::. ::.::: :::.::: : CCDS12 MKPPAACAGDMADAASPCSVVNDLRWDLSAQQIEERTRELIEQTKRVYDQV 10 20 30 40 50 80 90 100 110 120 130 pF1KA1 GMLGIEEVTYENCLQALADVEVKYIVERTMLDFPQHVSSDKEVRAASTEADKRLSRFDIE : .:.:.::. :.::::::: : :.:..:::::::: .:..:.:::::::.::.::.: CCDS12 GTQEFEDVSYESTLKALADVEVTYTVQRNILDFPQHVSPSKDIRTASTEADKKLSEFDVE 60 70 80 90 100 110 140 150 160 170 180 190 pF1KA1 MSMRGDIFERIVHLQETCDLGKIKPEARRYLEKSIKMGKRNGLHLPEQVQNEIKSMKKRM :::: :...::: ::: . ...::: ::::. ::.:.:::::::...:..:: .::.. CCDS12 MSMREDVYQRIVWLQEKVQKDSLRPEAARYLERLIKLGRRNGLHLPRETQENIKRIKKKL 120 130 140 150 160 170 200 210 220 230 240 250 pF1KA1 SELCIDFNKNLNEDDTFLVFSKAELGALPDDFIDSLEKTDDDKYKITLKYPHYFPVMKKC : :::::::::::: ::: :. :::.::.::..:::: .: : :.:::::::::..::: CCDS12 SLLCIDFNKNLNEDTTFLPFTLQELGGLPEDFLNSLEKMEDGKLKVTLKYPHYFPLLKKC 180 190 200 210 220 230 260 270 280 290 300 310 pF1KA1 CIPETRRRMEMAFNTRCKEENTIILQQLLPLRTKVAKLLGYSTHADFVLEMNTAKSTSRV .:::::..: ::: :::::: ::..:. ::.. ..:::. ::::.::::: ::... : CCDS12 HVPETRRKVEEAFNCRCKEENCAILKELVTLRAQKSRLLGFHTHADYVLEMNMAKTSQTV 240 250 260 270 280 290 320 330 340 350 360 370 pF1KA1 TAFLDDLSQKLKPLGEAEREFILNLKKKECKDRGFEYDGKINAWDLYYYMTQTEELKYSI ..:::.:.:::::::: :: ::.::. ::. ::. .::.: :::. :::.:.:: .: . CCDS12 ATFLDELAQKLKPLGEQERAVILELKRAECERRGLPFDGRIRAWDMRYYMNQVEETRYCV 300 310 320 330 340 350 380 390 400 410 420 430 pF1KA1 DQEFLKEYFPIEVVTEGLLNTYQELLGLSFEQMTDAHVWNKSVTLYTVKDKATGEVLGQF ::..::::::..:::.:::. :::::::.:.. : .:...: :::..: :.:::.:.: CCDS12 DQNLLKEYFPVQVVTHGLLGIYQELLGLAFHHEEGASAWHEDVRLYTARDAASGEVVGKF 360 370 380 390 400 410 440 450 460 470 480 490 pF1KA1 YLDLYPREGKYNHAACFGLQPGCLLPDGSRMMAVAALVVNFSQPVAGRPSLLRHDEVRTY :::::::::::.:::::::::::: ::::..:.::.:.::..:.: ::::.::::.:: CCDS12 YLDLYPREGKYGHAACFGLQPGCLRQDGSRQIAIAAMVANFTKPTADAPSLLQHDEVETY 420 430 440 450 460 470 500 510 520 530 540 550 pF1KA1 FHEFGHVMHQICAQTDFARFSGTNVETDFVEVPSQMLENWVWDVDSLRRLSKHYKDGSPI ::::::::::.:.:..:: ::::.:: ::::.::::::::::. . : :.:.::. :: . CCDS12 FHEFGHVMHQLCSQAEFAMFSGTHVERDFVEAPSQMLENWVWEQEPLLRMSRHYRTGSAV 480 490 500 510 520 530 560 570 580 590 600 610 pF1KA1 ADDLLEKLVASRLVNTGLLTLRQIVLSKVDQSLHTNTSLDAASEYAKYCSEILGVAATPG .:::::. :: .::::..::::::.::::.:::.:. : : :::. :.::::: :::: CCDS12 PRELLEKLIESRQANTGLFNLRQIVLAKVDQALHTQTDADPAEEYARLCQEILGVPATPG 540 550 560 570 580 590 620 630 640 650 660 670 pF1KA1 TNMPATFGHLAGGYDGQYYGYLWSEVFSMDMFYSCFKKEGIMNPEVGMKYRNLILKPGGS :::::::::::::::.::::::::::.:::::.. ::.::..: .::: ::. ::.:::: CCDS12 TNMPATFGHLAGGYDAQYYGYLWSEVYSMDMFHTRFKQEGVLNSKVGMDYRSCILRPGGS 600 610 620 630 640 650 680 690 700 pF1KA1 LDGMDMLHNFLKREPNQKAFLMSRGLHAP :. ::. :: :.:.: :::.:.::. CCDS12 EDASAMLRRFLGRDPKQDAFLLSKGLQVGGCEPEPQVC 660 670 680 >>CCDS9303.1 MIPEP gene_id:4285|Hs108|chr13 (713 aa) initn: 516 init1: 272 opt: 632 Z-score: 753.2 bits: 149.9 E(32554): 1.2e-35 Smith-Waterman score: 660; 26.8% identity (56.4% similar) in 605 aa overlap (105-696:121-694) 80 90 100 110 120 130 pF1KA1 VGMLGIEEVTYENCLQALADVEVKYIVERTMLDFPQHVSSDKEVRAASTEADKRLSRFDI . :: . . . : :. :: . .. . CCDS93 LVDRACSTPPGPQTVLIFDELSDSLCRVADLADFVKIAHPEPAFREAAEEACRSIGTMVE 100 110 120 130 140 150 140 150 160 170 180 190 pF1KA1 EMSMRGDIFERIVHLQETCDL-GKIKPEARRYLEKSIKMGKRNGLHLPEQVQNEIKSMKK ... :... . .: : .. ::.:: : . . .:.:: : .: CCDS93 KLNTNVDLYQSLQKLLADKKLVDSLDPETRRVAELFMFDFEISGIHLD-------KEKRK 160 170 180 190 200 200 210 220 230 240 pF1KA1 RMSELCIDFNKNLNEDDTFLV---F-SKAELGALPDDFIDSLEKTDDDKYKITLKYPHYF : .: . : :. ..:::. : .: : ::. . .. .. : .: . : CCDS93 RAVDLNV---KILDLSSTFLMGTNFPNKIEKHLLPEHIRRNFTSAGD---HIIIDGLH-- 210 220 230 240 250 250 260 270 280 290 300 pF1KA1 PVMKKCCIPETRRRMEMAFNT---RCKEENTIILQQLLPLRTKVAKLLGYSTHADFVLEM . :. .. . :. .: :..:: : .:::.:::: . .:. CCDS93 AESPDDLVREAAYKIFLYPNAGQLKC-------LEELLSSRDLLAKLVGYSTFSHRALQG 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 NTAKSTSRVTAFLDDLSQKLKPLGEAEREFILNLKKKECKDRGFEYDGKINAWDLYYYMT . ::. : ::. ::.::. . :.: ..: : . .... :: :: CCDS93 TIAKNPETVMQFLEKLSDKLSERTLKDFEMIRGMKMKLNPQ-----NSEVMPWDPPYYSG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 QTEELKYSIDQEFLKEYFPIEVVTEGLLNTYQELLGLSF--EQMTDAHVWNKSVTLYTVK . .:.:. . .: . . ::: ..:::.:. :: . ..::...: .: CCDS93 VIRAERYNIEPSLYCPFFSLGACMEGLNILLNRLLGISLYAEQPAKGEVWSEDVRKLAVV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 DKATGEVLGQFYLDLYPREGKYNHAAC-FGLQPGCLLPDGSRMMAVAALVVNFSQPVAGR .. : .:: .: :.. : : : : : .. : : ::. .. :..:..:. . . CCDS93 HESEG-LLGYIYCDFFQRADK-PHQDCHFTIRGGRLKEDGDYQLPVVVLMLNLPRSSRSS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 PSLLRHDEVRTYFHEFGHVMHQICAQTDFARFSGTNVETDFVEVPSQMLENWVWDVDSLR :.:: . ... :::.::.::.. ..: . . .:: :::.:::: ..: .. : . CCDS93 PTLLTPSMMENLFHEMGHAMHSMLGRTRYQHVTGTRCPTDFAEVPSILMEYFANDYRVVN 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 RLSKHYKDGSPIADDLLEKLVASRLVNTGLLTLRQIVLSKVDQSLHTNTSL-DAASEYAK ....::. :.:. ... .: :. : .. :. . .:: : . : ..... : CCDS93 QFARHYQTGQPLPKNMVSRLCESKKVCAAADMQLQVFYATLDQIYHGKHPLRNSTTDILK 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA1 YCSE-ILGVAATPGTNMPATFGHLAGGYDGQYYGYLWSEVFSMDMFYSCFKKEGIMNPEV .: . :. .:.: :.::.: : ..::.:: :.. . .. :: .. . : . CCDS93 ETQEKFYGLPYVPNTAWQLRFSHLVG-YGARYYSYLMSRAVASMVWKECFLQDPF-NRAA 610 620 630 640 650 670 680 690 700 pF1KA1 GMKYRNLILKPGGSLDGMDMLHNFLKREPNQKAFLMSRGLHAP : .:: .: ::. . : :....:.. :. :. CCDS93 GERYRREMLAHGGGREPMLMVEGMLQKCPSVDDFVSALVSDLDLDFETFLMDSE 660 670 680 690 700 710 704 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 01:23:52 2016 done: Fri Nov 4 01:23:53 2016 Total Scan time: 3.440 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]