FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5507, 596 aa 1>>>pF1KB5507 596 - 596 aa - 596 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.5848+/-0.000891; mu= 12.8776+/- 0.054 mean_var=88.4685+/-17.669, 0's: 0 Z-trim(108.1): 116 B-trim: 215 in 2/49 Lambda= 0.136358 statistics sampled from 9850 (9972) to 9850 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.676), E-opt: 0.2 (0.306), width: 16 Scan time: 2.790 The best scores are: opt bits E(32554) CCDS41483.1 NET1 gene_id:10276|Hs108|chr10 ( 596) 3947 786.6 0 CCDS7067.1 NET1 gene_id:10276|Hs108|chr10 ( 542) 3393 677.6 1.1e-194 CCDS46854.1 ARHGEF3 gene_id:50650|Hs108|chr3 ( 558) 1957 395.1 1.2e-109 CCDS74948.1 ARHGEF3 gene_id:50650|Hs108|chr3 ( 532) 1936 391.0 2e-108 CCDS2878.1 ARHGEF3 gene_id:50650|Hs108|chr3 ( 526) 1873 378.6 1.1e-104 CCDS46855.1 ARHGEF3 gene_id:50650|Hs108|chr3 ( 532) 1867 377.4 2.5e-104 CCDS82664.1 ITSN1 gene_id:6453|Hs108|chr21 (1716) 366 82.3 5.5e-15 CCDS33545.1 ITSN1 gene_id:6453|Hs108|chr21 (1721) 366 82.3 5.5e-15 CCDS1711.2 ITSN2 gene_id:50618|Hs108|chr2 (1670) 316 72.5 4.9e-12 CCDS1710.2 ITSN2 gene_id:50618|Hs108|chr2 (1697) 316 72.5 5e-12 CCDS6201.1 PREX2 gene_id:80243|Hs108|chr8 (1606) 305 70.3 2.1e-11 CCDS12592.1 ARHGEF1 gene_id:9138|Hs108|chr19 ( 879) 293 67.9 6.3e-11 CCDS12591.1 ARHGEF1 gene_id:9138|Hs108|chr19 ( 912) 293 67.9 6.6e-11 CCDS12590.1 ARHGEF1 gene_id:9138|Hs108|chr19 ( 927) 293 67.9 6.7e-11 >>CCDS41483.1 NET1 gene_id:10276|Hs108|chr10 (596 aa) initn: 3947 init1: 3947 opt: 3947 Z-score: 4197.2 bits: 786.6 E(32554): 0 Smith-Waterman score: 3947; 100.0% identity (100.0% similar) in 596 aa overlap (1-596:1-596) 10 20 30 40 50 60 pF1KB5 MEPELAAQKQPRPRRRSRRASGLSTEGATGPSADTSGSELDGRCSLRRGSSFTFLTPGPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 MEPELAAQKQPRPRRRSRRASGLSTEGATGPSADTSGSELDGRCSLRRGSSFTFLTPGPN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 WDFTLKRKRREKDDDVVSLSSLDLKEPSNKRVRPLARVTSLANLISPVRNGAVRRFGQTI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 WDFTLKRKRREKDDDVVSLSSLDLKEPSNKRVRPLARVTSLANLISPVRNGAVRRFGQTI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 QSFTLRGDHRSPASAQKFSSRSTVPTPAKRRSSALWSEMLDITMKESLTTREIRRQEAIY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 QSFTLRGDHRSPASAQKFSSRSTVPTPAKRRSSALWSEMLDITMKESLTTREIRRQEAIY 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 EMSRGEQDLIEDLKLARKAYHDPMLKLSIMSEEELTHIFGDLDSYIPLHEDLLTRIGEAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 EMSRGEQDLIEDLKLARKAYHDPMLKLSIMSEEELTHIFGDLDSYIPLHEDLLTRIGEAT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 KPDGTVEQIGHILVSWLPRLNAYRGYCSNQLAAKALLDQKKQDPRVQDFLQRCLESPFSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 KPDGTVEQIGHILVSWLPRLNAYRGYCSNQLAAKALLDQKKQDPRVQDFLQRCLESPFSR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 KLDLWSFLDIPRSRLVKYPLLLKEILKHTPKEHPDVQLLEDAILIIQGVLSDINLKKGES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 KLDLWSFLDIPRSRLVKYPLLLKEILKHTPKEHPDVQLLEDAILIIQGVLSDINLKKGES 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 ECQYYIDKLEYLDEKQRDPRIEASKVLLCHGELRSKSGHKLYIFLFQDILVLTRPVTRNE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 ECQYYIDKLEYLDEKQRDPRIEASKVLLCHGELRSKSGHKLYIFLFQDILVLTRPVTRNE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 RHSYQVYRQPIPVQELVLEDLQDGDVRMGGSFRGAFSNSEKAKNIFRIRFHDPSPAQSHT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 RHSYQVYRQPIPVQELVLEDLQDGDVRMGGSFRGAFSNSEKAKNIFRIRFHDPSPAQSHT 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB5 LQANDVFHKQQWFNCIRAAIAPFQSAGSPPELQGLPELHEECEGNHPSARKLTAQRRAST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 LQANDVFHKQQWFNCIRAAIAPFQSAGSPPELQGLPELHEECEGNHPSARKLTAQRRAST 490 500 510 520 530 540 550 560 570 580 590 pF1KB5 VSSVTQVEVDENAYRCGSGMQMAEDSKSLKTHQTQPGIRRARDKALSGGKRKETLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 VSSVTQVEVDENAYRCGSGMQMAEDSKSLKTHQTQPGIRRARDKALSGGKRKETLV 550 560 570 580 590 >>CCDS7067.1 NET1 gene_id:10276|Hs108|chr10 (542 aa) initn: 3393 init1: 3393 opt: 3393 Z-score: 3608.8 bits: 677.6 E(32554): 1.1e-194 Smith-Waterman score: 3393; 97.5% identity (98.3% similar) in 529 aa overlap (68-596:14-542) 40 50 60 70 80 90 pF1KB5 SELDGRCSLRRGSSFTFLTPGPNWDFTLKRKRREKDDDVVSLSSLDLKEPSNKRVRPLAR :: . :: . : . .:::::::::::: CCDS70 MVAHDETGGLLPIKRTIRVLDVNNQSFREQEEPSNKRVRPLAR 10 20 30 40 100 110 120 130 140 150 pF1KB5 VTSLANLISPVRNGAVRRFGQTIQSFTLRGDHRSPASAQKFSSRSTVPTPAKRRSSALWS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 VTSLANLISPVRNGAVRRFGQTIQSFTLRGDHRSPASAQKFSSRSTVPTPAKRRSSALWS 50 60 70 80 90 100 160 170 180 190 200 210 pF1KB5 EMLDITMKESLTTREIRRQEAIYEMSRGEQDLIEDLKLARKAYHDPMLKLSIMSEEELTH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 EMLDITMKESLTTREIRRQEAIYEMSRGEQDLIEDLKLARKAYHDPMLKLSIMSEEELTH 110 120 130 140 150 160 220 230 240 250 260 270 pF1KB5 IFGDLDSYIPLHEDLLTRIGEATKPDGTVEQIGHILVSWLPRLNAYRGYCSNQLAAKALL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 IFGDLDSYIPLHEDLLTRIGEATKPDGTVEQIGHILVSWLPRLNAYRGYCSNQLAAKALL 170 180 190 200 210 220 280 290 300 310 320 330 pF1KB5 DQKKQDPRVQDFLQRCLESPFSRKLDLWSFLDIPRSRLVKYPLLLKEILKHTPKEHPDVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 DQKKQDPRVQDFLQRCLESPFSRKLDLWSFLDIPRSRLVKYPLLLKEILKHTPKEHPDVQ 230 240 250 260 270 280 340 350 360 370 380 390 pF1KB5 LLEDAILIIQGVLSDINLKKGESECQYYIDKLEYLDEKQRDPRIEASKVLLCHGELRSKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 LLEDAILIIQGVLSDINLKKGESECQYYIDKLEYLDEKQRDPRIEASKVLLCHGELRSKS 290 300 310 320 330 340 400 410 420 430 440 450 pF1KB5 GHKLYIFLFQDILVLTRPVTRNERHSYQVYRQPIPVQELVLEDLQDGDVRMGGSFRGAFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 GHKLYIFLFQDILVLTRPVTRNERHSYQVYRQPIPVQELVLEDLQDGDVRMGGSFRGAFS 350 360 370 380 390 400 460 470 480 490 500 510 pF1KB5 NSEKAKNIFRIRFHDPSPAQSHTLQANDVFHKQQWFNCIRAAIAPFQSAGSPPELQGLPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 NSEKAKNIFRIRFHDPSPAQSHTLQANDVFHKQQWFNCIRAAIAPFQSAGSPPELQGLPE 410 420 430 440 450 460 520 530 540 550 560 570 pF1KB5 LHEECEGNHPSARKLTAQRRASTVSSVTQVEVDENAYRCGSGMQMAEDSKSLKTHQTQPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS70 LHEECEGNHPSARKLTAQRRASTVSSVTQVEVDENAYRCGSGMQMAEDSKSLKTHQTQPG 470 480 490 500 510 520 580 590 pF1KB5 IRRARDKALSGGKRKETLV ::::::::::::::::::: CCDS70 IRRARDKALSGGKRKETLV 530 540 >>CCDS46854.1 ARHGEF3 gene_id:50650|Hs108|chr3 (558 aa) initn: 1918 init1: 1693 opt: 1957 Z-score: 2081.9 bits: 395.1 E(32554): 1.2e-109 Smith-Waterman score: 1957; 62.5% identity (87.3% similar) in 456 aa overlap (47-499:25-479) 20 30 40 50 60 70 pF1KB5 SRRASGLSTEGATGPSADTSGSELDGRCSLRRGSSFTFLTPGPN-WDFT-LKRKRREKDD .: ..: . :.:. :.: :::. .:. CCDS46 MDSSTAMNQCSCRGMEENKERPKRQRQNNFP-MFPSPKAWNFRGRKRKQSTQDE 10 20 30 40 50 80 90 100 110 120 130 pF1KB5 DVVSLSSLDLKEPSNKRVRPLARVTSLANLISPVRNGAVRRFGQTIQ-SFTLRGDHRSPA :.::: :::..:::::::.::.::::::::: ::. ..::.::.: :...:.. : CCDS46 DAVSLCSLDISEPSNKRVKPLSRVTSLANLIPPVKATPLKRFSQTLQRSISFRSESRPDI 60 70 80 90 100 110 140 150 160 170 180 190 pF1KB5 SAQKFSSRSTVPTPAKRRSSALWSEMLDITMKESLTTREIRRQEAIYEMSRGEQDLIEDL : . ::...:. .:::.: :::: .:. ... ::..::.:::::.:.:.::.:::::: CCDS46 LAPRPWSRNAAPSSTKRRDSKLWSETFDVCVNQMLTSKEIKRQEAIFELSQGEEDLIEDL 120 130 140 150 160 170 200 210 220 230 240 250 pF1KB5 KLARKAYHDPMLKLSIMSEEELTHIFGDLDSYIPLHEDLLTRIGEATKPDGTVEQIGHIL :::.:::::::::::::.:.::..::: ::: :::::.::... .. ::::..:..: :: CCDS46 KLAKKAYHDPMLKLSIMTEQELNQIFGTLDSLIPLHEELLSQLRDVRKPDGSTEHVGPIL 180 190 200 210 220 230 260 270 280 290 300 310 pF1KB5 VSWLPRLNAYRGYCSNQLAAKALLDQKKQDPRVQDFLQRCLESPFSRKLDLWSFLDIPRS :.::: :..: .:::::.:::::::.:::: :::::::::::::::::::::.::::::: CCDS46 VGWLPCLSSYDSYCSNQVAAKALLDHKKQDHRVQDFLQRCLESPFSRKLDLWNFLDIPRS 240 250 260 270 280 290 320 330 340 350 360 370 pF1KB5 RLVKYPLLLKEILKHTPKEHPDVQLLEDAILIIQGVLSDINLKKGESECQYYIDKLEYLD :::::::::.:::.:::...:: : ::.:: ::::....:: : :::::.:: ..: ::. CCDS46 RLVKYPLLLREILRHTPNDNPDQQHLEEAINIIQGIVAEINTKTGESECRYYKERLLYLE 300 310 320 330 340 350 380 390 400 410 420 430 pF1KB5 EKQRDPRIEASKVLLCHGELRSKSGHKLYIFLFQDILVLTRPVTRNERHSYQVYRQPIPV : :.: :..:.:: :::::... : ::..::::..::.:: ::.::. ::.::::::: CCDS46 EGQKDSLIDSSRVLCCHGELKNNRGVKLHVFLFQEVLVITRAVTHNEQLCYQLYRQPIPV 360 370 380 390 400 410 440 450 460 470 480 490 pF1KB5 QELVLEDLQDGDVRMGGSFRGAFSNSEKAKNIFRIRFHDPSPAQSHTLQANDVFHKQQWF ..:.:::::::.::.:::.::::::.:. ::.::. :.. : .:.:.:::::.:.::::. CCDS46 KDLLLEDLQDGEVRLGGSLRGAFSNNERIKNFFRVSFKNGSQSQTHSLQANDTFNKQQWL 420 430 440 450 460 470 500 510 520 530 540 550 pF1KB5 NCIRAAIAPFQSAGSPPELQGLPELHEECEGNHPSARKLTAQRRASTVSSVTQVEVDENA :::: : CCDS46 NCIRQAKETVLCAAGQAGVLDSEGSFLNPTTGSRELQGETKLEQMDQSDSESDCSMDTSE 480 490 500 510 520 530 >>CCDS74948.1 ARHGEF3 gene_id:50650|Hs108|chr3 (532 aa) initn: 1918 init1: 1693 opt: 1936 Z-score: 2059.9 bits: 391.0 E(32554): 2e-108 Smith-Waterman score: 1936; 64.1% identity (88.5% similar) in 435 aa overlap (66-499:19-453) 40 50 60 70 80 90 pF1KB5 SGSELDGRCSLRRGSSFTFLTPGPNWDFTLKRKRREKDDDVVSLSSLDLKEPSNKRVRPL :::. .:.:.::: :::..:::::::.:: CCDS74 MRSERPMVWCCLFVRSQRKRKQSTQDEDAVSLCSLDISEPSNKRVKPL 10 20 30 40 100 110 120 130 140 150 pF1KB5 ARVTSLANLISPVRNGAVRRFGQTIQ-SFTLRGDHRSPASAQKFSSRSTVPTPAKRRSSA .::::::::: ::. ..::.::.: :...:.. : : . ::...:. .:::.: CCDS74 SRVTSLANLIPPVKATPLKRFSQTLQRSISFRSESRPDILAPRPWSRNAAPSSTKRRDSK 50 60 70 80 90 100 160 170 180 190 200 210 pF1KB5 LWSEMLDITMKESLTTREIRRQEAIYEMSRGEQDLIEDLKLARKAYHDPMLKLSIMSEEE :::: .:. ... ::..::.:::::.:.:.::.:::::::::.:::::::::::::.:.: CCDS74 LWSETFDVCVNQMLTSKEIKRQEAIFELSQGEEDLIEDLKLAKKAYHDPMLKLSIMTEQE 110 120 130 140 150 160 220 230 240 250 260 270 pF1KB5 LTHIFGDLDSYIPLHEDLLTRIGEATKPDGTVEQIGHILVSWLPRLNAYRGYCSNQLAAK :..::: ::: :::::.::... .. ::::..:..: :::.::: :..: .:::::.::: CCDS74 LNQIFGTLDSLIPLHEELLSQLRDVRKPDGSTEHVGPILVGWLPCLSSYDSYCSNQVAAK 170 180 190 200 210 220 280 290 300 310 320 330 pF1KB5 ALLDQKKQDPRVQDFLQRCLESPFSRKLDLWSFLDIPRSRLVKYPLLLKEILKHTPKEHP ::::.:::: :::::::::::::::::::::.::::::::::::::::.:::.:::...: CCDS74 ALLDHKKQDHRVQDFLQRCLESPFSRKLDLWNFLDIPRSRLVKYPLLLREILRHTPNDNP 230 240 250 260 270 280 340 350 360 370 380 390 pF1KB5 DVQLLEDAILIIQGVLSDINLKKGESECQYYIDKLEYLDEKQRDPRIEASKVLLCHGELR : : ::.:: ::::....:: : :::::.:: ..: ::.: :.: :..:.:: :::::. CCDS74 DQQHLEEAINIIQGIVAEINTKTGESECRYYKERLLYLEEGQKDSLIDSSRVLCCHGELK 290 300 310 320 330 340 400 410 420 430 440 450 pF1KB5 SKSGHKLYIFLFQDILVLTRPVTRNERHSYQVYRQPIPVQELVLEDLQDGDVRMGGSFRG .. : ::..::::..::.:: ::.::. ::.:::::::..:.:::::::.::.:::.:: CCDS74 NNRGVKLHVFLFQEVLVITRAVTHNEQLCYQLYRQPIPVKDLLLEDLQDGEVRLGGSLRG 350 360 370 380 390 400 460 470 480 490 500 510 pF1KB5 AFSNSEKAKNIFRIRFHDPSPAQSHTLQANDVFHKQQWFNCIRAAIAPFQSAGSPPELQG ::::.:. ::.::. :.. : .:.:.:::::.:.::::.:::: : CCDS74 AFSNNERIKNFFRVSFKNGSQSQTHSLQANDTFNKQQWLNCIRQAKETVLCAAGQAGVLD 410 420 430 440 450 460 520 530 540 550 560 570 pF1KB5 LPELHEECEGNHPSARKLTAQRRASTVSSVTQVEVDENAYRCGSGMQMAEDSKSLKTHQT CCDS74 SEGSFLNPTTGSRELQGETKLEQMDQSDSESDCSMDTSEVSLDCERMEQTDSSCGNSRHG 470 480 490 500 510 520 >>CCDS2878.1 ARHGEF3 gene_id:50650|Hs108|chr3 (526 aa) initn: 1853 init1: 1693 opt: 1873 Z-score: 1993.0 bits: 378.6 E(32554): 1.1e-104 Smith-Waterman score: 1873; 62.3% identity (86.5% similar) in 438 aa overlap (63-499:10-447) 40 50 60 70 80 90 pF1KB5 ADTSGSELDGRCSLRRGSSFTFLTPGPNWDFTLKRKRREKDDDVVSLSSLDLKEPSNKRV .:.:: . .: . : .::::::: CCDS28 MVAKDYPFYLTVKRANCSLELPPASGPAKDAEEPSNKRV 10 20 30 100 110 120 130 140 150 pF1KB5 RPLARVTSLANLISPVRNGAVRRFGQTIQ-SFTLRGDHRSPASAQKFSSRSTVPTPAKRR .::.::::::::: ::. ..::.::.: :...:.. : : . ::...:. .::: CCDS28 KPLSRVTSLANLIPPVKATPLKRFSQTLQRSISFRSESRPDILAPRPWSRNAAPSSTKRR 40 50 60 70 80 90 160 170 180 190 200 210 pF1KB5 SSALWSEMLDITMKESLTTREIRRQEAIYEMSRGEQDLIEDLKLARKAYHDPMLKLSIMS .: :::: .:. ... ::..::.:::::.:.:.::.:::::::::.:::::::::::::. CCDS28 DSKLWSETFDVCVNQMLTSKEIKRQEAIFELSQGEEDLIEDLKLAKKAYHDPMLKLSIMT 100 110 120 130 140 150 220 230 240 250 260 270 pF1KB5 EEELTHIFGDLDSYIPLHEDLLTRIGEATKPDGTVEQIGHILVSWLPRLNAYRGYCSNQL :.::..::: ::: :::::.::... .. ::::..:..: :::.::: :..: .:::::. CCDS28 EQELNQIFGTLDSLIPLHEELLSQLRDVRKPDGSTEHVGPILVGWLPCLSSYDSYCSNQV 160 170 180 190 200 210 280 290 300 310 320 330 pF1KB5 AAKALLDQKKQDPRVQDFLQRCLESPFSRKLDLWSFLDIPRSRLVKYPLLLKEILKHTPK :::::::.:::: :::::::::::::::::::::.::::::::::::::::.:::.:::. CCDS28 AAKALLDHKKQDHRVQDFLQRCLESPFSRKLDLWNFLDIPRSRLVKYPLLLREILRHTPN 220 230 240 250 260 270 340 350 360 370 380 390 pF1KB5 EHPDVQLLEDAILIIQGVLSDINLKKGESECQYYIDKLEYLDEKQRDPRIEASKVLLCHG ..:: : ::.:: ::::....:: : :::::.:: ..: ::.: :.: :..:.:: ::: CCDS28 DNPDQQHLEEAINIIQGIVAEINTKTGESECRYYKERLLYLEEGQKDSLIDSSRVLCCHG 280 290 300 310 320 330 400 410 420 430 440 450 pF1KB5 ELRSKSGHKLYIFLFQDILVLTRPVTRNERHSYQVYRQPIPVQELVLEDLQDGDVRMGGS ::... : ::..::::..::.:: ::.::. ::.:::::::..:.:::::::.::.::: CCDS28 ELKNNRGVKLHVFLFQEVLVITRAVTHNEQLCYQLYRQPIPVKDLLLEDLQDGEVRLGGS 340 350 360 370 380 390 460 470 480 490 500 510 pF1KB5 FRGAFSNSEKAKNIFRIRFHDPSPAQSHTLQANDVFHKQQWFNCIRAAIAPFQSAGSPPE .::::::.:. ::.::. :.. : .:.:.:::::.:.::::.:::: : CCDS28 LRGAFSNNERIKNFFRVSFKNGSQSQTHSLQANDTFNKQQWLNCIRQAKETVLCAAGQAG 400 410 420 430 440 450 520 530 540 550 560 570 pF1KB5 LQGLPELHEECEGNHPSARKLTAQRRASTVSSVTQVEVDENAYRCGSGMQMAEDSKSLKT CCDS28 VLDSEGSFLNPTTGSRELQGETKLEQMDQSDSESDCSMDTSEVSLDCERMEQTDSSCGNS 460 470 480 490 500 510 >>CCDS46855.1 ARHGEF3 gene_id:50650|Hs108|chr3 (532 aa) initn: 1849 init1: 1693 opt: 1867 Z-score: 1986.5 bits: 377.4 E(32554): 2.5e-104 Smith-Waterman score: 1867; 64.4% identity (88.7% similar) in 416 aa overlap (85-499:38-453) 60 70 80 90 100 110 pF1KB5 LTPGPNWDFTLKRKRREKDDDVVSLSSLDLKEPSNKRVRPLARVTSLANLISPVRNGAVR .:::::::.::.::::::::: ::. .. CCDS46 NWLLWLCPSKFGIFMCCLASTTGQMELRRTREPSNKRVKPLSRVTSLANLIPPVKATPLK 10 20 30 40 50 60 120 130 140 150 160 170 pF1KB5 RFGQTIQ-SFTLRGDHRSPASAQKFSSRSTVPTPAKRRSSALWSEMLDITMKESLTTREI ::.::.: :...:.. : : . ::...:. .:::.: :::: .:. ... ::..:: CCDS46 RFSQTLQRSISFRSESRPDILAPRPWSRNAAPSSTKRRDSKLWSETFDVCVNQMLTSKEI 70 80 90 100 110 120 180 190 200 210 220 230 pF1KB5 RRQEAIYEMSRGEQDLIEDLKLARKAYHDPMLKLSIMSEEELTHIFGDLDSYIPLHEDLL .:::::.:.:.::.:::::::::.:::::::::::::.:.::..::: ::: :::::.:: CCDS46 KRQEAIFELSQGEEDLIEDLKLAKKAYHDPMLKLSIMTEQELNQIFGTLDSLIPLHEELL 130 140 150 160 170 180 240 250 260 270 280 290 pF1KB5 TRIGEATKPDGTVEQIGHILVSWLPRLNAYRGYCSNQLAAKALLDQKKQDPRVQDFLQRC ... .. ::::..:..: :::.::: :..: .:::::.:::::::.:::: ::::::::: CCDS46 SQLRDVRKPDGSTEHVGPILVGWLPCLSSYDSYCSNQVAAKALLDHKKQDHRVQDFLQRC 190 200 210 220 230 240 300 310 320 330 340 350 pF1KB5 LESPFSRKLDLWSFLDIPRSRLVKYPLLLKEILKHTPKEHPDVQLLEDAILIIQGVLSDI ::::::::::::.::::::::::::::::.:::.:::...:: : ::.:: ::::....: CCDS46 LESPFSRKLDLWNFLDIPRSRLVKYPLLLREILRHTPNDNPDQQHLEEAINIIQGIVAEI 250 260 270 280 290 300 360 370 380 390 400 410 pF1KB5 NLKKGESECQYYIDKLEYLDEKQRDPRIEASKVLLCHGELRSKSGHKLYIFLFQDILVLT : : :::::.:: ..: ::.: :.: :..:.:: :::::... : ::..::::..::.: CCDS46 NTKTGESECRYYKERLLYLEEGQKDSLIDSSRVLCCHGELKNNRGVKLHVFLFQEVLVIT 310 320 330 340 350 360 420 430 440 450 460 470 pF1KB5 RPVTRNERHSYQVYRQPIPVQELVLEDLQDGDVRMGGSFRGAFSNSEKAKNIFRIRFHDP : ::.::. ::.:::::::..:.:::::::.::.:::.::::::.:. ::.::. :.. CCDS46 RAVTHNEQLCYQLYRQPIPVKDLLLEDLQDGEVRLGGSLRGAFSNNERIKNFFRVSFKNG 370 380 390 400 410 420 480 490 500 510 520 530 pF1KB5 SPAQSHTLQANDVFHKQQWFNCIRAAIAPFQSAGSPPELQGLPELHEECEGNHPSARKLT : .:.:.:::::.:.::::.:::: : CCDS46 SQSQTHSLQANDTFNKQQWLNCIRQAKETVLCAAGQAGVLDSEGSFLNPTTGSRELQGET 430 440 450 460 470 480 >>CCDS82664.1 ITSN1 gene_id:6453|Hs108|chr21 (1716 aa) initn: 260 init1: 126 opt: 366 Z-score: 382.5 bits: 82.3 E(32554): 5.5e-15 Smith-Waterman score: 415; 25.1% identity (54.8% similar) in 529 aa overlap (15-499:1069-1564) 10 20 30 40 pF1KB5 MEPELAAQKQPRPRRRSRRASGLSTEGATGPSADTSGSELDGRC .. . :. ... :::: : . :. CCDS82 GDKAGVFPSNYVRLKDSEGSGTAGKTGSLGKKPEIAQVIASYTATGPEQLTLA---PGQL 1040 1050 1060 1070 1080 1090 50 60 70 80 90 100 pF1KB5 SLRRGSSFTFLTPGPNWDFTLKRKRREKDDDVVSLSSLDLKEPSNKRVRPLA--RVTSLA : : .. :: :. :. . .... . . : :..... : . :.:: CCDS82 ILIRKKN-----PGGWWEGELQARGKKRQIGWFPANYVKLLSPGTSKITPTEPPKSTALA 1100 1110 1120 1130 1140 1150 110 120 130 140 pF1KB5 NLISPV-------RNGAVRRF--GQTIQSFTLRGDH--RSPASAQK--FSSRSTVPTPAK . . . .: : :: :. .. . .. ...: : : . : . CCDS82 AVCQVIGMYDYTAQNDDELAFNKGQIINVLNKEDPDWWKGEVNGQVGLFPS-NYVKLTTD 1160 1170 1180 1190 1200 150 160 170 180 190 200 pF1KB5 RRSSALWSEMLDITMKESLTTREIRRQEAIYEMSRGEQDLIEDLKLARKAYHDPMLKLSI : : :. . . :: : .:: :.:. :.. ..::.:. . .. :... . CCDS82 MDPSQQWCS--DLHLLDMLTPTERKRQGYIHELIVTEENYVNDLQLVTEIFQKPLMESEL 1210 1220 1230 1240 1250 1260 210 220 230 240 250 260 pF1KB5 MSEEELTHIFGDLDSYIPLHEDLLTRIGEATKPDGT---VEQIGHILVSWLPRLNAYRGY ..:.:.. :: . : . :: . : .: :..:: :: . ::... : . CCDS82 LTEKEVAMIFVNWKELIMCNIKLLKALRVRKKMSGEKMPVKMIGDILSAQLPHMQPYIRF 1270 1280 1290 1300 1310 1320 270 280 290 300 310 320 pF1KB5 CSNQLAAKALLDQKKQD-PRVQDFLQRCLESPFSRKLDLWSFLDIPRSRLVKYPLLLKEI :: :: . ::..:: .. : ..:..: .: . . : ::. : .:...:::..:.: CCDS82 CSRQLNGAALIQQKTDEAPDFKEFVKRLAMDPRCKGMPLSSFILKPMQRVTRYPLIIKNI 1330 1340 1350 1360 1370 1380 330 340 350 360 370 380 pF1KB5 LKHTPKEHPDVQLLEDAILIIQGVLSDINLKKGESECQYYIDKLEYLDEKQR----DPRI :..::..::: . :. :. . . :..: :.: . :.::... . . . .. CCDS82 LENTPENHPDHSHLKHALEKAEELCSQVNEGVREKENS---DRLEWIQAHVQCEGLSEQL 1390 1400 1410 1420 1430 1440 390 400 410 420 pF1KB5 EASKVLLC-------H-GEL-RSKSGHKLYIFLFQDILVLT---RPV---------TRNE ..: : : :.: ..::...:: :::.:.:.:: .:. . . CCDS82 VFNSVTNCLGPRKFLHSGKLYKAKSNKELYGFLFNDFLLLTQITKPLGSSGTDKVFSPKS 1450 1460 1470 1480 1490 1500 430 440 450 460 470 480 pF1KB5 RHSYQVYRQPIPVQELVLEDLQDGDVRMGGSFRGAFSNSEKAKNIFRIRFHDPSPAQSHT .:..:. :: ..:.... : :..: ::.: : . .: CCDS82 NLQYKMYKTPIFLNEVLVKLPTDP------------SGDEP---IFHISHID----RVYT 1510 1520 1530 1540 490 500 510 520 530 540 pF1KB5 LQANDVFHKQQWFNCIRAAIAPFQSAGSPPELQGLPELHEECEGNHPSARKLTAQRRAST :.:... .. : . :.:: CCDS82 LRAESINERTAWVQKIKAASELYIETEKKKREKAYLVRSQRATGIGRLMVNVVEGIELKP 1550 1560 1570 1580 1590 1600 >>CCDS33545.1 ITSN1 gene_id:6453|Hs108|chr21 (1721 aa) initn: 260 init1: 126 opt: 366 Z-score: 382.5 bits: 82.3 E(32554): 5.5e-15 Smith-Waterman score: 415; 25.1% identity (54.8% similar) in 529 aa overlap (15-499:1074-1569) 10 20 30 40 pF1KB5 MEPELAAQKQPRPRRRSRRASGLSTEGATGPSADTSGSELDGRC .. . :. ... :::: : . :. CCDS33 GDKAGVFPSNYVRLKDSEGSGTAGKTGSLGKKPEIAQVIASYTATGPEQLTLA---PGQL 1050 1060 1070 1080 1090 1100 50 60 70 80 90 100 pF1KB5 SLRRGSSFTFLTPGPNWDFTLKRKRREKDDDVVSLSSLDLKEPSNKRVRPLA--RVTSLA : : .. :: :. :. . .... . . : :..... : . :.:: CCDS33 ILIRKKN-----PGGWWEGELQARGKKRQIGWFPANYVKLLSPGTSKITPTEPPKSTALA 1110 1120 1130 1140 1150 110 120 130 140 pF1KB5 NLISPV-------RNGAVRRF--GQTIQSFTLRGDH--RSPASAQK--FSSRSTVPTPAK . . . .: : :: :. .. . .. ...: : : . : . CCDS33 AVCQVIGMYDYTAQNDDELAFNKGQIINVLNKEDPDWWKGEVNGQVGLFPS-NYVKLTTD 1160 1170 1180 1190 1200 1210 150 160 170 180 190 200 pF1KB5 RRSSALWSEMLDITMKESLTTREIRRQEAIYEMSRGEQDLIEDLKLARKAYHDPMLKLSI : : :. . . :: : .:: :.:. :.. ..::.:. . .. :... . CCDS33 MDPSQQWCS--DLHLLDMLTPTERKRQGYIHELIVTEENYVNDLQLVTEIFQKPLMESEL 1220 1230 1240 1250 1260 1270 210 220 230 240 250 260 pF1KB5 MSEEELTHIFGDLDSYIPLHEDLLTRIGEATKPDGT---VEQIGHILVSWLPRLNAYRGY ..:.:.. :: . : . :: . : .: :..:: :: . ::... : . CCDS33 LTEKEVAMIFVNWKELIMCNIKLLKALRVRKKMSGEKMPVKMIGDILSAQLPHMQPYIRF 1280 1290 1300 1310 1320 1330 270 280 290 300 310 320 pF1KB5 CSNQLAAKALLDQKKQD-PRVQDFLQRCLESPFSRKLDLWSFLDIPRSRLVKYPLLLKEI :: :: . ::..:: .. : ..:..: .: . . : ::. : .:...:::..:.: CCDS33 CSRQLNGAALIQQKTDEAPDFKEFVKRLAMDPRCKGMPLSSFILKPMQRVTRYPLIIKNI 1340 1350 1360 1370 1380 1390 330 340 350 360 370 380 pF1KB5 LKHTPKEHPDVQLLEDAILIIQGVLSDINLKKGESECQYYIDKLEYLDEKQR----DPRI :..::..::: . :. :. . . :..: :.: . :.::... . . . .. CCDS33 LENTPENHPDHSHLKHALEKAEELCSQVNEGVREKENS---DRLEWIQAHVQCEGLSEQL 1400 1410 1420 1430 1440 390 400 410 420 pF1KB5 EASKVLLC-------H-GEL-RSKSGHKLYIFLFQDILVLT---RPV---------TRNE ..: : : :.: ..::...:: :::.:.:.:: .:. . . CCDS33 VFNSVTNCLGPRKFLHSGKLYKAKSNKELYGFLFNDFLLLTQITKPLGSSGTDKVFSPKS 1450 1460 1470 1480 1490 1500 430 440 450 460 470 480 pF1KB5 RHSYQVYRQPIPVQELVLEDLQDGDVRMGGSFRGAFSNSEKAKNIFRIRFHDPSPAQSHT .:..:. :: ..:.... : :..: ::.: : . .: CCDS33 NLQYKMYKTPIFLNEVLVKLPTDP------------SGDEP---IFHISHID----RVYT 1510 1520 1530 1540 1550 490 500 510 520 530 540 pF1KB5 LQANDVFHKQQWFNCIRAAIAPFQSAGSPPELQGLPELHEECEGNHPSARKLTAQRRAST :.:... .. : . :.:: CCDS33 LRAESINERTAWVQKIKAASELYIETEKKKREKAYLVRSQRATGIGRLMVNVVEGIELKP 1560 1570 1580 1590 1600 1610 >>CCDS1711.2 ITSN2 gene_id:50618|Hs108|chr2 (1670 aa) initn: 262 init1: 130 opt: 316 Z-score: 329.5 bits: 72.5 E(32554): 4.9e-12 Smith-Waterman score: 365; 25.1% identity (53.4% similar) in 522 aa overlap (20-499:1023-1515) 10 20 30 40 pF1KB5 MEPELAAQKQPRPRRRSRRASGLSTEGATGPSADT-SGSELDGRCSLRR ::. . : : :: . :::: . :: CCDS17 GSIGDRSGIFPSNYVKPKDQESFGSASKSGASNKKPEIAQVTSAYVASGSE---QLSLAP 1000 1010 1020 1030 1040 50 60 70 80 90 100 pF1KB5 GSSFTFLTPGPN--WDFTLKRKRREKDDDVVSLSSLDLKEPSNKRV----RPLARVTSLA :. . .: . . :. :. . .... : . : ::..:. .:. .: .. CCDS17 GQLILILKKNTSGWWQGELQARGKKRQKGWFPASHVKLLGPSSERATPAFHPVCQVIAMY 1050 1060 1070 1080 1090 1100 110 120 130 140 150 pF1KB5 NLISPVRNGAVRRFGQTIQSFTLRGDHRSPASAQKFSSRSTVPTPAKRRS-----SALWS . . .. :: :. .. : . ... . . :. . . : : CCDS17 DYAANNEDELSFSKGQLIN--VMNKDDPDWWQGEINGVTGLFPSNYVKMTTDSDPSQQWC 1110 1120 1130 1140 1150 1160 160 170 180 190 200 210 pF1KB5 EMLDITMKESLTTREIRRQEAIYEMSRGEQDLIEDLKLARKAYHDPMLKLSIMSEEELTH :. ... : .:: :.:. . :. . ::.:. .... : . ....: :.. CCDS17 A--DLQTLDTMQPIERKRQGYIHELIQTEERYMADLQLVVEVFQKRMAESGFLTEGEMAL 1170 1180 1190 1200 1210 1220 220 230 240 250 260 270 pF1KB5 IFGDLDSYIPLHEDLLTRIGEATKPDGT---VEQIGHILVSWLPRLNAYRGYCSNQLAAK :: . : . :: . : : :..:: ::.. : ...:: .:: :: . CCDS17 IFVNWKELIMSNTKLLKALRVRKKTGGEKMPVQMIGDILAAELSHMQAYIRFCSCQLNGA 1230 1240 1250 1260 1270 1280 280 290 300 310 320 330 pF1KB5 ALLDQKK-QDPRVQDFLQRCLESPFSRKLDLWSFLDIPRSRLVKYPLLLKEILKHTPKEH :::.:: .: ..::.. .: . . : ::: : .:...::::.. ::..::. : CCDS17 ALLQQKTDEDTDFKEFLKKLASDPRCKGMPLSSFLLKPMQRITRYPLLIRSILENTPESH 1290 1300 1310 1320 1330 1340 340 350 360 370 380 pF1KB5 PDVQLLEDAILIIQGVLSDINLKKGESECQYYIDKLEYLD-----EKQRDPRIEAS---- : . :. :. . . :..: :.: . :.::... : . : : CCDS17 ADHSSLKLALERAEELCSQVNEGVREKENS---DRLEWIQAHVQCEGLAEQLIFNSLTNC 1350 1360 1370 1380 1390 1400 390 400 410 420 pF1KB5 ---KVLLCHGEL-RSKSGHKLYIFLFQDILVLTRPVTR------NER-------HSYQVY . :: :.: ..::...:. :::.:.:.:: : . .:. ....: CCDS17 LGPRKLLHSGKLYKTKSNKELHGFLFNDFLLLTYMVKQFAVSSGSEKLFSSKSNAQFKMY 1410 1420 1430 1440 1450 1460 430 440 450 460 470 480 pF1KB5 RQPIPVQELVLEDLQDGDVRMGGSFRGAFSNSEKAKNIFRIRFHDPSPAQSHTLQANDVF . :: ..:.... : :..: .:.: : . .::..... CCDS17 KTPIFLNEVLVKLPTDP------------SSDEP---VFHISHID----RVYTLRTDNIN 1470 1480 1490 1500 490 500 510 520 530 540 pF1KB5 HKQQWFNCIRAAIAPFQSAGSPPELQGLPELHEECEGNHPSARKLTAQRRASTVSSVTQV .. : . :.:: CCDS17 ERTAWVQKIKAASEQYIDTEKKKREKAYQARSQKTSGIGRLMVHVIEATELKACKPNGKS 1510 1520 1530 1540 1550 1560 >>CCDS1710.2 ITSN2 gene_id:50618|Hs108|chr2 (1697 aa) initn: 262 init1: 130 opt: 316 Z-score: 329.4 bits: 72.5 E(32554): 5e-12 Smith-Waterman score: 365; 25.1% identity (53.4% similar) in 522 aa overlap (20-499:1050-1542) 10 20 30 40 pF1KB5 MEPELAAQKQPRPRRRSRRASGLSTEGATGPSADT-SGSELDGRCSLRR ::. . : : :: . :::: . :: CCDS17 GSIGDRSGIFPSNYVKPKDQESFGSASKSGASNKKPEIAQVTSAYVASGSE---QLSLAP 1020 1030 1040 1050 1060 1070 50 60 70 80 90 100 pF1KB5 GSSFTFLTPGPN--WDFTLKRKRREKDDDVVSLSSLDLKEPSNKRV----RPLARVTSLA :. . .: . . :. :. . .... : . : ::..:. .:. .: .. CCDS17 GQLILILKKNTSGWWQGELQARGKKRQKGWFPASHVKLLGPSSERATPAFHPVCQVIAMY 1080 1090 1100 1110 1120 1130 110 120 130 140 150 pF1KB5 NLISPVRNGAVRRFGQTIQSFTLRGDHRSPASAQKFSSRSTVPTPAKRRS-----SALWS . . .. :: :. .. : . ... . . :. . . : : CCDS17 DYAANNEDELSFSKGQLIN--VMNKDDPDWWQGEINGVTGLFPSNYVKMTTDSDPSQQWC 1140 1150 1160 1170 1180 1190 160 170 180 190 200 210 pF1KB5 EMLDITMKESLTTREIRRQEAIYEMSRGEQDLIEDLKLARKAYHDPMLKLSIMSEEELTH :. ... : .:: :.:. . :. . ::.:. .... : . ....: :.. CCDS17 A--DLQTLDTMQPIERKRQGYIHELIQTEERYMADLQLVVEVFQKRMAESGFLTEGEMAL 1200 1210 1220 1230 1240 1250 220 230 240 250 260 270 pF1KB5 IFGDLDSYIPLHEDLLTRIGEATKPDGT---VEQIGHILVSWLPRLNAYRGYCSNQLAAK :: . : . :: . : : :..:: ::.. : ...:: .:: :: . CCDS17 IFVNWKELIMSNTKLLKALRVRKKTGGEKMPVQMIGDILAAELSHMQAYIRFCSCQLNGA 1260 1270 1280 1290 1300 1310 280 290 300 310 320 330 pF1KB5 ALLDQKK-QDPRVQDFLQRCLESPFSRKLDLWSFLDIPRSRLVKYPLLLKEILKHTPKEH :::.:: .: ..::.. .: . . : ::: : .:...::::.. ::..::. : CCDS17 ALLQQKTDEDTDFKEFLKKLASDPRCKGMPLSSFLLKPMQRITRYPLLIRSILENTPESH 1320 1330 1340 1350 1360 1370 340 350 360 370 380 pF1KB5 PDVQLLEDAILIIQGVLSDINLKKGESECQYYIDKLEYLD-----EKQRDPRIEAS---- : . :. :. . . :..: :.: . :.::... : . : : CCDS17 ADHSSLKLALERAEELCSQVNEGVREKENS---DRLEWIQAHVQCEGLAEQLIFNSLTNC 1380 1390 1400 1410 1420 390 400 410 420 pF1KB5 ---KVLLCHGEL-RSKSGHKLYIFLFQDILVLTRPVTR------NER-------HSYQVY . :: :.: ..::...:. :::.:.:.:: : . .:. ....: CCDS17 LGPRKLLHSGKLYKTKSNKELHGFLFNDFLLLTYMVKQFAVSSGSEKLFSSKSNAQFKMY 1430 1440 1450 1460 1470 1480 430 440 450 460 470 480 pF1KB5 RQPIPVQELVLEDLQDGDVRMGGSFRGAFSNSEKAKNIFRIRFHDPSPAQSHTLQANDVF . :: ..:.... : :..: .:.: : . .::..... CCDS17 KTPIFLNEVLVKLPTDP------------SSDEP---VFHISHID----RVYTLRTDNIN 1490 1500 1510 1520 1530 490 500 510 520 530 540 pF1KB5 HKQQWFNCIRAAIAPFQSAGSPPELQGLPELHEECEGNHPSARKLTAQRRASTVSSVTQV .. : . :.:: CCDS17 ERTAWVQKIKAASEQYIDTEKKKREKAYQARSQKTSGIGRLMVHVIEATELKACKPNGKS 1540 1550 1560 1570 1580 1590 596 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 21:36:37 2016 done: Sat Nov 5 21:36:38 2016 Total Scan time: 2.790 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]