FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9590, 405 aa 1>>>pF1KB9590 405 - 405 aa - 405 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.7479+/-0.000849; mu= 11.3026+/- 0.052 mean_var=99.7563+/-19.982, 0's: 0 Z-trim(109.3): 20 B-trim: 495 in 1/52 Lambda= 0.128412 statistics sampled from 10764 (10778) to 10764 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.682), E-opt: 0.2 (0.331), width: 16 Scan time: 3.060 The best scores are: opt bits E(32554) CCDS14636.2 TFDP3 gene_id:51270|Hs108|chrX ( 405) 2641 499.4 2.4e-141 CCDS9538.1 TFDP1 gene_id:7027|Hs108|chr13 ( 410) 1894 361.0 1.1e-99 CCDS54650.1 TFDP2 gene_id:7029|Hs108|chr3 ( 446) 1029 200.8 2.1e-51 CCDS43159.1 TFDP2 gene_id:7029|Hs108|chr3 ( 386) 1017 198.6 8.6e-51 CCDS54648.1 TFDP2 gene_id:7029|Hs108|chr3 ( 418) 1011 197.5 2e-50 CCDS54649.1 TFDP2 gene_id:7029|Hs108|chr3 ( 349) 1008 196.9 2.5e-50 CCDS54647.1 TFDP2 gene_id:7029|Hs108|chr3 ( 310) 952 186.5 3e-47 >>CCDS14636.2 TFDP3 gene_id:51270|Hs108|chrX (405 aa) initn: 2641 init1: 2641 opt: 2641 Z-score: 2651.0 bits: 499.4 E(32554): 2.4e-141 Smith-Waterman score: 2641; 100.0% identity (100.0% similar) in 405 aa overlap (1-405:1-405) 10 20 30 40 50 60 pF1KB9 MAKYVSLTEANEELKVLMDENQTSRPVAVHTSTVNPLGKQLLPKTFGQSSVNIDQQVVIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MAKYVSLTEANEELKVLMDENQTSRPVAVHTSTVNPLGKQLLPKTFGQSSVNIDQQVVIG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 MPQRPAASNIPVVGSPNPPSTHFASQNQHSYSSPPWAGQHNRKGEKNGMGLCRLSMKVWE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MPQRPAASNIPVVGSPNPPSTHFASQNQHSYSSPPWAGQHNRKGEKNGMGLCRLSMKVWE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 TVQRKGTTSCQEVVGELVAKFRAASNHASPNESAYDVKNIKRRTYDALNVLMAMNIISRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 TVQRKGTTSCQEVVGELVAKFRAASNHASPNESAYDVKNIKRRTYDALNVLMAMNIISRE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 KKKIKWIGLTTNSAQNCQNLRVERQKRLERIKQKQSELQQLILQQIAFKNLVLRNQYVEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 KKKIKWIGLTTNSAQNCQNLRVERQKRLERIKQKQSELQQLILQQIAFKNLVLRNQYVEE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 QVSQRPLPNSVIHVPFIIISSSKKTVINCSISDDKSEYLFKFNSSFEIHDDTEVLMWMGM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 QVSQRPLPNSVIHVPFIIISSSKKTVINCSISDDKSEYLFKFNSSFEIHDDTEVLMWMGM 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 TFGLESGSCSAEDLKMARNLVPKALEPYVTEMAQGTFGGVFTTAGSRSNGTWLSASDLTN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 TFGLESGSCSAEDLKMARNLVPKALEPYVTEMAQGTFGGVFTTAGSRSNGTWLSASDLTN 310 320 330 340 350 360 370 380 390 400 pF1KB9 IAIGMLATSSGGSQYSGSRVETPAVEEEEEEDNNDDDLSENDEDD ::::::::::::::::::::::::::::::::::::::::::::: CCDS14 IAIGMLATSSGGSQYSGSRVETPAVEEEEEEDNNDDDLSENDEDD 370 380 390 400 >>CCDS9538.1 TFDP1 gene_id:7027|Hs108|chr13 (410 aa) initn: 1702 init1: 1640 opt: 1894 Z-score: 1903.0 bits: 361.0 E(32554): 1.1e-99 Smith-Waterman score: 1894; 75.2% identity (87.3% similar) in 411 aa overlap (1-405:1-410) 10 20 30 40 50 pF1KB9 MAKYVSLTEANEELKVLMDENQTSRP-----VAVHTSTVNPLGKQLLPKTFGQSSVNIDQ ::: ..: ::: ::::..:.: . :::: ::::::::::::::::::.::: : CCDS95 MAKDAGLIEANGELKVFIDQNLSPGKGVVSLVAVHPSTVNPLGKQLLPKTFGQSNVNIAQ 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB9 QVVIGMPQRPAASNIPVVGSPNPPSTHFASQNQHSYSSPPWAGQHNRKGEKNGMGLCRLS ::::: :::::::: :::::. :::::::::: : ::: ::..:::::::: :: ..: CCDS95 QVVIGTPQRPAASNTLVVGSPHTPSTHFASQNQPSDSSPWSAGKRNRKGEKNGKGLRHFS 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB9 MKVWETVQRKGTTSCQEVVGELVAKFRAASNHASPNESAYDVKNIKRRTYDALNVLMAMN ::: : :::::::: .::. ::::.: ::.:: ::::::: :::.::.::::::::::: CCDS95 MKVCEKVQRKGTTSYNEVADELVAEFSAADNHILPNESAYDQKNIRRRVYDALNVLMAMN 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB9 IISREKKKIKWIGLTTNSAQNCQNLRVERQKRLERIKQKQSELQQLILQQIAFKNLVLRN :::.:::.:::::: :::::.::::.::::.::::::::::.::.:::::::::::: :: CCDS95 IISKEKKEIKWIGLPTNSAQECQNLEVERQRRLERIKQKQSQLQELILQQIAFKNLVQRN 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB9 QYVEEQVSQRPLPNSVIHVPFIIISSSKKTVINCSISDDKSEYLFKFNSSFEIHDDTEVL ...:.:.:. : ::::::.::::...::::::.::::.:: ::::.:...:::::: ::: CCDS95 RHAEQQASRPPPPNSVIHLPFIIVNTSKKTVIDCSISNDKFEYLFNFDNTFEIHDDIEVL 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB9 MWMGMTFGLESGSCSAEDLKMARNLVPKALEPYVTEMAQGTFGGVF-TTAGSRSNGTWLS :::. ::::::::::::::::.::::::::::::::::: :::: ::::: :::: .: CCDS95 KRMGMACGLESGSCSAEDLKMARSLVPKALEPYVTEMAQGTVGGVFITTAGSTSNGTRFS 310 320 330 340 350 360 360 370 380 390 400 pF1KB9 ASDLTNIAIGMLATSSGGSQYSGSRVETPAVEEEEEEDNNDDDLSENDEDD :::::: : :::::::.:::::::::::: : :.:..:::..:::::: CCDS95 ASDLTNGADGMLATSSNGSQYSGSRVETP-VSYVGEDDEEDDDFNENDEDD 370 380 390 400 410 >>CCDS54650.1 TFDP2 gene_id:7029|Hs108|chr3 (446 aa) initn: 1071 init1: 856 opt: 1029 Z-score: 1036.3 bits: 200.8 E(32554): 2.1e-51 Smith-Waterman score: 1167; 48.3% identity (72.8% similar) in 445 aa overlap (2-399:3-444) 10 20 30 40 50 pF1KB9 MAKYVSLTEANEELKVLMDENQTSRP-----VAVHTSTVNPLGKQLLPKTFGQSSVNID :: :.:: .: :.. ..:.: . :: .:..: : .::::.: .::. CCDS54 MTAKNVGLTSTNAEVRGFIDQNLSPTKGNISFVAFPVSNTNSPTK-ILPKTLGPINVNVG 10 20 30 40 50 60 70 80 90 pF1KB9 QQVVIGMPQRPAASNIPVVGSPNPPSTHFASQNQHSYSSPPWA----------------- :..:. ::: ..:. ..::: :. ...:. : . :. CCDS54 PQMIISTPQRLTSSGSVLIGSPYTPAPAMVTQT-HIAEATGWVPGDRKRARKFIDSDFSE 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB9 GQHNRKGEKNGMGLCRLSMKVWETVQRKGTTSCQEVVGELVAKFRAASNHASPNESAYDV .....::.::: :: ..:::: : :::::::: .::. :::..: ..:: . . :::: CCDS54 SKRSKKGDKNGKGLRHFSMKVCEKVQRKGTTSYNEVADELVSEFTNSNNHLAAD-SAYDQ 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB9 KNIKRRTYDALNVLMAMNIISREKKKIKWIGLTTNSAQNCQNLRVERQKRLERIKQKQSE :::.::.::::::::::::::.:::.:::::: :::::.::::..:.:.:.::::::... CCDS54 KNIRRRVYDALNVLMAMNIISKEKKEIKWIGLPTNSAQECQNLEIEKQRRIERIKQKRAQ 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB9 LQQLILQQIAFKNLVLRNQYVEEQVSQRPLPNSVIHVPFIIISSSKKTVINCSISDDKSE ::.:.:::::::::: ::. :.: . : ::.:..:::::..:.::::.::::.:: : CCDS54 LQELLLQQIAFKNLVQRNRQNEQQNQGPPALNSTIQLPFIIINTSRKTVIDCSISSDKFE 240 250 260 270 280 290 280 290 300 310 320 330 pF1KB9 YLFKFNSSFEIHDDTEVLMWMGMTFGLESGSCSAEDLKMARNLVPKALEPYVTEMAQGTF :::.:...:::::: ::: :::.::::::.:: ::::.:..::::::: :.:... : CCDS54 YLFNFDNTFEIHDDIEVLKRMGMSFGLESGKCSLEDLKLAKSLVPKALEGYITDISTGPS 300 310 320 330 340 350 340 350 360 370 pF1KB9 ----GGVFTTAGSRSN-----GTWLSASDLTN---------IAIGM-LA-----TSSGGS : ..... : :: :. : :.... .: :. :: .::..: CCDS54 WLNQGLLLNSTQSVSNLDLTTGATLPQSSVNQGLCLDAEVALATGQFLAPNSHQSSSAAS 360 370 380 390 400 410 380 390 400 pF1KB9 QYSGSRVETP-AVEEEEEEDNNDDDLSENDEDD . : :: ::: . ..:.:::...:. : CCDS54 HCSESRGETPCSFNDEDEEDDEEDSSSPE 420 430 440 >>CCDS43159.1 TFDP2 gene_id:7029|Hs108|chr3 (386 aa) initn: 1126 init1: 1008 opt: 1017 Z-score: 1025.3 bits: 198.6 E(32554): 8.6e-51 Smith-Waterman score: 1080; 49.4% identity (74.3% similar) in 385 aa overlap (57-399:1-384) 30 40 50 60 70 80 pF1KB9 VAVHTSTVNPLGKQLLPKTFGQSSVNIDQQVVIGMPQRPAASNIPVVGSPNPPSTHFASQ ..:. ::: ..:. ..::: :. ...: CCDS43 MIISTPQRLTSSGSVLIGSPYTPAPAMVTQ 10 20 30 90 100 110 120 pF1KB9 NQHSYSSPPWA-----------------GQHNRKGEKNGMGLCRLSMKVWETVQRKGTTS . : . :. .....::.::: :: ..:::: : :::::::: CCDS43 T-HIAEATGWVPGDRKRARKFIDSDFSESKRSKKGDKNGKGLRHFSMKVCEKVQRKGTTS 40 50 60 70 80 130 140 150 160 170 180 pF1KB9 CQEVVGELVAKFRAASNHASPNESAYDVKNIKRRTYDALNVLMAMNIISREKKKIKWIGL .::. :::..: ..:: . . .::: :::.::.::::::::::::::.:::.:::::: CCDS43 YNEVADELVSEFTNSNNHLAADSQAYDQKNIRRRVYDALNVLMAMNIISKEKKEIKWIGL 90 100 110 120 130 140 190 200 210 220 230 240 pF1KB9 TTNSAQNCQNLRVERQKRLERIKQKQSELQQLILQQIAFKNLVLRNQYVEEQVSQRPLPN :::::.::::..:.:.:.::::::...::.:.:::::::::: ::. :.: . : : CCDS43 PTNSAQECQNLEIEKQRRIERIKQKRAQLQELLLQQIAFKNLVQRNRQNEQQNQGPPALN 150 160 170 180 190 200 250 260 270 280 290 300 pF1KB9 SVIHVPFIIISSSKKTVINCSISDDKSEYLFKFNSSFEIHDDTEVLMWMGMTFGLESGSC :.:..:::::..:.::::.::::.:: ::::.:...:::::: ::: :::.::::::.: CCDS43 STIQLPFIIINTSRKTVIDCSISSDKFEYLFNFDNTFEIHDDIEVLKRMGMSFGLESGKC 210 220 230 240 250 260 310 320 330 340 350 360 pF1KB9 SAEDLKMARNLVPKALEPYVTEMAQGTF----GGVFTTAGSRSN-----GTWLSASDLTN : ::::.:..::::::: :.:... : : ..... : :: :. : :.... CCDS43 SLEDLKLAKSLVPKALEGYITDISTGPSWLNQGLLLNSTQSVSNLDLTTGATLPQSSVNQ 270 280 290 300 310 320 370 380 390 400 pF1KB9 ---------IAIGML------ATSSGGSQYSGSRVETP-AVEEEEEEDNNDDDLSENDED .: :.. .::..:. : :: ::: . ..:.:::...:. : CCDS43 GLCLDAEVALATGQFLAPNSHQSSSAASHCSESRGETPCSFNDEDEEDDEEDSSSPE 330 340 350 360 370 380 pF1KB9 D >>CCDS54648.1 TFDP2 gene_id:7029|Hs108|chr3 (418 aa) initn: 1071 init1: 856 opt: 1011 Z-score: 1018.8 bits: 197.5 E(32554): 2e-50 Smith-Waterman score: 1074; 49.5% identity (74.4% similar) in 386 aa overlap (56-399:33-416) 30 40 50 60 70 80 pF1KB9 PVAVHTSTVNPLGKQLLPKTFGQSSVNIDQQVVIGMPQRPAASNIPVVGSPNPPSTHFAS ...:. ::: ..:. ..::: :. ... CCDS54 PEGIIFEAENKPSPGTESAGTFILDLSATSRTIISTPQRLTSSGSVLIGSPYTPAPAMVT 10 20 30 40 50 60 90 100 110 120 pF1KB9 QNQHSYSSPPWA-----------------GQHNRKGEKNGMGLCRLSMKVWETVQRKGTT :. : . :. .....::.::: :: ..:::: : ::::::: CCDS54 QT-HIAEATGWVPGDRKRARKFIDSDFSESKRSKKGDKNGKGLRHFSMKVCEKVQRKGTT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 SCQEVVGELVAKFRAASNHASPNESAYDVKNIKRRTYDALNVLMAMNIISREKKKIKWIG : .::. :::..: ..:: . . :::: :::.::.::::::::::::::.:::.::::: CCDS54 SYNEVADELVSEFTNSNNHLAAD-SAYDQKNIRRRVYDALNVLMAMNIISKEKKEIKWIG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 LTTNSAQNCQNLRVERQKRLERIKQKQSELQQLILQQIAFKNLVLRNQYVEEQVSQRPLP : :::::.::::..:.:.:.::::::...::.:.:::::::::: ::. :.: . : CCDS54 LPTNSAQECQNLEIEKQRRIERIKQKRAQLQELLLQQIAFKNLVQRNRQNEQQNQGPPAL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 NSVIHVPFIIISSSKKTVINCSISDDKSEYLFKFNSSFEIHDDTEVLMWMGMTFGLESGS ::.:..:::::..:.::::.::::.:: ::::.:...:::::: ::: :::.::::::. CCDS54 NSTIQLPFIIINTSRKTVIDCSISSDKFEYLFNFDNTFEIHDDIEVLKRMGMSFGLESGK 250 260 270 280 290 300 310 320 330 340 350 pF1KB9 CSAEDLKMARNLVPKALEPYVTEMAQGTF----GGVFTTAGSRSN-----GTWLSASDLT :: ::::.:..::::::: :.:... : : ..... : :: :. : :... CCDS54 CSLEDLKLAKSLVPKALEGYITDISTGPSWLNQGLLLNSTQSVSNLDLTTGATLPQSSVN 310 320 330 340 350 360 360 370 380 390 400 pF1KB9 N---------IAIGML------ATSSGGSQYSGSRVETP-AVEEEEEEDNNDDDLSENDE . .: :.. .::..:. : :: ::: . ..:.:::...:. : CCDS54 QGLCLDAEVALATGQFLAPNSHQSSSAASHCSESRGETPCSFNDEDEEDDEEDSSSPE 370 380 390 400 410 pF1KB9 DD >>CCDS54649.1 TFDP2 gene_id:7029|Hs108|chr3 (349 aa) initn: 1071 init1: 856 opt: 1008 Z-score: 1017.0 bits: 196.9 E(32554): 2.5e-50 Smith-Waterman score: 1042; 55.5% identity (79.4% similar) in 326 aa overlap (99-399:23-347) 70 80 90 100 110 120 pF1KB9 NIPVVGSPNPPSTHFASQNQHSYSSPPWAGQHNRKGEKNGMGLCRLSMKVWETVQRKGTT ....::.::: :: ..:::: : ::::::: CCDS54 MLDPKCDRKRARKFIDSDFSESKRSKKGDKNGKGLRHFSMKVCEKVQRKGTT 10 20 30 40 50 130 140 150 160 170 180 pF1KB9 SCQEVVGELVAKFRAASNHASPNESAYDVKNIKRRTYDALNVLMAMNIISREKKKIKWIG : .::. :::..: ..:: . . :::: :::.::.::::::::::::::.:::.::::: CCDS54 SYNEVADELVSEFTNSNNHLAAD-SAYDQKNIRRRVYDALNVLMAMNIISKEKKEIKWIG 60 70 80 90 100 110 190 200 210 220 230 240 pF1KB9 LTTNSAQNCQNLRVERQKRLERIKQKQSELQQLILQQIAFKNLVLRNQYVEEQVSQRPLP : :::::.::::..:.:.:.::::::...::.:.:::::::::: ::. :.: . : CCDS54 LPTNSAQECQNLEIEKQRRIERIKQKRAQLQELLLQQIAFKNLVQRNRQNEQQNQGPPAL 120 130 140 150 160 170 250 260 270 280 290 300 pF1KB9 NSVIHVPFIIISSSKKTVINCSISDDKSEYLFKFNSSFEIHDDTEVLMWMGMTFGLESGS ::.:..:::::..:.::::.::::.:: ::::.:...:::::: ::: :::.::::::. CCDS54 NSTIQLPFIIINTSRKTVIDCSISSDKFEYLFNFDNTFEIHDDIEVLKRMGMSFGLESGK 180 190 200 210 220 230 310 320 330 340 350 pF1KB9 CSAEDLKMARNLVPKALEPYVTEMAQGTF----GGVFTTAGSRSN-----GTWLSASDLT :: ::::.:..::::::: :.:... : : ..... : :: :. : :... CCDS54 CSLEDLKLAKSLVPKALEGYITDISTGPSWLNQGLLLNSTQSVSNLDLTTGATLPQSSVN 240 250 260 270 280 290 360 370 380 390 400 pF1KB9 N---------IAIGM-LA-----TSSGGSQYSGSRVETP-AVEEEEEEDNNDDDLSENDE . .: :. :: .::..:. : :: ::: . ..:.:::...:. : CCDS54 QGLCLDAEVALATGQFLAPNSHQSSSAASHCSESRGETPCSFNDEDEEDDEEDSSSPE 300 310 320 330 340 pF1KB9 DD >>CCDS54647.1 TFDP2 gene_id:7029|Hs108|chr3 (310 aa) initn: 1015 init1: 856 opt: 952 Z-score: 961.7 bits: 186.5 E(32554): 3e-47 Smith-Waterman score: 986; 56.0% identity (79.0% similar) in 309 aa overlap (116-399:1-308) 90 100 110 120 130 140 pF1KB9 QNQHSYSSPPWAGQHNRKGEKNGMGLCRLSMKVWETVQRKGTTSCQEVVGELVAKFRAAS ::: : :::::::: .::. :::..: .. CCDS54 MKVCEKVQRKGTTSYNEVADELVSEFTNSN 10 20 30 150 160 170 180 190 200 pF1KB9 NHASPNESAYDVKNIKRRTYDALNVLMAMNIISREKKKIKWIGLTTNSAQNCQNLRVERQ :: . . :::: :::.::.::::::::::::::.:::.:::::: :::::.::::..:.: CCDS54 NHLAAD-SAYDQKNIRRRVYDALNVLMAMNIISKEKKEIKWIGLPTNSAQECQNLEIEKQ 40 50 60 70 80 210 220 230 240 250 260 pF1KB9 KRLERIKQKQSELQQLILQQIAFKNLVLRNQYVEEQVSQRPLPNSVIHVPFIIISSSKKT .:.::::::...::.:.:::::::::: ::. :.: . : ::.:..:::::..:.:: CCDS54 RRIERIKQKRAQLQELLLQQIAFKNLVQRNRQNEQQNQGPPALNSTIQLPFIIINTSRKT 90 100 110 120 130 140 270 280 290 300 310 320 pF1KB9 VINCSISDDKSEYLFKFNSSFEIHDDTEVLMWMGMTFGLESGSCSAEDLKMARNLVPKAL ::.::::.:: ::::.:...:::::: ::: :::.::::::.:: ::::.:..:::::: CCDS54 VIDCSISSDKFEYLFNFDNTFEIHDDIEVLKRMGMSFGLESGKCSLEDLKLAKSLVPKAL 150 160 170 180 190 200 330 340 350 360 pF1KB9 EPYVTEMAQGTF----GGVFTTAGSRSN-----GTWLSASDLTN---------IAIGM-L : :.:... : : ..... : :: :. : :.... .: :. : CCDS54 EGYITDISTGPSWLNQGLLLNSTQSVSNLDLTTGATLPQSSVNQGLCLDAEVALATGQFL 210 220 230 240 250 260 370 380 390 400 pF1KB9 A-----TSSGGSQYSGSRVETP-AVEEEEEEDNNDDDLSENDEDD : .::..:. : :: ::: . ..:.:::...:. : CCDS54 APNSHQSSSAASHCSESRGETPCSFNDEDEEDDEEDSSSPE 270 280 290 300 310 405 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 17:33:36 2016 done: Fri Nov 4 17:33:36 2016 Total Scan time: 3.060 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]