Gene ECH_0048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0048
Symbol
ID	3928027
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	-
Start bp	43952
End bp	45022
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	27%
IMG OID	637901172
Product	TPR domain-containing protein
Protein accession	YP_506879
Protein GI	88658481
COG category	[R] General function prediction only
COG ID	[COG4976] Predicted methyltransferase (contains TPR repeat)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.24301
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGTA ACTTCTTCAT AACAAAGCGT AATGTATCGT CTTTAATATC GAGTATTAAT 
AAAACTATAC CGAAACCACA AGATATTTCT CAATCTATAA AAAACAAAAT CACTTCCATA 
AAAAAGGAAG CCATTCTATT ACAAAATAAG CTAAAAAACT TACTTGAAAC TAATATAGAT 
CTTGGTTTAT ACCACTTTTA CAAAGGAAAT ATATCTGATG CAAAATTCAG ATTTCGCCTT 
ATTAGTATCT TTAAACCTAA ATTACCAGTA GTATATTATA ATATTGGAAG ATGTTACTTT 
ACACTACAAA ACTTCAATAA AGCACAACAA AATTTTACAC GTGCAATAGA ATTAGATAAT 
AATTATGCAG ATGCTTTATA CTACTTAAAC AAAATAACAA ATCCAGAAAG TATTGTATAT 
GTGCCTGAAA ACATTATAAA GCAATATTTC GATTACACTA GCGAACATTT TGTAGAACAT 
TGGCTTATAG CAAAACAATA CAAAGCACAT GAATATGTTA AGTCTCTAAT AATAAACTTT 
TTTGGAAATA AATCTTCATA CTTAAATATT TTAGACCTTG GATGTGGTAC TGGTATATGT 
GGTCAATTTT TAAAAATGAA AAGTATAGGT AATCATATAA CAGGCATTGA CATATCAAAC 
AAAATGATAA ATATAGCAAG AGGCTGTTTT GTAAACGGTA AACAAGCTTA TAATGAATTA 
ATAAATATAA GCATTTTTGA TTTTCTTAAG AAAAACCAAA ACAAGAAAAA ATACAACGTT 
ATCATTCTAA CTGAAGTACT ACAGTACACA GGCAGTTTAA ATCCTATTCT TAAATTACTA 
AAAACAATGT TAGAGACAGA TGGTATTATT ATCGGACTTG CAAGAAGAAA GAAAGGATCA 
GGTTTCCAAT TTATAAATGA AGGAGATTTC TTTTGCCATT CAGACAAGTA TATAAAATCA 
TCTATTATAG AATCAGGATT ACAGTGTAGC TATTCTAGCT ACTGTAAAAT ATATGGATCA 
CAAGTCGAAG GAATACTTTT TGTTGCACAA TCTAACAAAA TTGAAGTTTA A

Protein sequence

MKSNFFITKR NVSSLISSIN KTIPKPQDIS QSIKNKITSI KKEAILLQNK LKNLLETNID 
LGLYHFYKGN ISDAKFRFRL ISIFKPKLPV VYYNIGRCYF TLQNFNKAQQ NFTRAIELDN 
NYADALYYLN KITNPESIVY VPENIIKQYF DYTSEHFVEH WLIAKQYKAH EYVKSLIINF 
FGNKSSYLNI LDLGCGTGIC GQFLKMKSIG NHITGIDISN KMINIARGCF VNGKQAYNEL 
INISIFDFLK KNQNKKKYNV IILTEVLQYT GSLNPILKLL KTMLETDGII IGLARRKKGS 
GFQFINEGDF FCHSDKYIKS SIIESGLQCS YSSYCKIYGS QVEGILFVAQ SNKIEV