Gene ECH_1084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_1084
Symbol	araM
ID	3927959
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	-
Start bp	1111773
End bp	1113032
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	30%
IMG OID	637902198
Product	AraM protein
Protein accession	YP_507869
Protein GI	88658280
COG category	[C] Energy production and conversion
COG ID	[COG0371] Glycerol dehydrogenase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATGATA AATTTTTAAA GCAGATTCTA GTTGATGAAA GTTTTTGTAA GTTGGAGTCA 
GTAGTTAATG CAATAAAGAG TATACGTATT AGTAAGAGAA TCAGTGACAA TATATGCGAT 
ATAATTAAAC AGTATGGTAA TAGTGGTTTC ATAGTTACAG ATGTTAATCT TGCTCCTCTG 
TTGAACAAGG TTGTATTTAA TAGTGTTGCA CATTTTATTA TTCCTCGTTG GTCTTGTGCT 
TCTCAAAAAT TAGTGGAACT AATTAAAGAG AAATCTCGGG ATTCAGATGT TTTAGTATCT 
TTTGGTAGTG GTACAATCAA TGATATTTGT AAATATGTAA GTTACATTAC AAATAAGCGC 
TATATCTCAT TTCCAACAGC TCCTTCTATG AATGGATATG TTTCATCTAA TGCATCTATA 
GTATTAAACA ATGGACATAA AAAATCATTA CAAGCTCATT TACCTGAAGC TATATATATA 
GATGTTGATA TTATTGTAAA TGCTCCCCAA AGATTAATAA TAAGTGGTTT TGCTGATTTT 
ATTTGTAGAT CTACAGTACA GGCAGATTGG TTATTATCAC ATTTGTTGTT AGGTAGTGAA 
TATACTGAAT TGCCGTTTTT AATTAGCAAA AGAAGTGAAA ATGCATTAAT CAACGATTAT 
CTAGGGTTAA TAAAACATGA TGAGTATAGT ATTATGCTTT TAATGCAAGC TTTGCTCTTA 
TCAGGATTGG GTATGTTTAT TGTAGGCGGA AGTCAATCTG CTAGTCAGGG TGAACATATG 
ATTGCTAGTA CCATAGAACT TTTACAAGAT GATATGCATT TCTTTCATGG TGAATTAATA 
GGTGTAAGTA TGTCAACTAT GACATGTTTA CAACATAGGA TTTTGAAATC AGTACCAAGG 
TTTTATCCTA CATTGATAAA TGATGAAGAT ATAAAACAGT GTTTTCATAT GCAGTATACT 
CAAGAGTATT GTGATATACT TGCTCAAAAG TTTATTAATC AACAAAAGGC GGATTATTTG 
AATAGCTTGA TTAAGGATAA GTGGTCTTTT ATTGTTGAAA AAATTACAGA GAAAACATTA 
TCTGATATAT TATTAAAAGA CATGCTGGTT AACATAGGTT GTCCCAATAA ACCAGAGCAT 
ATTGGATGGA ATATTAGTCA ATATAGTAAA GCAATAGAAT TTGCGTTTAT TACTAGATCA 
AGATTTACGT TTCTTGATAT TGCGCATCAT GGTAGATTTG CGATAGTTGA AGATATGTAA

Protein sequence

MYDKFLKQIL VDESFCKLES VVNAIKSIRI SKRISDNICD IIKQYGNSGF IVTDVNLAPL 
LNKVVFNSVA HFIIPRWSCA SQKLVELIKE KSRDSDVLVS FGSGTINDIC KYVSYITNKR 
YISFPTAPSM NGYVSSNASI VLNNGHKKSL QAHLPEAIYI DVDIIVNAPQ RLIISGFADF 
ICRSTVQADW LLSHLLLGSE YTELPFLISK RSENALINDY LGLIKHDEYS IMLLMQALLL 
SGLGMFIVGG SQSASQGEHM IASTIELLQD DMHFFHGELI GVSMSTMTCL QHRILKSVPR 
FYPTLINDED IKQCFHMQYT QEYCDILAQK FINQQKADYL NSLIKDKWSF IVEKITEKTL 
SDILLKDMLV NIGCPNKPEH IGWNISQYSK AIEFAFITRS RFTFLDIAHH GRFAIVEDM