Gene ECH_0688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0688
Symbol
ID	3927841
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	-
Start bp	697666
End bp	698859
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	30%
IMG OID	637901809
Product	putative deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_507493
Protein GI	88658433
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR00277] uncharacterized domain HDIG [TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.154263
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAGATC TAGTAAAATA TGCATGTAAT CCTACTGAAA CAAGAGGTAG AATATTTCAT 
GAAGAGGAAG ACCAATATTG CGACTGTTAT CAAAGGGATC GTGACCGCAT TATATATTCG 
GGTGCATTCC GTAAATTACA GTATAAAACA CAAGTATTTA TTAATTATGA AAATGATTAT 
TATAGAACAA GACTAACTCA TAGTCTTGAA GTTGCTCAAA TAGCAAGGTC ATTAAGTAGA 
AAGCTGAGAT TTAATGAAGA TTTAACAGAA GCTATATCTT TAGCACATGA TTTGGGTCAT 
CCTCCATTTG GGCATGCAGG AGAAGATGCT TTAAATGAGA TGACTATGCA TCATTTAGGA 
TTTGATCATA ATATTCAGGC TCTGAGGATA TTAACATTTT TAGAAAAAAG ATATATAAAA 
TTTGATGGCA TGAACCTTAC TTGGGAAACA TTGGAAGGAG TAGCTAAACA TAATGGTCCT 
ATTACAGGGG AAAATCGAAT TAATTCTAAT AAAAAAATAC ATAAGTTTAT GTTAGATTAT 
GATTCATATT ATAAGTTAGA CCTTGACAAT TTTTCTAGTG CTGAAGCTCA AATTGCATCT 
ATCTCTGATG ATATAGCTTA TAATATGCAT GATATTGATG ATGGAATAAG AGCAAAAATT 
TTGGTTATAG AGGAATTATT AGAATTACCA TTGATTGGGG ACATCTTAAA GAAAGTAATA 
GATGATAACT CTGGATTAAG TGTATCTGAT AATCGAATTG TGCATGAGTT TCTAAGAAGA 
ACTGTTGATA TTATGTTAAT GGATATAATA TCTCAGGTTA CAAACAATAT TAAAGAGTAT 
GATATACGTT CTCATGATGA TATTAGGAAG TTAGGTAAAG TATTTGTACA TTTTTCTGAA 
GAAATGAATC AGTATAAAAT AGGCTTACAA AACTTTCTTA GAACTAAATT ATACAACTAC 
TATAAAGTGA AAAGGGTAAA AAATAAAGTA AAGCGTATAA TAAAAGAATT ATTTCAAGTT 
TTTTATGATG ATCCACAGAT TTTACCTTCT GATTGGGGTG TGAAAGCAAT GGATGCTAAT 
TTAATAGATC GATCAATTGT AATTTGTGAT TTTATCTCAG GCATGACAGA TCGTTTTGCT 
ATTCAAGAGC ATAGAAAAAT CTTTGATACA ACGTACGAGA TGTTGGTATT TTAG

Protein sequence

MLDLVKYACN PTETRGRIFH EEEDQYCDCY QRDRDRIIYS GAFRKLQYKT QVFINYENDY 
YRTRLTHSLE VAQIARSLSR KLRFNEDLTE AISLAHDLGH PPFGHAGEDA LNEMTMHHLG 
FDHNIQALRI LTFLEKRYIK FDGMNLTWET LEGVAKHNGP ITGENRINSN KKIHKFMLDY 
DSYYKLDLDN FSSAEAQIAS ISDDIAYNMH DIDDGIRAKI LVIEELLELP LIGDILKKVI 
DDNSGLSVSD NRIVHEFLRR TVDIMLMDII SQVTNNIKEY DIRSHDDIRK LGKVFVHFSE 
EMNQYKIGLQ NFLRTKLYNY YKVKRVKNKV KRIIKELFQV FYDDPQILPS DWGVKAMDAN 
LIDRSIVICD FISGMTDRFA IQEHRKIFDT TYEMLVF