Gene ECH_0030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0030
Symbol	hemE
ID	3927972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	-
Start bp	25934
End bp	26938
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	38%
IMG OID	637901155
Product	uroporphyrinogen decarboxylase
Protein accession	YP_506863
Protein GI	88657828
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.210193
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAAAGA CTATAACAAG CAGGGCCAAG CAAAAAGAGA TTCCAGTCTG GTTCATGCGC 
CAAGCCGGTA GATACTTACC GGAGTACCGC AAGGTGGCAG AGGAGGCAGG AAGCTTTCTA 
GAACTGTGTT ATACACCAGA GCTGGTAAAG GAGGTTACAT TACAACCAGT AAGGAGGTTC 
GGCTTGGACG CGGCGATAAT ATTTTCAGAC ATACTGGTAA TCCCTGACGC CTTAGGTTGC 
AAAGTAGAAT TCACGAAAGA GAAAGGACCC GAGTTGCAGC TAATATCTAA CCACTCAGAA 
ATAAGCGTTC CCGAAGAAGC TGCATTGGAT CATCTTAAAA ATGTTTTTAG GGGTATAAAA 
GAAGTAAGAA AGTCCTTACA AAGAGACAAG CCATTGATAG GGTTTGCAGG TGCACCTTGG 
ACTATAGCCT CTTATATGAT AGGAAGAGAT AAAAATTTCT CAAAAATAAG AGAGATGTGT 
TATTCACAAA CTAAAAACCT AGAAAAAATA GTAGAAAAAA TTACAAAGGT GACAACCTTA 
TACTTAATAA AACAAATAGA AAGCGGTGTA GACATAATAC AAATTTTTGA TAGCAATGCA 
GGAATTGTAC CAGCCGGCGA ATTCAAAAAG TGGATAATAG ACCCAACGAA AGAAATAGTC 
TCGTCTATAC GTAAACTTTA TCCAGAATTC CCCATCATAG GATTTCCTAA GGGTGCAGGA 
GTGATGTACA AGCAGTTTTC AGAAGAAACG GAAGTTTCAG TCACAAGTGT CGACTATAAT 
ACCCCAATGT CTTGGGCAAA AAGTAACATT CCGTCAGTAC TACAAGGAAA TATAGATCCA 
TATCTAGTAG CGTATGACAA AAGTAAGGCA ATATCCCAAA CGAAAGAACT AATCAATATA 
ATGAAGGACA AACCTTTCAT ATTTAACTTA GGTCATGGAG TAATACCAAG TACCCCTATA 
GCTAATATTG CAGCACTTGT AGACACAATA AAATCTGTTG TTTAA

Protein sequence

MLKTITSRAK QKEIPVWFMR QAGRYLPEYR KVAEEAGSFL ELCYTPELVK EVTLQPVRRF 
GLDAAIIFSD ILVIPDALGC KVEFTKEKGP ELQLISNHSE ISVPEEAALD HLKNVFRGIK 
EVRKSLQRDK PLIGFAGAPW TIASYMIGRD KNFSKIREMC YSQTKNLEKI VEKITKVTTL 
YLIKQIESGV DIIQIFDSNA GIVPAGEFKK WIIDPTKEIV SSIRKLYPEF PIIGFPKGAG 
VMYKQFSEET EVSVTSVDYN TPMSWAKSNI PSVLQGNIDP YLVAYDKSKA ISQTKELINI 
MKDKPFIFNL GHGVIPSTPI ANIAALVDTI KSVV