Gene EcE24377A_4540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4540
Symbol	hemE
ID	5588505
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	4534742
End bp	4535806
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	56%
IMG OID	640928156
Product	uroporphyrinogen decarboxylase
Protein accession	YP_001465492
Protein GI	157158608
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGAAC TTAAAAACGA TCGTTATCTG CGGGCGCTGC TGCGCCAGCC CGTTGATGTC 
ACTCCAGTAT GGATGATGCG CCAGGCGGGT CGCTATCTAC CGGAATATAA AGCCACGCGC 
GCCCAGGCGG GCGATTTTAT GTCGCTGTGC AAAAACGCCG AGCTGGCGTG CGAAGTGACT 
TTGCAACCGC TGCGTCGCTA CCCGCTGGAT GCGGCGATCC TCTTTTCCGA TATCCTCACC 
GTGCCGGACG CGATGGGGTT AGGGCTCTAT TTTGAAGCCG GAGAAGGTCC GCGTTTTACC 
TCGCCAGTCA CCTGCAAAGC CGACGTCGAT AAACTGCCAA TTCCGGACCC GGAAGATGAG 
CTGGGTTACG TGATGAACGC GGTGCGTACC ATTCGTCGCG AACTGAAAGG CGAAGTGCCG 
CTGATTGGTT TTTCCGGCAG CCCGTGGACG CTGGCAACCT ACATGGTGGA AGGCGGCAGC 
AGCAAAGCCT TCACCGTGAT CAAAAAAATG ATGTATGCCG ATCCGCAGGC GCTGCACGCT 
CTACTCGATA AACTGGCGAA AAGCGTCACT TTGTATCTGA ATGCGCAGAT TAAAGCCGGT 
GCTCAGGCTG TGATGATTTT CGACACCTGG GGCGGCGTGC TTACCGGGCG CGATTATCAA 
CAGTTCTCGC TTTATTACAT GCATAAAATT GTTGATGGTT TACTGCGTGA AAACGACGGT 
CGCCGCGTAC CGGTCACGCT GTTTACCAAA GGCGGCGGAC AGTGGCTGGA AGCCATGGCA 
GAAACCGGTT GCGATGCGCT GGGCCTCGAC TGGACAACGG ACATCGCCGA TGCGCGCCGC 
CGTGTGGGCA ATAAAGTCGC GTTGCAGGGT AATATGGATC CGTCGATGCT GTACGCGCCG 
CCTGCCCGCA TTGAAGAAGA AGTAGCGACT ATACTTGCAG GTTTCGGTCA CGGCGAAGGT 
CATGTCTTTA ACCTTGGTCA CGGCATTCAT CAGGATGTGC CGCCAGAACA TGCTGGCGTG 
TTCGTGGAGG CAGTGCATCG ACTGTCTGAA CAGTATCACC GCTAA

Protein sequence

MTELKNDRYL RALLRQPVDV TPVWMMRQAG RYLPEYKATR AQAGDFMSLC KNAELACEVT 
LQPLRRYPLD AAILFSDILT VPDAMGLGLY FEAGEGPRFT SPVTCKADVD KLPIPDPEDE 
LGYVMNAVRT IRRELKGEVP LIGFSGSPWT LATYMVEGGS SKAFTVIKKM MYADPQALHA 
LLDKLAKSVT LYLNAQIKAG AQAVMIFDTW GGVLTGRDYQ QFSLYYMHKI VDGLLRENDG 
RRVPVTLFTK GGGQWLEAMA ETGCDALGLD WTTDIADARR RVGNKVALQG NMDPSMLYAP 
PARIEEEVAT ILAGFGHGEG HVFNLGHGIH QDVPPEHAGV FVEAVHRLSE QYHR