Gene TM1040_2528 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2528
Symbol	hemE
ID	4076530
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2668364
End bp	2669401
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	61%
IMG OID	638007852
Product	uroporphyrinogen decarboxylase
Protein accession	YP_614522
Protein GI	99082368
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCCAAC AGAAGACGAT CCTACGCGCA TTGGCAGGCG AAACGCAGGC CGTGCCGCCG 
ATTTGGATGA TGCGTCAGGC CGGGCGTTAC CTGCCCGAAT ACCGCGCGAC CCGGGCACAG 
GCCGGGGATT TTCTGAGTCT ATGCTACAAT CCCGAACTGG CGGCAGAGGT GACACTGCAG 
CCCATTCGTC GCTATGGCTT TGATGCGGCT ATCCTGTTTG CCGATATTCT TCTGGTGCCA 
CAGGCGCTGG GGGCAGACCT TTGGTTTGTC ACCGGCGAGG GGCCGCGCCT CTCCACGATC 
ACGACAGATG CGGATTTTGC CAAGCTGGGG CCAGCCAGTG ATGTGCACGA AACCCTGAGC 
CCGATTTACG AGACGGTGCG AATTCTGTCG AAAGAGCTGC CGTCGGAGAC CACCTTGATC 
GGGTTTGCGG GCGCGCCATG GACGGTTGCG ACCTATATGA TCGCAGGACG TGGAACGCCG 
GATCAGGGAC CGGCGCATGC CTTGATGCAG GAAAACACCC CCCTGTTCGA GGCGCTTTTG 
GCACGGATTA CCGAGGCGAC CATCAGCTAT CTCTCAGCCC AGATCGAAGC TGGCGCAGAG 
GTTGTGAAGA TCTTTGACAG CTGGGCGGGA TCGCTCAAGG GAGAGGCATT TGACAAATAC 
GCGCTCGAGC CGGCACGTCA GATCACCGCG GCCCTGAAGG CGCGCCACCC GCATGTCCCC 
GTAATCGGCT TTCCGCGCGA GGCCGGCGAG AAGTACATCG GTTTTCACGC AGCGACAGGT 
GTGGATTGTG TTGCGCTCGA CAACTCCGTC GACCCGGAAT GGGCGGCGGA GCATGTGCAG 
GTCGCAGGCT GCGTGCAAGG CAACCTTGCA TCGCGGCACA TGGTCAGCGG TGGAGAGGCG 
CTCGTTCAGG ACACCCGCCG GATCGTCAAG GCGTTCTCGA AGGGGCCGCA TATTTTCAAC 
CTCGGACATG GTATCACGCC GGATGCGGAT CCCGACAACG TGCAACGAAT GATCGATACC 
GTACGCGAAG GCGCTTAG

Protein sequence

MGQQKTILRA LAGETQAVPP IWMMRQAGRY LPEYRATRAQ AGDFLSLCYN PELAAEVTLQ 
PIRRYGFDAA ILFADILLVP QALGADLWFV TGEGPRLSTI TTDADFAKLG PASDVHETLS 
PIYETVRILS KELPSETTLI GFAGAPWTVA TYMIAGRGTP DQGPAHALMQ ENTPLFEALL 
ARITEATISY LSAQIEAGAE VVKIFDSWAG SLKGEAFDKY ALEPARQITA ALKARHPHVP 
VIGFPREAGE KYIGFHAATG VDCVALDNSV DPEWAAEHVQ VAGCVQGNLA SRHMVSGGEA 
LVQDTRRIVK AFSKGPHIFN LGHGITPDAD PDNVQRMIDT VREGA