Gene GWCH70_0649 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_0649
Symbol	hemE
ID	7978835
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	+
Start bp	710759
End bp	711796
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	45%
IMG OID	644797634
Product	uroporphyrinogen decarboxylase
Protein accession	YP_002948808
Protein GI	239826184
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAAAC AAAAGAATGA TACATTTTTA CGCGCCTGCC GCGGCGAAAA GACAGATTAT 
GTTCCGGTTT GGTATATGAG ACAAGCGGGA AGGTCCCAGC CGGAGTATCG GGCGCTTAAG 
GAGAAATATT CGTTATTTGA AATTACCCAT CAACCAGAGC TTTGTGCTTA TGTAACAAGA 
TTGCCGGTCG AACAATATCA TGTGGATGCG GCCATTTTAT ATAAAGATAT TATGTCCCCG 
CTTCCGGCGA TTGGTGTTGA TGTAGAAATT AAAGCAGGGG TTGGACCGGT GATTGCTAAT 
CCCATCCGCT CTCTTGCGGA TGTAGAAAAA CTTGGAGAAA TTCATCCGGA AGAAGATGTG 
CCATATGTAT TGGAAACCAT CAAACTGCTG ACGACTGAAC AATTAAATGT TCCGCTCATC 
GGATTTGCGG GTGCGCCGTT TACGCTTGCG AGCTATATGA TTGAAGGCGG TCCATCGAAA 
AACTACAATA AAACGAAAGC GTTTATGTAC GCAGAACCAA AAGCGTGGTT TGCTCTGATG 
GACAAGCTTG CTGATATGAC GATTCGCTAT GTGAAGGCGC AAATTCGTGC TGGCGCGAGC 
GCGATTCAAA TTTTTGATTC ATGGGTTGGC GCGGTGAATG TTGACGATTA CCGCACATTT 
ATTAAACCGA CAATGGCTCG TATTTTTGCG GCGCTTCGCG AAGAAAACGT TCCGCTTATT 
ATGTTTGGGG TTGGTGCGAG CCATTTAGCG AAAGAATGGA ACGATTTGCC GCTTGATGTA 
ATCGGACTCG ACTGGCGGCT TTCGATTCGC GAGGCGCGGG AAAGAGGGAT TACAAAAGCG 
CTTCAGGGAA ATTTAGATCC AGCAGTTCTT CTGGCTCCTT GGGAAGTAAT TGAAAAACGC 
GTGAAACAAA TTTTGGACGA AGGCATGGAA CAGCCGGGAT ATATATTCAA CTTAGGCCAC 
GGCATTTTTC CAGAGATTCA GCCAGAAACG TTAAAACGGT TAACGGCGTT TATCCATGAC 
TATACGTCAA GAAAATAA

Protein sequence

MSKQKNDTFL RACRGEKTDY VPVWYMRQAG RSQPEYRALK EKYSLFEITH QPELCAYVTR 
LPVEQYHVDA AILYKDIMSP LPAIGVDVEI KAGVGPVIAN PIRSLADVEK LGEIHPEEDV 
PYVLETIKLL TTEQLNVPLI GFAGAPFTLA SYMIEGGPSK NYNKTKAFMY AEPKAWFALM 
DKLADMTIRY VKAQIRAGAS AIQIFDSWVG AVNVDDYRTF IKPTMARIFA ALREENVPLI 
MFGVGASHLA KEWNDLPLDV IGLDWRLSIR EARERGITKA LQGNLDPAVL LAPWEVIEKR 
VKQILDEGME QPGYIFNLGH GIFPEIQPET LKRLTAFIHD YTSRK