Gene Smed_3208 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3208
Symbol	hemE
ID	5324087
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	3383576
End bp	3384607
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	64%
IMG OID	640792156
Product	uroporphyrinogen decarboxylase
Protein accession	YP_001328867
Protein GI	150398400
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGGAA CGCATCGCAA AGTGCTAGAG GTTTTGAACG GGAGATCGCT CACGCCTCCC 
CCCATCTGGC TGATGCGGCA GGCTGGACGC TACCTCCCCG AATACAGGGC AACCCGGATA 
AAGGCCGGAA GCTTCCTCGA CCTCTGCTAC ACACCCGAGC TTGCAGTCGA AGTGACATTG 
CAGCCGATCC GCCGCTACGG CTTCGATGCC GCGATCCTCT TCTCCGATAT TCTGGTCGTT 
CCCGATGCAC TCAATCGAAA TGTTCGCTTC GAAGAGGGGC AGGGACCGCG GATGGATCCG 
ATCGACGAGG ACGGTATAGC GCAGCTGAGC CAGACAGGCG TCATCGAGCA CCTTGCCCCG 
GTCTTCGAGA CGGTCTCTCG ACTCAGGGGC GAATTGGCGG CGGAAATCAC GCTGCTCGGC 
TTTTGCGGGG CGCCCTGGAC CGTGGCGACC TATATGATCG CCGGTCGCGG GACGCCAGAC 
CAGGCGCCGG CGCGCCTCTT CGCCTATCGT CATCCCAAGG CCTTTGAACG GCTTCTGGCG 
CTGCTTGCCG ATATTTCCGC CGACTACCTG GTCGAACAGA TCGATCGCGG TGCGGATGCG 
GTGCAAATCT TCGACTCCTG GGCCGGTGTG CTCGGCGAGG AAGAATTCCA ACGTTACGCG 
GTGGAGCCTG TCCGGCGCAT CATCGCCTCG GTCCGGTCCC GCCGGCCTTC GGCGAAAATC 
ATCGCCTTTG CGAAAGGCGC CGGCATCCTG TTGAAGAACT ATCGGCAAGC GACCGGCGCG 
GACGCAATCG GCCTCGATTG GTCGGTGCCG CTCTCCTTCG CAGCGGAGCT GCAGAAGGAC 
GGGCCGGTTC AGGGCAATCT CGATCCGGTG CGGGTCGTGG CCGGTGGCGC GGCGCTGGAG 
CATGGAATCG ACCGTATCCT GGACGTCCTC GGGCAAGGGC CGCTGATCTT CAATCTGGGC 
CACGGCATCA CGCCGGACGC GGATCCGGAG CATGTCGCCG CGCTTGTGTC TCGCGTCCGA 
GGACGCCGAT GA

Protein sequence

MSGTHRKVLE VLNGRSLTPP PIWLMRQAGR YLPEYRATRI KAGSFLDLCY TPELAVEVTL 
QPIRRYGFDA AILFSDILVV PDALNRNVRF EEGQGPRMDP IDEDGIAQLS QTGVIEHLAP 
VFETVSRLRG ELAAEITLLG FCGAPWTVAT YMIAGRGTPD QAPARLFAYR HPKAFERLLA 
LLADISADYL VEQIDRGADA VQIFDSWAGV LGEEEFQRYA VEPVRRIIAS VRSRRPSAKI 
IAFAKGAGIL LKNYRQATGA DAIGLDWSVP LSFAAELQKD GPVQGNLDPV RVVAGGAALE 
HGIDRILDVL GQGPLIFNLG HGITPDADPE HVAALVSRVR GRR