Gene Nmul_A0705 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0705
Symbol	hemE
ID	3786167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	811376
End bp	812473
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	56%
IMG OID	637810787
Product	uroporphyrinogen decarboxylase
Protein accession	YP_411404
Protein GI	82701838
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAGAT TGAAGAACGA TACCCTGCTC AGGGCCCTGC TGAGGCAACC TACTGAATAC 
ACGCCGGTTT GGCTCATGCG GCAGGCAGGA CGTTATCTCT CCGAATATAA TCAGACGAGG 
GCTCGTGCGG GCAATTTTCT CGCGCTCTGC AAGAATCCCG ACTTCGCCAC CGAAGTTACG 
ATGCAGCCTC TAGCCCGATT TCCTTTGGAT GCTGCCATAC TGTTTTCGGA TATTCTGACG 
ATTCCTGATG CGATGGGATT GGGATTATAT TTTGCGGAAG GAGAGGGTCC CAGGTTCGAG 
CGCCCCTTGC GCGAAGAGTG GGAGATCCGG GCCCTTACCG TCCCGGATCC TGCTGTTCAT 
TTGCGCTATG TCATGGACGC GGTTTCACAG ATACGCAAGA CTCTGGATAA TCGGGTTCCG 
CTGATCGGAT TCTCCGGCAG TCCGTTTACG CTTGCCTGCT ATATGGTGGA AGGAGCCGGC 
GGGACTGATT TCCGGCAAAT AAAAACCATG CTGTACCGCC GTCCTGATCT GTTGCATCAT 
ATTCTCGATA TCAATGCGCA GGCTGTCACC GCTTATCTGA ACGCTCAAAT CGAGTCCGGC 
GCGCAGGCAG TAATGATTTT TGATACCTGG GGTGGCGCCC TTTCCCATGC CGCTTATCAG 
CAGTTTTCGC TGCGCTACAT GACCCAGGTG CTGGCCGGGT TGAGGCGGTA TCAGGGGGCT 
GAGCGTATTC CGAGCATTGT TTTCACCAAG GGCGGGGGGC TATGGCTCGA GAGTATCGCG 
GACAGCGGGT GTGATGCAGT GGGACTGGAC TGGACGGTTA ATATCGGAGA CGCCCGGCGA 
CGTGTGGGCC ACAAAGTGGC CTTGCAGGGC AACCTGGATC CTGCCGTACT ATTCGCCGAG 
CCGGGGGTAA TTGCTGCCGA GGTGGAGCAG ATCCTTGCGA GTTTTGGCGA AGGCAGTGGG 
CACATCTTCA ACCTGGGACA TGGCATATCG CAGTTTACGC CGCCCGAAAA TGCGCTTACG 
CTGGTCGAGG CGGTTCACAG CCTCAGCCGC AGATTTCATC GTGCGGATGC AGAGGGAAAC 
AACAGTTTCG GCAGCTAG

Protein sequence

MTRLKNDTLL RALLRQPTEY TPVWLMRQAG RYLSEYNQTR ARAGNFLALC KNPDFATEVT 
MQPLARFPLD AAILFSDILT IPDAMGLGLY FAEGEGPRFE RPLREEWEIR ALTVPDPAVH 
LRYVMDAVSQ IRKTLDNRVP LIGFSGSPFT LACYMVEGAG GTDFRQIKTM LYRRPDLLHH 
ILDINAQAVT AYLNAQIESG AQAVMIFDTW GGALSHAAYQ QFSLRYMTQV LAGLRRYQGA 
ERIPSIVFTK GGGLWLESIA DSGCDAVGLD WTVNIGDARR RVGHKVALQG NLDPAVLFAE 
PGVIAAEVEQ ILASFGEGSG HIFNLGHGIS QFTPPENALT LVEAVHSLSR RFHRADAEGN 
NSFGS