Gene Sare_1474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1474
Symbol	hemE
ID	5706067
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1703981
End bp	1705078
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	72%
IMG OID	641270982
Product	uroporphyrinogen decarboxylase
Protein accession	YP_001536363
Protein GI	159037110
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.514226
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000238489
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCACCG ACACCACGGG CACCGCCGCC CGAGACGAGG GTCCTCGCCC CGGCGATCCG 
GCCGACTCAC CTTTCGTCCG CGCGTGCCGG CGCGAACCCG GGCCGCACAC CCCGGTCTGG 
TTCATGCGAC AGGCGGGCCG CTCGCTCCCG GAGTACCGGA AGATCCGGTC CGAGGTGGCG 
ATGCTGGAGT CCTGCCGCCG GCCGGACCTG ATTACCGAGA TCACCCTCCA GCCGGTGCGC 
CGACACAAGG TCGACGCGGC GATCCTGTTC AGCGACATCG TGGTGCCGGT CGCCGCCGCC 
GGGGTGGCGT TGGACATCGT CCCCGGCACC GGCCCGGTGG TGACCGACCC GGTGACCACC 
AGGGCAGACG TGGAGCGAAT CCGGCTGATC GACCGCGACG ATGTCCACTA CGTGGACGAG 
GCGGTCCGGA TGCTCGTCGA CGAGCTGGGC GGCACCCCGC TGATCGGCTT CGCCGGTGCT 
CCGTTCACGC TGGCCAGCTA CCTCGTCGAG GGAGGCCCGT CCCGCACCCA CGTGCGGACC 
AAGGCCCTGA TGTACGGCGA CCCGGACCTG TGGCACGCCC TGGCCGGCCG GCTCGCCGAG 
ATGACGCTCG CGTTCCTGAA GGTGCAGATC GACGCCGGCG TCTCCGCGGT GCAGCTCTTC 
GACTCCTGGG CGGGTGCGCT CTCCGAAGCC GACTACCGCC GGTACGTGCT GCCGCACTCG 
CGGGCGGTGC TCGCCGGGCT CGCCGACGCC GGAGTCCCCC GTATCCACTT CGGGGTGGGC 
ACCGGCGAGC TGATCGCCGC GATGGGCGAG GCGGGCGCCG ACGTGGTGGG CGTCGACTGG 
CGTACGCCGC TGGACGTCGC CACTCGCCGG ATCGGTCCCG AGCGGGCCGT GCAGGGCAAC 
CTCGACCCGT GCCTGCTGTT CGCCCCGTGG CCGGTCATCG AGGCCGAGGT ACGGCGGGTG 
CTGGCCCAGG GGCGTGCCGC CCCCGGGCAC ATCTTCAATC TCGGCCACGG AGTGCTGCCG 
GAGACCGACC CCGAGGTGCT GACCCGGGTG GTGGCCCTGG TCCACGAGCT GACCGTGCGT 
CCGGATGGAA GGAGCTGA

Protein sequence

MSTDTTGTAA RDEGPRPGDP ADSPFVRACR REPGPHTPVW FMRQAGRSLP EYRKIRSEVA 
MLESCRRPDL ITEITLQPVR RHKVDAAILF SDIVVPVAAA GVALDIVPGT GPVVTDPVTT 
RADVERIRLI DRDDVHYVDE AVRMLVDELG GTPLIGFAGA PFTLASYLVE GGPSRTHVRT 
KALMYGDPDL WHALAGRLAE MTLAFLKVQI DAGVSAVQLF DSWAGALSEA DYRRYVLPHS 
RAVLAGLADA GVPRIHFGVG TGELIAAMGE AGADVVGVDW RTPLDVATRR IGPERAVQGN 
LDPCLLFAPW PVIEAEVRRV LAQGRAAPGH IFNLGHGVLP ETDPEVLTRV VALVHELTVR 
PDGRS