Gene Sbal195_4042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal195_4042
Symbol	hemE
ID	5755861
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS195
Kingdom	Bacteria
Replicon accession	NC_009997
Strand	-
Start bp	4758400
End bp	4759464
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	48%
IMG OID	641290388
Product	uroporphyrinogen decarboxylase
Protein accession	YP_001556462
Protein GI	160877146
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.984022
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGAAT TAAAGAATGA TCGTTATTTA CGCGCCCTAC TAAAAGAGCC AGTCGATGTG 
ACCCCTGTGT GGATGATGCG TCAAGCTGGC CGTTATCTTC CTGAATATAA AGCTACGCGC 
GCACAAGCGG GTGACTTTAT GTCTTTGTGT AAAAACCACG AGCTTGCCTG TGAAGTCACG 
CTGCAACCTC TACGCCGATA TGATCTTGAT GCGGCGATTC TGTTTTCCGA TATTTTAACT 
GTGCCTGATG CTATGGGTTT AGGTTTGTAT TTTGAGGCGG GTGAAGGCCC ACGTTTCGAG 
CGCCCTACAG ACACTATCGA TGCAATTAAA AAGCTATCAA TCCCAGATCC AGAAGATGAG 
CTTGGCTATG TGATGAAAGC CGTGAGCACT ATTCGCCGTG AGCTTAATGG CGCAGTGCCG 
TTAATTGGCT TTTCTGGCTC GCCATGGACC TTAGCCACTT ATATGGTTGA AGGTGGCTCG 
AGCAAAACTT TCGAAAAAAT TAAAAAGATG GCTTACGCTG AGCCAATGGC ATTACACATG 
CTGTTAGACA AGCTAGCTGA TTCAGTGATC TTATACCTGA ATGCCCAAGT CGCCAACGGC 
GCACAATCTT TGATGATTTT TGACTCATGG GGCGGCGCGT TATCGCACTC AGCTTATCGT 
GAGTTCTCTT TGCGTTACAT GCAGAAGATT ATTGATGGTC TGACACGCTT TGCCGATGGA 
CGTAAAGTGC CTGTGACGCT GTTCACTAAA GGCGGCGGTT TATGGTTAGA AGCCATGGCA 
GAAACAGGTT GTGATGCGCT CGGTTTAGAT TGGACGGTAG ACATTGCCGA TGCTCGTCGC 
CGTGTAGGCC ATAAAGTGGC CCTGCAAGGC AACATGGACC CTTCAATGTT GTATGCACCT 
ATTCCACGCA TCGAAGAAGA AGTGGGCCAT ATCCTCGCGG GTTATGGTGA AGGTACTGGT 
CATGTATTTA ACTTAGGCCA TGGTATACAT CAGCATGTCG ATCCAGAGCA TGCTGGCGCC 
TTTATTAAGG CGGTTCACGC ACAATCAAAG CAATACCATA AGTAA

Protein sequence

MAELKNDRYL RALLKEPVDV TPVWMMRQAG RYLPEYKATR AQAGDFMSLC KNHELACEVT 
LQPLRRYDLD AAILFSDILT VPDAMGLGLY FEAGEGPRFE RPTDTIDAIK KLSIPDPEDE 
LGYVMKAVST IRRELNGAVP LIGFSGSPWT LATYMVEGGS SKTFEKIKKM AYAEPMALHM 
LLDKLADSVI LYLNAQVANG AQSLMIFDSW GGALSHSAYR EFSLRYMQKI IDGLTRFADG 
RKVPVTLFTK GGGLWLEAMA ETGCDALGLD WTVDIADARR RVGHKVALQG NMDPSMLYAP 
IPRIEEEVGH ILAGYGEGTG HVFNLGHGIH QHVDPEHAGA FIKAVHAQSK QYHK