Gene Sare_3249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3249
Symbol	hemH
ID	5705400
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3742189
End bp	3743220
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	73%
IMG OID	641272677
Product	ferrochelatase
Protein accession	YP_001538044
Protein GI	159038791
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0276] Protoheme ferro-lyase (ferrochelatase)
TIGRFAM ID	[TIGR00109] ferrochelatase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTACG ACGCGGTGAT GCTGGTTTCC TTCGGCGGGC CCGAGCGGCC CGAGGACGTG 
ATGCCCTTCC TGCAGAATGT GACCCGGGGC CGGGGCGTGC CGCCGGAGCG GTTGGCCGAG 
GTCGCCGAGC ACTACCTGCA CTTCGGTGGG GTGTCGCCGA TCAACCAGCA GTGCCGCGAG 
CTCCTCGCCG CGATCCGGGA GGACTTCGCT GCCAACGGTG TCGACCTCCC GGTCTACTGG 
GGTAACCGGA ACTGGGATCC GATGCTCGCC GACACCGTGG CGCGGATGCA TGACGACGGC 
GTCGAGCGGG CCCTGGCGTT CGTGACCAGC GCCCTCGGCG GGTACTCGTC CTGTCGGCAG 
TACCAGGAGG ACATCGCTGC GGCCCGGGCG GCGGTCGGCC CGGACGCCCC GGTGGTGGAG 
AAGCTGCGCC AGTTCTGGGA CCATCCCGGG TTCGTCGAGC CGCACTCCGA CGCGGTGCGG 
GCGGCGCTGG CCCAACTGGA CCCGGCGCGA CGGGACAGCA CCCGGATCGT CTTCACCGCC 
CACTCGGTCC CCACCTCCGC GGCGGCAGCC GCCGGCCCGC ACGGTGGCCG GTACGAGGCG 
CAGTTGGCCG AGACGGCCCG GCTGGTACAC GCCGCTGCCG CCCCCGACCT GGCCTACGAC 
CTGGTGTGGC AGAGCCGTTC CGGACCCCCG CAGGTACCCT GGCTGGAGCC GGACGTCAAC 
GACCACCTCG TGGCCTTGCC CGCGCAGGGC GTCACCGGTG TCGTGGTCAG CCCGATCGGG 
TTCGTCTCCG ACCACCTGGA GGTGGTGTGG GACCTCGATA CCGAGGCGCG GGCGACCGCC 
GGGCAGTTGG GCCTGGACTT CGCCCGGGCC GCCACGCCGG GCACCGATCC ACGGTTTGTG 
GCGATGGTGC GCGAGCTGGT CCGTGAGCGT ACCGATCCGG CTGGCGCGAC GCTGCGCCGG 
CGCCTCGGCG AGTTGCCGAT GTGGGACACC TGCCCGGCGG TCTGCTGCGT TCCGGCCCGC 
CGCCCCTCCT GA

Protein sequence

MAYDAVMLVS FGGPERPEDV MPFLQNVTRG RGVPPERLAE VAEHYLHFGG VSPINQQCRE 
LLAAIREDFA ANGVDLPVYW GNRNWDPMLA DTVARMHDDG VERALAFVTS ALGGYSSCRQ 
YQEDIAAARA AVGPDAPVVE KLRQFWDHPG FVEPHSDAVR AALAQLDPAR RDSTRIVFTA 
HSVPTSAAAA AGPHGGRYEA QLAETARLVH AAAAPDLAYD LVWQSRSGPP QVPWLEPDVN 
DHLVALPAQG VTGVVVSPIG FVSDHLEVVW DLDTEARATA GQLGLDFARA ATPGTDPRFV 
AMVRELVRER TDPAGATLRR RLGELPMWDT CPAVCCVPAR RPS