Gene Dshi_3498 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_3498
Symbol	hemH
ID	5713729
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	3678932
End bp	3680020
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	61%
IMG OID	641269427
Product	ferrochelatase
Protein accession	YP_001534832
Protein GI	159046038
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0276] Protoheme ferro-lyase (ferrochelatase)
TIGRFAM ID	[TIGR00109] ferrochelatase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.440479
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.808064
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGACA GAGGCACAGA ACCGATGAAC ATGATGTCCA AGACGACCTC GTCCCACCTG 
CCCGGTGATC ACCCGCCGGT CAATTTCGGC AAGGTCGGCG TACTGCTGGC CAATCTCGGG 
ACGCCGGACA ATTATGACTA TTGGTCGATG CGGCGGTATC TGAATGAATT CCTGTCCGAC 
AAGCGGGTGA TCGATTACAG CCCCTGGATC TGGCAACCGC TGTTGCAGCT GGTGATCCTG 
ACCAAGCGGC CCTTCAGCTC GGGTGCGGCC TACAAGTCGA TCTGGAACGA AGAGGCGGGG 
GAGAGCCCGC TGATGACCAT CACCAAGGAT CAGACCGCCA AGATGAAGGC GGCGATGCAG 
GCTCGGTTCG GCGATGACGT GGTGGTGGAT TTCTGCATGC GCTACGGCAA TCCGTCCACC 
AAGTCGAAGG TGGAGGAATT GCAGAAGCAG GGCTGCCAGA AGATCCTGTT CTTCCCGCTC 
TATCCGCAAT ATGCGGGCGC GACCTCGGCC ACGGCCTGCG ACCAGTTCTT CCGGTCGCTG 
GAGCATATCA AGTGGCAGCC GATCGTGCGC ACGGTGGAGC CGTATTTCGA GCATCCGATG 
TATATCGAGG CGCTGGCCCA GTCCGTGGAG CGCGCCTATG CGGACATGGA AACCCGCCCC 
GACGTGCTGG TCGCGTCCTA TCACGGGGTG CCGAAGCGGT ACCTGATGGA GGGTGACCCG 
TACCACTGCC AGTGTCAGAA GACCTCGCGC CTGCTCAAGG AACGGCTGGG CTGGCCGGAG 
GGCGAGATCG TGACCACCTT CCAGAGCCGG TTCGGCCCGG AGGAATGGCT CAAGCCCTAC 
ACGGTCGAAG AGGTCGCGCG CCTGGCCGAG ACCGGCAAGA AGAAGATCGC GGTGATCGCG 
CCGGCATTTT CCGCCGACTG CATCGAAACG CTCGAAGAGA TCAACGAAGA GATCAAGGAG 
AGCTTCGAGG AGGCGGGCGG CGAAGAGTTC ACCTATATCC CCTGCCTGAA TGACGACGAC 
GCCCATATCG CGGCGCTGGC CAAGGTCGTG GAAGAAAACC TTGCGGGCTG GATCGCGCCG 
AAGGGCTGA

Protein sequence

MADRGTEPMN MMSKTTSSHL PGDHPPVNFG KVGVLLANLG TPDNYDYWSM RRYLNEFLSD 
KRVIDYSPWI WQPLLQLVIL TKRPFSSGAA YKSIWNEEAG ESPLMTITKD QTAKMKAAMQ 
ARFGDDVVVD FCMRYGNPST KSKVEELQKQ GCQKILFFPL YPQYAGATSA TACDQFFRSL 
EHIKWQPIVR TVEPYFEHPM YIEALAQSVE RAYADMETRP DVLVASYHGV PKRYLMEGDP 
YHCQCQKTSR LLKERLGWPE GEIVTTFQSR FGPEEWLKPY TVEEVARLAE TGKKKIAVIA 
PAFSADCIET LEEINEEIKE SFEEAGGEEF TYIPCLNDDD AHIAALAKVV EENLAGWIAP 
KG