Gene Gdia_2030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_2030
Symbol	hemH
ID	6975457
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	2252266
End bp	2253294
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	69%
IMG OID	643391560
Product	ferrochelatase
Protein accession	YP_002276405
Protein GI	209544176
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0276] Protoheme ferro-lyase (ferrochelatase)
TIGRFAM ID	[TIGR00109] ferrochelatase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.273433
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTTCC TGACCATTCG CCCGGCTAAG CCGATCGCCC CGTCCCGTAT CGGCGTCCTG 
CTGACCAATC TGGGCACGCC GGAAGGAACC GGCTATGGCG CCATCCGGCG CTATCTTTCC 
GAATTCCTGT CCGACCGCCG CATCATCGAG GTCAGTCCCG CCCTGTGGCA GCCGATCCTG 
CAGGGACCGC TGCTGGCCCT GCGCCCCAGG CGGACCGGGG CGGCCTATCG GCGCATCTGG 
CATACCGAGC GGGACGAGAG CCCGCTGCGC ACCCATACAA GGGCCCAGGC CGAGGCCCTG 
GCCGCGCGCA TGGAACCGGA CGGCGTGGCG GTGGAATGGG CCATGCGCTA CGGCACCCCG 
TCGATCGCAT CGGGCATCGA ACGGCTGCTG GCCCGGGGCT GCGCGCGGGT GCTGCTGCTG 
CCGCTTTATC CGCAATACAG CGCCACGACG ACGGCCACGG CCAACGACCA TGCCTTTCGC 
GCGCTGATGC GGCTGCGCAA CCAGCCGGCG GTCCGCACCG CGCCGTCCTT CCCCGACCAT 
CCGCTCTATA TCGAAGCCCT GGCCCGGTCG GTGCGCGAGA CGCTGGCCGG CCTGCCCTTC 
GTGCCGCAAC GGATCGTGGC GTCGTTCCAT GGCCTGCCGC GCGATTATGT CACGCGCGGC 
GACCCGTATC CCGAGGAATG CGAGCGCACG CTGGCGGCGC TGCGCCGGGC GCTGGACATG 
GACGAGGAGA CGATGACGCT GACCTATCAG TCGCGCTTCG GCCCCGCCCG ATGGCTGGAA 
CCCTATACCG CGCCGCTGGT CGCCGGATTG CCCGCCCGGG GCGTCACGCG TGTCGCCGTC 
ATCATGCCGG GCTTCATGGC CGACTGCATC GAGACGCTGG ACGAGATCGG CAACGAGGTC 
CGGAAGGACT TCATTGCCGC CGGCGGAACC GATTTCGCGC TGGTTCCCTG CCTGAACGCG 
GCGCCGGCCG CCATTGACCT GCTGGAAGGC CTGACGCGCC GGGAACTGGC GGGATGGTTG 
AAGGATTGA

Protein sequence

MTFLTIRPAK PIAPSRIGVL LTNLGTPEGT GYGAIRRYLS EFLSDRRIIE VSPALWQPIL 
QGPLLALRPR RTGAAYRRIW HTERDESPLR THTRAQAEAL AARMEPDGVA VEWAMRYGTP 
SIASGIERLL ARGCARVLLL PLYPQYSATT TATANDHAFR ALMRLRNQPA VRTAPSFPDH 
PLYIEALARS VRETLAGLPF VPQRIVASFH GLPRDYVTRG DPYPEECERT LAALRRALDM 
DEETMTLTYQ SRFGPARWLE PYTAPLVAGL PARGVTRVAV IMPGFMADCI ETLDEIGNEV 
RKDFIAAGGT DFALVPCLNA APAAIDLLEG LTRRELAGWL KD