Gene TM1040_2900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2900
Symbol	hemH
ID	4078578
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	3069070
End bp	3070134
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	57%
IMG OID	638008229
Product	ferrochelatase
Protein accession	YP_614894
Protein GI	99082740
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0276] Protoheme ferro-lyase (ferrochelatase)
TIGRFAM ID	[TIGR00109] ferrochelatase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.724237
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGATG CGACCTCAAC TGCGACCCGC CCTGACAATG CCCCTGCGGA TCATCCGCCG 
GTCAAGGCGG AAAAGGTCGG GATCCTGCTC GCAAACCTCG GCACCCCGGA TCACTACAGC 
TATTGGCCGA TGCGGCGCTA TCTGAACGAG TTTCTCTCGG ACAAACGTGT GATCGACTAC 
CCGTCCTGGA AATGGCAGCC GCTCCTGCAG CTGATCATCC TGACCAAACG CCCCTTTGCC 
TCTGGCGAAG CGTACAAGTC GATCTGGAAC CATGAGCGGG GCGAAAGCCC ATTGATGACG 
ATCACCAAGG ATCAGACCAA CGCCATGGCC AAGGCGATGG AAGAGCTCTA TGGCGATCAG 
GTCATGGTCG ATTTCTGCAT GCGCTACGGC AATCCCTCCA CCAAATCCAA GGTAGAGAAG 
ATGATTGCCG CTGGCTGCCG CAAGATCCTC TTTGTTCCGC TTTATCCGCA CTATGCGGGG 
GCGACCTCTG CAACTGCAAA TGATCAGTTC TTCCGTGTGC TGATGGAGCA GCCCTGGCAA 
CCCGCCGTAC GTACGATCGA GCCCTACTTC GACCAACCCG AATACATTGA TGCGCTCGCC 
AGATCCGTGG AAGACGCCTA TGCCAAACTG GACAAGACCC CGGATATCCT GGTCTGTTCC 
TATCATGGCA TGCCAAAGCG CTACCTGATG CAGGGCGATC CCTATCACTG CCAGTGCCAA 
AAGACGACGC GCCTGCTGCG CGAGCGCCTG GGTTGGGACG AATCGAAGAT CATGACCACG 
TTCCAGTCTG TCTTTGGTCC AGAGGAATGG CTGCGCCCCT ACACGGTTGA GCATGTCGCC 
GAACTGGCGA AACAGGGCAA GAAGAACATC GCCGTGATCG CTCCGGCCTT CTCGGCGGAT 
TGCATCGAGA CTCTGGAGGA GATCAATGAG GAGATTTTCG AGAGTTTTGA ACACGCGGGC 
GGCGAAGAAT TCACCTACAT TCCTTGCCTG AACGACAGCG AAGCGCATAT TGCCGCGCTT 
TCAAGCGTGA TCCGCAACAA CCTCAAAGGA TGGCTTGAGG CGTAA

Protein sequence

MLDATSTATR PDNAPADHPP VKAEKVGILL ANLGTPDHYS YWPMRRYLNE FLSDKRVIDY 
PSWKWQPLLQ LIILTKRPFA SGEAYKSIWN HERGESPLMT ITKDQTNAMA KAMEELYGDQ 
VMVDFCMRYG NPSTKSKVEK MIAAGCRKIL FVPLYPHYAG ATSATANDQF FRVLMEQPWQ 
PAVRTIEPYF DQPEYIDALA RSVEDAYAKL DKTPDILVCS YHGMPKRYLM QGDPYHCQCQ 
KTTRLLRERL GWDESKIMTT FQSVFGPEEW LRPYTVEHVA ELAKQGKKNI AVIAPAFSAD 
CIETLEEINE EIFESFEHAG GEEFTYIPCL NDSEAHIAAL SSVIRNNLKG WLEA