Gene Mlg_0737 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0737
Symbol
ID	4270498
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	821837
End bp	822958
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	67%
IMG OID	638125486
Product	ferrochelatase
Protein accession	YP_741581
Protein GI	114319898
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0276] Protoheme ferro-lyase (ferrochelatase)
TIGRFAM ID	[TIGR00109] ferrochelatase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCAGT TGACCGTGAA GTCGTTGTTC GAAGGCCGGA AGGGGTTCCG GCACGACGAT 
CAGCCCCGGC TCGGGGTGCT GGTAACCAAC CTGGGTACCC CTGACGCCCC TACCACGCCG 
GCCCTGCGCC GCTACCTGCA CGAGTTCCTG TGGGACCCCC GGGTGGTGGA GGCGCCCCGT 
TGGATCTGGT GGCTGATCCT CAACGGCATT GTGTTGCGTA CCCGCCCGAA GAAATCCGCC 
GCGGCCTACC GTGAGGTCTG GACCGAAGAG GGCTCGCCGC TGCTGATCAT CGGCCGGAAA 
CAGACCCGGG GCATCCTCGA GCGGTTGCAG TCGCGCCTGC AGGGGCCCGT GGTGGCGGAG 
CTGGCCATGC GCTACGGCAA CCCTTCCATC GCCTCCGGAC TGCGCAGGCT GCGCGATCAG 
GGAGCAGAGC GCATCGTGGT GCTGCCGCTC TATCCCCAGT ATTCCGGCTC CACGACCGGG 
TCCACCTTCG ATGCCGTTGC GGACGAGCTC AAGCGCTGGC GGTGGGTGCC GGAGTTCCGC 
TTCATCGGCC AGTACCACGA CGATGAGCGT TACATCGAGG CCCTGGCCGC CAGCATCCGC 
GAGCACTGGG CCGAGCACGG CCGCGGCGAG AAGCTGCTGT TTTCCTTCCA CGGGACCCCG 
CGCCGCTACC TGCTCGACGG CGACCCCTAT CACTGCCAGT GTCAGAAGAC GGCCCGCCTG 
GTGGCCGAGC GCCTGGAGCT GTCCGACGAG GCCTGGCAAG TCACCTTCCA GTCGCTCTTT 
GGCAAGGAGG TCTGGCTGCA GCCCTACACC GATGCCACCG TGGAGCAGCT GGCCCGCTCG 
GGGCTGAAGA CCCTGGACGT GATCTGCCCG GGTTTCTCGG CGGACTGCCT GGAGACCCTA 
GAGGAGATCG AGGGCGAGAA TGCCGAGATC TTCCAGGAGC ACGGCGGCGA TAAGCTGCGC 
TACATCAAGG CGTTGAACGA CCGGGACGAC CACTTGGAGA TGCTGGCCGG CCTGGTGCAT 
GAGCATAGCC AGGGCTGGCC GGAGGCTGGG GGGCCGGCGC GCACCCTGCG CGACCCGCAG 
GCCACCCAAG AGCGGGCCAG GGCACTGGGG TCCGATGTCT GA

Protein sequence

MSQLTVKSLF EGRKGFRHDD QPRLGVLVTN LGTPDAPTTP ALRRYLHEFL WDPRVVEAPR 
WIWWLILNGI VLRTRPKKSA AAYREVWTEE GSPLLIIGRK QTRGILERLQ SRLQGPVVAE 
LAMRYGNPSI ASGLRRLRDQ GAERIVVLPL YPQYSGSTTG STFDAVADEL KRWRWVPEFR 
FIGQYHDDER YIEALAASIR EHWAEHGRGE KLLFSFHGTP RRYLLDGDPY HCQCQKTARL 
VAERLELSDE AWQVTFQSLF GKEVWLQPYT DATVEQLARS GLKTLDVICP GFSADCLETL 
EEIEGENAEI FQEHGGDKLR YIKALNDRDD HLEMLAGLVH EHSQGWPEAG GPARTLRDPQ 
ATQERARALG SDV