Gene Mlg_2854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2854
Symbol
ID	4268592
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	3243623
End bp	3244630
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	65%
IMG OID	638127616
Product	cytochrome-c peroxidase
Protein accession	YP_743684
Protein GI	114322001
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAGCC TGGGGACACA CCTCCGCAAG GCGATCCCGG CATTGGGAAT GGGCTGCATT 
CTGGCCTTTG CCGCCAGCAC CGCCAGTGCG GAAGACGGTT TCTACAGCCA GTATGCCGAC 
CGGTTCGAGC CACTGCCCGC GCTGCCGCCG ATTCCGGCGG ATAACTCCCT GACCAAGGAG 
AAGATCGAAC TGGGCAAGAT GCTCTTCTTC GAGCCGCGCA TCTCGTCCAG CGGTGTTATC 
AGTTGTGCCA CCTGTCACAA CCCGGCGCTC GGCTGGGCCG ACCGCATTCC GCGGGCGGTG 
GGTCACGAGG GCCAGGTAGG CGAGCGTAAC ACCCCCACGG TGCTCAACTC CGGCTTCTTC 
GAGGCCCAGT TCTGGGACGG CCGCGAGCCG GACCTGGAGG GTCAGGCCCT GGGGCCGATC 
GAGGCAGACA TCGAGATGGC CATGGACCTG GACGCAGCCC TGGAGCGGCT CAAGGAGTTC 
GATGAGTACC AGGCGAAGTT CGCGGCGGCC TACCCGGGCG ATGACCAGCC GATCAAAGCG 
GATAACGTCG CCAAGGCCCT GGCCAGCTTC CAGCGCACCC TGAATACCCC GAACTCGCCG 
TTCGATCGCT ACCTGCGGGG TGACCTGGAT GCGCTGACCG ACCAGCAGAA GCGCGGTATG 
GCCGCCTTTG TGGACAACGG CTGTATCGCC TGCCACCGCG GGCCCGCGCT GACCGACAGC 
AACTTCCACC GCATTCAGGT GCCGGGCTCC ACCGATGAGG GTCGTTACCT GGTCACCGGC 
GAGGAGGCCG ACCGGTTTGC CTTCAAGACC CCAACCCTGC GCAATGTGGC GGTGACCTAC 
CCCTACTTCA ACAACGGTGG GGTGGAGACC TTGGAGGAGG CCACTCAGGT GATGGGCCGT 
GAGATGCTGA ACCGCGAGTT CGACGACGAG ACCGTCGCCG AGCTGGTGGC CTTCATGGAG 
TCCCTGACCG GTGAGATGCC GGACTTCCAG GTGCCGGCCC TGCCGTAA

Protein sequence

MTSLGTHLRK AIPALGMGCI LAFAASTASA EDGFYSQYAD RFEPLPALPP IPADNSLTKE 
KIELGKMLFF EPRISSSGVI SCATCHNPAL GWADRIPRAV GHEGQVGERN TPTVLNSGFF 
EAQFWDGREP DLEGQALGPI EADIEMAMDL DAALERLKEF DEYQAKFAAA YPGDDQPIKA 
DNVAKALASF QRTLNTPNSP FDRYLRGDLD ALTDQQKRGM AAFVDNGCIA CHRGPALTDS 
NFHRIQVPGS TDEGRYLVTG EEADRFAFKT PTLRNVAVTY PYFNNGGVET LEEATQVMGR 
EMLNREFDDE TVAELVAFME SLTGEMPDFQ VPALP