Gene Mmcs_5081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_5081
Symbol
ID	4113910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	5379392
End bp	5380408
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	70%
IMG OID	638034239
Product	Rieske (2Fe-2S) region
Protein accession	YP_642241
Protein GI	108802044
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.040812
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCGT TCGCCGACAT CAAGGCCAAG TGGGCGAAAT CGTCACCGTT CCAGGTGCTT 
CCGCATATCG ACTGGGCAGA GCAGAAACCC ACCTACCAGG ATGCGCTGCC GGCGCTGATC 
AACGATGCGC TGGCCCGCGC GAAGTCCCGT CCGAGCGGCA ACTGGTTCCC GTTCGCGGCC 
AGCGACGCCA TCCGGCGTAA ACCGGTGGGC GCCTCGGTGG GCGGCGTCGA ACTCGTCGCG 
TGGCGGGGCG CCTGCGGCGA ACTGCGTGTC GGCCCTGCGA GCTGTCCGCA TCTCGGGGCG 
GACCTGTCCA CCGGCACCGT CGACTGCGGC ACGCTGATCT GCCCCTGGCA CGGCCTGCGG 
CTGTCCGGGG AGCGCCGCGA ATTCGGGTGG AAACCGTTGC CCGCCTTTGA CGACGGGGTA 
CTGGCCTGGG TCCGTCTCGA CCGGGTCGGC GGCGAGCAGC CGACGGACCG CCCGATCATC 
CCGGTGCGTC CGGCGGAACC CAGGCTGCAC GCAGTGACCA GCCTGGTCGG TGTCTGCGAA 
CCGGACGATG TGATCGCCAA CCGGCTCGAC CCGTGGCACG GCGCCTGGTT CCACCCGTAC 
TCGTTCACCC GCCTCGAGGT GCTCAGCGCC CCGGCGGCCG GTGAGGTGCC CGAAGCGGAA 
GACCGGTTCC TCGTGGCGGT CACGTTCCGC ATCGGCCGCC TGGGCGTGCC GGTGGTCGCC 
GAGTTCATCG CGCCCGGACC GCGCACGATC GTCATGCGGA TCGTCGACGG TGAGGGCGCG 
GGCAGCGTCG TGGAAACCCA CGCGACACCC GTCGGTCCGG GTCCGGACGG GCGTCCGCGC 
ACCGCGGTGA TCGAAGCCGT TGTCGCACAC TCGGATCGGC GCCGGTTCGG CTACGGGAAG 
AAGGTCGCGC CGTTGATCAC GCCGTTCATG CGGCATGCGG CGACGAAGCT GTGGCGCGAC 
GACCTCGCGT ATGCGGAGCG CCGTTACGCA GTGCGCTCAC AGCTCAACCG ACGCTGA

Protein sequence

MSAFADIKAK WAKSSPFQVL PHIDWAEQKP TYQDALPALI NDALARAKSR PSGNWFPFAA 
SDAIRRKPVG ASVGGVELVA WRGACGELRV GPASCPHLGA DLSTGTVDCG TLICPWHGLR 
LSGERREFGW KPLPAFDDGV LAWVRLDRVG GEQPTDRPII PVRPAEPRLH AVTSLVGVCE 
PDDVIANRLD PWHGAWFHPY SFTRLEVLSA PAAGEVPEAE DRFLVAVTFR IGRLGVPVVA 
EFIAPGPRTI VMRIVDGEGA GSVVETHATP VGPGPDGRPR TAVIEAVVAH SDRRRFGYGK 
KVAPLITPFM RHAATKLWRD DLAYAERRYA VRSQLNRR