Gene Mmcs_1646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_1646
Symbol
ID	4110481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	1783964
End bp	1785145
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	63%
IMG OID	638030766
Product	Rieske (2Fe-2S) region
Protein accession	YP_638812
Protein GI	108798615
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.719874
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAGCTTG GACCGACGAT GGAGTTCGAC CACATACAGC CGGCGATCCG GAAACGGTTC 
ACCTCTGCAG CGGACATCCC CAAGGAGGTG TTCAGCGACC CCGACGTCTA CCGGGAAGAG 
CTCACCCGCA TCTTCTATGG CCCCTACTGG CATCCGATCG CGCACCGGGC CGAGCTGGCC 
GAGCGCAACG CCTTCCGGAC GAGATGGCTG GCCGACGTGC CGCTGCTGAT GGTGCGAGAC 
GGCGATGACC GCATCCGCGT GTTCGTCAAC TCCTGCGCCC ATCGGGGAAC GCTACTGGAA 
CAGCGCCGGT GCGGGGTGGC GGAGCGATTC GAGTGTCCGT ATCACCGGTG GATCTTCAAC 
AATGACGGCC GTTTCGCCGG CGCGCCCCGC CGCATGCAGT TTCGCCCGGA CTTTCGCGAG 
GAGGACTACG GCCTCCGGGA GCTGCACGTA GTCGAGGCGT GGGGTTTGAT CTTCGTCAGC 
ATGGCTGCGC AGCCGCCGCC GTTCGACGAT TATCTCGGCG ATAGCGCGGA TCCGTTGCGC 
GACTGCATGG TCGATGACGG GAACTTGACG TTGCTGGGCT ACCAGACGGT GGTGTTTCAG 
AGTAATTGGA AAACCTACAT CGACAACGAT CCCTATCACG CGCCGCTGCT GCACAGCGCA 
TTCAAACTGC TCAACTGGCA GGGCGGCAGC GGAAACGTCT TGGTCAGCAA GCCCTATGGG 
CACATGTCGA TTCTGTACGA TGCGCAACCC TACGTGGACA ACGGTTTCCT GGCTGACCCG 
AGTGTGGTCA CGCGGATGGG GGATGACAGC CGAGCCCGCG TGATTGCGTT ACGGCCGGTT 
ACCGGGATCG TGCGTCACGT CGACACGATC AACATCCGGT ACGCCCGCCC GCTGGGGGTT 
GATCGTACCG AGGTGCGATA CACGTTCTTC GGCCATGCCA GTGACTCCGA GGACTTCGCA 
CGCCACCGAG TCCGCCAGTC GTCAAATCTG CTGGGGCCGA GCGGCTTCAT CAGTATCGAG 
GACGCCGCCG TCTACAACCG CGTGCAGGCG ACCGCGCGTG ACGGCGGCTA TCAGCGCTTT 
GTCGCCGGCG TCGGCCGACC ATTGTCGGAG TCGTCGCAGA ACGACGAGGT CGCCAATACC 
GGCTGGTGGG CGCACTACCA GGAGGTGATG GAGTTTTGCT GA

Protein sequence

MKLGPTMEFD HIQPAIRKRF TSAADIPKEV FSDPDVYREE LTRIFYGPYW HPIAHRAELA 
ERNAFRTRWL ADVPLLMVRD GDDRIRVFVN SCAHRGTLLE QRRCGVAERF ECPYHRWIFN 
NDGRFAGAPR RMQFRPDFRE EDYGLRELHV VEAWGLIFVS MAAQPPPFDD YLGDSADPLR 
DCMVDDGNLT LLGYQTVVFQ SNWKTYIDND PYHAPLLHSA FKLLNWQGGS GNVLVSKPYG 
HMSILYDAQP YVDNGFLADP SVVTRMGDDS RARVIALRPV TGIVRHVDTI NIRYARPLGV 
DRTEVRYTFF GHASDSEDFA RHRVRQSSNL LGPSGFISIE DAAVYNRVQA TARDGGYQRF 
VAGVGRPLSE SSQNDEVANT GWWAHYQEVM EFC