Gene Mmcs_5234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_5234
Symbol
ID	4114062
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	5519949
End bp	5521496
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	72%
IMG OID	638034391
Product	putative DNA-binding protein
Protein accession	YP_642392
Protein GI	108802195
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism [T] Signal transduction mechanisms
COG ID	[COG2508] Regulator of polyketide synthase expression
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.198671
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTCACTT TGGACCGGCT CGTCAATGTG CTCGGCGGTT ACGGCGTCCA GTTCCGGGCG 
GGTTCGGCGC CGCGCTCGAC CGAGTTGCGC ACCGTGGTGA TCCACGAGGA TCGCCACGTC 
GTCGGCGACG TCCTGCTGGC GGTCGGAGCC GATTCGGTGG CCACCGCACT CGAATGGGCG 
CGCGCCGCAC GGGCGGCGGT GGTGCTGGTC CGCGGCGACG ACGTCGGTGT GGACGCGACA 
CCGGCCGGCG GGCCCGCGGT TCTCACGGTC GACCCCGACG TGTCCTGGAG TGAGTTGGCG 
GCGCTGGTGT TCGGCCTGGT GCTCGAGGGG CGCGAGACGG AGTCCGGGCG CGGCCCGACC 
GATCTGTTCG CGCTGGCCGA CAGCCTGGCC GACGCGATCG GCGGTGCGGT CACCATCGAG 
GACCGGCACT GGCGGGTGCT GGCCTACTCG CGGATGCAGC AACACGCCGA TGACGCGCGC 
GTCGCGACCA TCCTCGGTAG GCAGGCCCCC GACAGACTGC GGGCGCTGTT CACCGAACGC 
GGCGTAGCCC GGCACCTCGC CAACTCGGAT GAACCGATGT TCGTGGCCCC CGCACCCGCC 
GACGGGCTCG CCGGCCGGAT GGTGATCGCG GCCCGCGCCG GTCGCGAACT GCTCGGCTCG 
GTGTGGGTGG CCTGCGCGGA GGAGTTGCGC GGTGACCAGC TGCGCGCGTT GGCCGACGGC 
GCCCGCATGG TCGCACTGCA CCTGTTGCGG TCGCGGGCCA GCGCCGACCT CGAGCGCCAG 
GTGGAATCCG ATCTGGTGAT CGGTCTGCTG GAGGGCACCG TCGACGCCCC GACGGTGGTG 
AGCAAGCTGG CGTTGCCGCC TGCGGGACTG CGGGTCATCG CGCTGCGCGC CCGCCTCGGC 
GAGGAACGCC ACGCGGCGCT GCTGTTGGCC TTCGAACGCG CGACCACGGG TTTCGGGTGG 
TCGCGGCCCG GCCGCTCCAC GCTGTCGGCC ACCACCGTCT ACACCGTGTT GCCCAGCGAA 
CCGGCGGAGA CCGCGCGCCG CTGGGTGGAC AGCCTGCGGG CCGCACTGCC GGAACGGGCC 
GCCATCCTCG CCGGAATCAG CAGTACGGCA ACGGTTTTGG AACTGCCGAC GGCTCGTGAC 
GAGGCCGACG AGTGCCTGGC GCTGCACGAA CTGCAGGGCG GCGTCGGCGA GGCGCCCGCC 
TACGACGAGT CCTGGGACGA CATCGTGCTG CGGCGGCTGC GGATCGCCGC GCGCGTCGGC 
CGCACCCCGC AACGCGGACC GGTGGCCGAC CTGCGGCGCC ACGACGAGCA TCACGGGACC 
CGCTACGTGG ACACGCTGCG CGCCTGGCTG GCCGCGCAGG GAGATCTGCA CGAGGCGGCC 
GAGCGCCTGG GCGTGCACGA GAACACCGTG CGCTACCGGC TGCGCAAGAT GGCCGAGGTC 
ACCGACCTCG ACCTGACCGA CGCGCGCAAG CGGCTGGCCA TGACGGTCGA ACTCGCCGCT 
ACAGACGACG ACGGTTTCAC GTTGTCGGAG GCCGACAAAA TTTCGTGA

Protein sequence

MVTLDRLVNV LGGYGVQFRA GSAPRSTELR TVVIHEDRHV VGDVLLAVGA DSVATALEWA 
RAARAAVVLV RGDDVGVDAT PAGGPAVLTV DPDVSWSELA ALVFGLVLEG RETESGRGPT 
DLFALADSLA DAIGGAVTIE DRHWRVLAYS RMQQHADDAR VATILGRQAP DRLRALFTER 
GVARHLANSD EPMFVAPAPA DGLAGRMVIA ARAGRELLGS VWVACAEELR GDQLRALADG 
ARMVALHLLR SRASADLERQ VESDLVIGLL EGTVDAPTVV SKLALPPAGL RVIALRARLG 
EERHAALLLA FERATTGFGW SRPGRSTLSA TTVYTVLPSE PAETARRWVD SLRAALPERA 
AILAGISSTA TVLELPTARD EADECLALHE LQGGVGEAPA YDESWDDIVL RRLRIAARVG 
RTPQRGPVAD LRRHDEHHGT RYVDTLRAWL AAQGDLHEAA ERLGVHENTV RYRLRKMAEV 
TDLDLTDARK RLAMTVELAA TDDDGFTLSE ADKIS