Gene Mmcs_5038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_5038
Symbol
ID	4113867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	5338110
End bp	5339045
Gene Length	936 bp
Protein Length	311 aa
Translation table	11
GC content	72%
IMG OID	638034196
Product	cell envelope-related transcriptional attenuator
Protein accession	YP_642198
Protein GI	108802001
COG category	[K] Transcription
COG ID	[COG1316] Transcriptional regulator
TIGRFAM ID	[TIGR00350] cell envelope-related function transcriptional attenuator common domain

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGTCC TGCTTGTCAT GGTGGTGTCG CTGGTCGGCC TGACCGTGTG GGTCGACACG 
TCACTGCAGC GCATCCCCGC CCTGGCCGCC TATCCCGACC GGCCGGCCGC CGGTCGCGGC 
ACCACCTGGC TGCTGGTCGG CTCCGACAGC CGCGCCGGCC TCGACGCCGA ACAGCAGGCC 
CAGCTCGCCA CCGGCGGTGA CGTCGGCAAC GGACGCACCG ACACGATCAT GCTCGTCCAC 
CTCCCCGGCC TGACCTCGAG CGCACCCGCG ACCATGGTGT CGATCCCGCG CGACTCCTAT 
GTGCCGATCC CCGGGTACGG CGAGGACAAG ATCAACGCCG CATTCGCGCT GGGCGGCGCG 
CCGCTGCTCG CCCAGACCGT CGAGCAGGCC ACCGGTATGC GCCTCGACCA CTACGCCGAG 
GTCGGATTCG ACGGGTTCGC CTCGGTCGTC GACGCCGTCG GCGGCGTGAC GATGTGCCCG 
GCGGAGCCCA TCAACGATCC GCTGGCCGGG ATCGACCTGC CCGCCGGATG TCAGGAACTC 
GACGGGCGCA ATGCGCTCGG CTTCGTGCGC ACTCGCGCCA CCCCGCGCGC CGACCTGGAC 
CGGATGACCC ACCAGCGGGA GTTCATGTCC GCGCTGCTGC ATCGCGCGGC CAGCCCGGCG 
GTCCTGCTCA ACCCGCTGCG CTGGTATCCG ATGGCGAGCG CGGCCGGCGG CGCACTGACC 
GTCGACACCG GTGCGCACGT TTGGGATCTC GCCCGGCTCG GCTGGGCGCT GCGCGGTGAT 
CTGACCACCA CGACGGTGCC CATCGGGGAG TTCACCGACG GCGGTGCCGG CGCCGTCGTG 
GTCTGGGACA GCGAGGCCGC CGGACGCCTC TTCGACGCGC TGTCAACCGA CACGCCGATC 
CCCGCCGACG TGCTCGACAC CACACCGGGC GGCTGA

Protein sequence

MAVLLVMVVS LVGLTVWVDT SLQRIPALAA YPDRPAAGRG TTWLLVGSDS RAGLDAEQQA 
QLATGGDVGN GRTDTIMLVH LPGLTSSAPA TMVSIPRDSY VPIPGYGEDK INAAFALGGA 
PLLAQTVEQA TGMRLDHYAE VGFDGFASVV DAVGGVTMCP AEPINDPLAG IDLPAGCQEL 
DGRNALGFVR TRATPRADLD RMTHQREFMS ALLHRAASPA VLLNPLRWYP MASAAGGALT 
VDTGAHVWDL ARLGWALRGD LTTTTVPIGE FTDGGAGAVV VWDSEAAGRL FDALSTDTPI 
PADVLDTTPG G