Gene TBFG_11195 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TBFG_11195
Symbol
ID	5221872
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium tuberculosis F11
Kingdom	Bacteria
Replicon accession	NC_009565
Strand	+
Start bp	1304068
End bp	1304979
Gene Length	912 bp
Protein Length	303 aa
Translation table	11
GC content	68%
IMG OID	640605949
Product	N-acetyl-1-D-myo-inosityl-2-amino-2-deoxy-alpha- D-glucopyranoside deacetylase mshB
Protein accession	YP_001287140
Protein GI	148822386
COG category	[S] Function unknown
COG ID	[COG2120] Uncharacterized proteins, LmbE homologs
TIGRFAM ID	[TIGR03445] 1D-myo-inosityl-2-acetamido-2-deoxy-alpha-D-glucopyranoside deacetylase

Plasmid Coverage information

Num covering plasmid clones	420
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	262
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAGA CGCCGCGGCT GCTGTTTGTT CATGCACACC CCGACGATGA GAGCCTGAGC 
AACGGCGCAA CCATCGCGCA CTACACCTCC CGTGGCGCAC AGGTCCATGT CGTCACGTGC 
ACCCTGGGTG AGGAGGGCGA GGTCATTGGC GATCGCTGGG CTCAACTCAC CGCCGATCAT 
GCGGACCAAC TCGGTGGCTA CCGCATCGGC GAGCTCACCG CGGCGTTGCG AGCGCTCGGG 
GTCAGCGCAC CGATCTACCT TGGCGGCGCG GGTCGCTGGC GCGACTCCGG CATGGCCGGC 
ACAGACCAGC GGAGTCAGCG GAGATTCGTC GATGCTGACC CCCGGCAGAC CGTCGGGGCA 
TTGGTCGCGA TCATTCGCGA GCTGCGGCCG CATGTCGTGG TGACCTATGA CCCCAATGGC 
GGTTACGGTC ATCCTGACCA CGTGCACACC CACACCGTCA CTACCGCCGC GGTGGCCGCA 
GCGGGTGTTG GGTCCGGTAC CGCAGATCAC CCCGGCGACC CGTGGACGGT GCCGAAGTTC 
TACTGGACGG TCTTGGGTCT GAGCGCGCTC ATTTCGGGCG CGCGAGCCCT GGTCCCCGAC 
GATCTGCGAC CCGAATGGGT GTTGCCGCGG GCCGACGAGA TTGCATTCGG GTACTCCGAC 
GACGGTATCG ACGCCGTCGT CGAGGCCGAT GAGCAGGCGC GAGCCGCCAA GGTTGCGGCA 
CTGGCTGCCC ATGCCACCCA AGTTGTCGTC GGCCCGACCG GCCGGGCCGC CGCCTTGTCG 
AACAACCTGG CACTGCCCAT CCTGGCCGAT GAGCATTACG TGCTCGCCGG CGGCTCCGCG 
GGCGCCCGCG ATGAACGTGG CTGGGAAACT GATCTGCTCG CCGGTCTGGG CTTCACCGCG 
TCCGGCACGT AG

Protein sequence

MSETPRLLFV HAHPDDESLS NGATIAHYTS RGAQVHVVTC TLGEEGEVIG DRWAQLTADH 
ADQLGGYRIG ELTAALRALG VSAPIYLGGA GRWRDSGMAG TDQRSQRRFV DADPRQTVGA 
LVAIIRELRP HVVVTYDPNG GYGHPDHVHT HTVTTAAVAA AGVGSGTADH PGDPWTVPKF 
YWTVLGLSAL ISGARALVPD DLRPEWVLPR ADEIAFGYSD DGIDAVVEAD EQARAAKVAA 
LAAHATQVVV GPTGRAAALS NNLALPILAD EHYVLAGGSA GARDERGWET DLLAGLGFTA 
SGT