Gene TBFG_10547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TBFG_10547
Symbol
ID	5221211
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium tuberculosis F11
Kingdom	Bacteria
Replicon accession	NC_009565
Strand	+
Start bp	630476
End bp	631516
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	70%
IMG OID	640605288
Product	UDP-glucose 4-epimerase galE3
Protein accession	YP_001286492
Protein GI	148821738
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	263
Plasmid unclonability p-value	0.00000700436
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	208
Fosmid unclonability p-value	0.976314
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGGTGC TGCTGACCGG CGCGGCCGGC TTCATCGGGT CGCGCGTGGA TGCGGCGTTA 
CGGGCTGCGG GTCACGACGT GGTGGGCGTC GACGCGCTGC TGCCCGCCGC GCACGGGCCA 
AACCCGGTGC TGCCACCGGG CTGCCAGCGG GTCGACGTGC GCGACGCCAG CGCGCTGGCC 
CCGTTGTTGG CCGGTGTCGA TCTGGTGTGT CACCAGGCCG CCATGGTGGG TGCCGGCGTC 
AACGCCGCCG ACGCACCCGC CTATGGCGGC CACAACGATT TCGCCACCAC GGTGCTGCTG 
GCGCAGATGT TCGCCGCCGG GGTCCGCCGT TTGGTGCTGG CGTCGTCGAT GGTGGTTTAC 
GGGCAGGGGC GCTATGACTG TCCCCAGCAT GGACCGGTCG ACCCGCTGCC GCGGCGGCGA 
GCCGACCTGG ACAATGGGGT CTTCGAGCAC CGTTGCCCGG GGTGCGGCGA GCCAGTCATC 
TGGCAATTGG TCGACGAGGA TGCCCCGTTG CGCCCGCGCA GCCTGTACGC GGCCAGCAAG 
ACCGCGCAGG AGCACTACGC GCTGGCGTGG TCGGAAGCGA GTGGCGGTTC GGTGGTGGCG 
TTGCGCTACC ACAACGTCTA CGGCCCCGGC ATGCCGCGCG ACACCCCCTA CTCCGGAGTG 
GCCGCGATCT TCCGCTCGGC GGTTGAAAAA GGCAAGCCAC CAAAGGTTTT CGAAGACGGC 
GGCCAGATGC GGGACTTCGT GCACGTGGAC GACGTGGCCG CGGCGAACCT CGCCGCGGTG 
CATCTGGGTG AAGCGGACCG CGACGGGTTT ACCGCGGTCA ACGTCTGTTC CGGGCGCCCC 
ATCTCGATCC TTCAGGTGGC AACCGCGATA TGCGACGCCC GCGGTGGCTC GATGTCCCCG 
GCCATCACCG GGCACTACCG CAGCGGCGAC GTGCGCCACA TTGTCGCCGA TCCCGCGCGG 
GCCGCCCGCG TGCTCGGGTT CCGCGCGGCC GTCGATCCAG GCGAAGGACT GCGTGAGTTC 
GCGTTCGCGC CGCTTCGCTG A

Protein sequence

MRVLLTGAAG FIGSRVDAAL RAAGHDVVGV DALLPAAHGP NPVLPPGCQR VDVRDASALA 
PLLAGVDLVC HQAAMVGAGV NAADAPAYGG HNDFATTVLL AQMFAAGVRR LVLASSMVVY 
GQGRYDCPQH GPVDPLPRRR ADLDNGVFEH RCPGCGEPVI WQLVDEDAPL RPRSLYAASK 
TAQEHYALAW SEASGGSVVA LRYHNVYGPG MPRDTPYSGV AAIFRSAVEK GKPPKVFEDG 
GQMRDFVHVD DVAAANLAAV HLGEADRDGF TAVNVCSGRP ISILQVATAI CDARGGSMSP 
AITGHYRSGD VRHIVADPAR AARVLGFRAA VDPGEGLREF AFAPLR