Gene TBFG_10370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TBFG_10370
Symbol
ID	5221034
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium tuberculosis F11
Kingdom	Bacteria
Replicon accession	NC_009565
Strand	-
Start bp	446235
End bp	447365
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	68%
IMG OID	640605111
Product	hypothetical protein
Protein accession	YP_001286315
Protein GI	148821561
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4833] Predicted glycosyl hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	337
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	208
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCTGG CAAACCGGGC AGCCAGCGCC GAAACCGCCG TCACGCAACG GCATCTGAGA 
CGGCTTTGGG CGTTGCCGGG CACCCAGTTG GCGGTGGTGG CTTGGCCGTC AACCCGGCGC 
GACCGGTTGT TCGGCAGCTG GCACTACTGG TGGCAGGCAC ACCTGCTGGA TTGCCTGGTC 
GACGCGCAGC TGCGCGACCC GCAGCCGCAG CGGCGCGCCC GGATCAACCG CCAGGTCCGC 
TCGCACCGGG TCCGCAACAA TTTCTCGTGG CTCAACAGCT ATTACGACGA CATGGCGTGG 
CTAGCGTTAG CGCTGGAACG TGCCGACCGG GTCGCCGGGG TACGACGCCG GCGCGCACTG 
CCCAAGCTCA CCAACCAGTT CGTCGAAGCC TGGGTGCCCG AGGACGGCGG CGGCATCCCG 
TGGCGCAAGC AGGACCAGTT CTTCAACGCC CCAGCCAACG GCCCGGCCGG GCTATTCCTG 
GCCCGCTACC CAGACCAGTA CGGGAAAAGG CTCAAGCGCG CAGAACAGAT GGCCGACTGG 
ATCGATCGCA CGCTGATCGA TCCGGAGACA CACCTGGTAT TCGACGGCAT CAAGGCCGGG 
TCGTTGGTCC GCGCGCAGTA CACCTACTGC CAAGGGGTGG TGCTCGGGCT GGAAACCGAG 
CTGGCGGTGC GCACCGGTCC GGCAGCCAGA GCGCGGCACT GCGCTCGCGT TCATCGCTTG 
GTCGCGGCCG TCAACGAGCA CATGGCTCCA TTGGGTGTGT TACGGGGCGC CGGCGGCGGG 
GACGGTGGCC TGTTCGCGGG GATCACCGCC CGATACCTCG CCTTGGTCGC CACCACGTTG 
CCGGGCGACT CGGCCGACGA CGCCGCCGCC CGCGACACCG CCCGCGCGAT AGTGCTGGCT 
AGCGCGCAAT CGGCGTGGGA TTACCGGCAA ACCGTGGACG GGTTGCCGGT GTTCGGGGCG 
TTCTGGGATC GCGAAGCCGA GTTGCCCACC GCCGGCGGTG AGCAGGCGCG GTCCGTCCGA 
GGAGCGGTGC ATAGCTCGGC GATTGCCGAG CGAGATCTGT CGGTGCAGCT ATCGGGTTGG 
ATGCTGATGG AAGCCGCCCA CAGCGCCGCA GCGGTCAGCT CACTCGGGTA A

Protein sequence

MNLANRAASA ETAVTQRHLR RLWALPGTQL AVVAWPSTRR DRLFGSWHYW WQAHLLDCLV 
DAQLRDPQPQ RRARINRQVR SHRVRNNFSW LNSYYDDMAW LALALERADR VAGVRRRRAL 
PKLTNQFVEA WVPEDGGGIP WRKQDQFFNA PANGPAGLFL ARYPDQYGKR LKRAEQMADW 
IDRTLIDPET HLVFDGIKAG SLVRAQYTYC QGVVLGLETE LAVRTGPAAR ARHCARVHRL 
VAAVNEHMAP LGVLRGAGGG DGGLFAGITA RYLALVATTL PGDSADDAAA RDTARAIVLA 
SAQSAWDYRQ TVDGLPVFGA FWDREAELPT AGGEQARSVR GAVHSSAIAE RDLSVQLSGW 
MLMEAAHSAA AVSSLG