Gene TBFG_10074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TBFG_10074
Symbol
ID	5220737
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium tuberculosis F11
Kingdom	Bacteria
Replicon accession	NC_009565
Strand	+
Start bp	82881
End bp	84116
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	66%
IMG OID	640604814
Product	hypothetical protein
Protein accession	YP_001286019
Protein GI	148821265
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	356
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	178
Fosmid unclonability p-value	0.0244263
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGATC TGAGCATTAG CCAGGTGTCG GCGCGTCCGG GACGGATCGG GATTCGCGCT 
AGGCAAATGT TCGACGGATA CCGGTTTCAG CGTGGTCCCG TGCTGGTCGT GGTCGAGGAT 
GGTCGGATCA GCGCGGTCGA TTTTGCTGGC TCCGCCTGCC CCGATATGAA CCTGGTTGAT 
CTGGGTGAAT CGACTTTGTT GCCGGGTCTG GTGGATGCGC ATGCGCATTT GTGCTGGGAC 
CCCGACGGTA GGCCAGAGGA TTTGGCCGGC GACCCCCATG CGGTGCTGGT GGGACGGGCG 
CGACGGCACG CCGCGGCCGC GTTGCGCTCC GGGATCACCA CGATTCGCGA TCTCGGCGAC 
CGTGACTATG CGGCCTTGGC GCTGCGGGAG GAGTATCGGC AGAAAACGAC GGTGGGGCCG 
GAACTGGTGG TTTCTGGGCC ACCATTGACT CGCAGCGGCG GGCATTGCTG GTTCCTCGGC 
GGCGTGGCCG ATAGCGTCGA GGAGCTGGTT GATGCGGTGC AGGAGCGGGC CGCGCGGGGA 
GCGGATTGGA TCAAGGTGAT GGCCACGGGC GGATTCGTTA CCACAGCATC CGATCCGTGG 
CAGCCGCAGT ACGGCAGCGG CCAACTGGCC GCGGTGGTGG CGGCCGCCGA GCAGGTAGGT 
CTACCGGTGA CCGCACATGC ACATGCCACC GCAGGGATCG CCGCGGCGGT CGCCGCGGGT 
GTTGACGGCA TCGAGCACTG CACGTTCTTG AGCGAAGGCA GCGCCGCCGC CAGCCCGGAT 
GTTGTTGAAG CGATTGTTGC CCAAGGTGTG TGGTGCGGTA TGACGATTCC CCGGGTGTAT 
CCGGAGATGC CGGAGAACCT TGTCGCGGTT GTGCAGGATG GATGGCGAAA CATCCGCCGG 
CTCATCGACG CCGGTGCGCG TGTCGCCCTG TCCACCGACG CTGGAGTCGC CCCGGGCAGA 
CGCCATGACG TGCTCCCCGA CGATTTGGTG TATCTGTCTC GACACGGGTT CACCAGCACA 
GAGGTGCTGA CCGGCGCCAC CGCAGCGGCC GCTGCCAGCT GTGGGCTCGG CCACCGCAAG 
GGTCGCATCG CGCCGGGCTA CGACGCTGAT CTGCTGGCTG TTGCGGCAGG TGTGGACCAT 
GACCCCGCCG GACTCTGCGA CGTCAAAGCC GTCTGGCGCA GCGGAACCCA GGTACCGCTA 
CAAGCATCCG CTGTGGGCTA CAACACCCCG TCATAA

Protein sequence

MGDLSISQVS ARPGRIGIRA RQMFDGYRFQ RGPVLVVVED GRISAVDFAG SACPDMNLVD 
LGESTLLPGL VDAHAHLCWD PDGRPEDLAG DPHAVLVGRA RRHAAAALRS GITTIRDLGD 
RDYAALALRE EYRQKTTVGP ELVVSGPPLT RSGGHCWFLG GVADSVEELV DAVQERAARG 
ADWIKVMATG GFVTTASDPW QPQYGSGQLA AVVAAAEQVG LPVTAHAHAT AGIAAAVAAG 
VDGIEHCTFL SEGSAAASPD VVEAIVAQGV WCGMTIPRVY PEMPENLVAV VQDGWRNIRR 
LIDAGARVAL STDAGVAPGR RHDVLPDDLV YLSRHGFTST EVLTGATAAA AASCGLGHRK 
GRIAPGYDAD LLAVAAGVDH DPAGLCDVKA VWRSGTQVPL QASAVGYNTP S