Gene TBFG_10059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TBFG_10059
Symbol
ID	5220722
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium tuberculosis F11
Kingdom	Bacteria
Replicon accession	NC_009565
Strand	+
Start bp	64013
End bp	65071
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	60%
IMG OID	640604799
Product	hypothetical protein
Protein accession	YP_001286004
Protein GI	148821250
COG category	[R] General function prediction only
COG ID	[COG2110] Predicted phosphatase homologous to the C-terminal domain of histone macroH2A1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	103
Plasmid unclonability p-value	5.2281899999999994e-51
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	210
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACGT ACGGCTCTGG CGACCTCCTT CGGGCTGACA CCGAAGCGCT CGTCAACACC 
GTCAACTGTG TTGGGGTGAT GGGCAAGGGA ATTGCGCTGC AGTTCAAACG CCGCTACCCC 
GAGATGTTCA CCGCCTACGA AAAGGCGTGC AAACGCGGCG AAGTTACCAT CGGCAAGATG 
TTCGTCGTCG ACACCGGACA GCTCGACGGA CCGAAACACA TCATCAACTT CCCCACCAAG 
AAACACTGGC GTGCACCGTC GAAGCTGGCC TATATCGACG CCGGCCTCAT TGATCTCATC 
CGCGTGATCC GTGAACTCAA CATTGCTTCT GTGGCAGTTC CCCCGCTGGG GGTGGGCAAC 
GGAGGTCTGG ATTGGGAAGA TGTCGAGCAA CGGCTCGTAT CAGCATTCCA GCAGCTGCCC 
GACGTTGACG CCGTGATCTA CCCCCCATCA GGTGGATCTC GCGCCATCGA GGGCGTCGAA 
GGACTTCGGA TGACCTGGGG GCGCGCCGTC ATACTCGAAG CGATGCGGCG ATATCTCCAG 
CAGCGCCGCG CGATGGAGCC GTGGGAAGAC CCTGCAGGGA TCTCGCATCT GGAGATTCAG 
AAGCTCATGT ACTTCGCCAA CGAGGCCGAT CCCGATCTTG CGCTAGATTT CACGCCCGGC 
CGATACGGGC CATACAGCGA ACGTGTCCGT CACTTACTGC AAGGAATGGA GGGCGCATTC 
ACAGTCGGCC TGGGTGACGG CACCGCAAGA GTTCTTGCGA ACCAACCGAT CTCGTTGACT 
ACTAAGGGAA CTGACGCCAT AACGGACTAT CTGGCCACCG ATGCGGCAGC TGACCGGGTG 
AGCGCCGCAG TCGACACGGT GTTGCGCGTC ATCGAAGGCT TTGAAGGCCC ATACGGGGTT 
GAGCTGCTCG CCAGTACGCA TTGGGTGGCC ACACGTGAGG GCGCCAAGGA ACCAGCCACG 
GCAGCGGCCG CGGTCCGAAA GTGGACAAAA CGCAAGGGTC GGATCTACAG CGACGATCGC 
ATCGGTGTTG CCCTCGACCG CATTCTTATG ACTGCCTGA

Protein sequence

MITYGSGDLL RADTEALVNT VNCVGVMGKG IALQFKRRYP EMFTAYEKAC KRGEVTIGKM 
FVVDTGQLDG PKHIINFPTK KHWRAPSKLA YIDAGLIDLI RVIRELNIAS VAVPPLGVGN 
GGLDWEDVEQ RLVSAFQQLP DVDAVIYPPS GGSRAIEGVE GLRMTWGRAV ILEAMRRYLQ 
QRRAMEPWED PAGISHLEIQ KLMYFANEAD PDLALDFTPG RYGPYSERVR HLLQGMEGAF 
TVGLGDGTAR VLANQPISLT TKGTDAITDY LATDAAADRV SAAVDTVLRV IEGFEGPYGV 
ELLASTHWVA TREGAKEPAT AAAAVRKWTK RKGRIYSDDR IGVALDRILM TA