Gene TBFG_10126 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TBFG_10126
Symbol
ID	5220789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium tuberculosis F11
Kingdom	Bacteria
Replicon accession	NC_009565
Strand	+
Start bp	151464
End bp	152531
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	68%
IMG OID	640604866
Product	serine protease pepA
Protein accession	YP_001286071
Protein GI	148821317
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	158
Plasmid unclonability p-value	9.16358e-29
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	206
Fosmid unclonability p-value	0.942677
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAATT CGCGCCGCCG CTCACTCAGG TGGTCATGGT TGCTGAGCGT GCTGGCTGCC 
GTCGGGCTGG GCCTGGCCAC GGCGCCGGCC CAGGCGGCCC CGCCGGCCTT GTCGCAGGAC 
CGGTTCGCCG ACTTCCCCGC GCTGCCCCTC GACCCGTCCG CGATGGTCGC CCAAGTGGGG 
CCACAGGTGG TCAACATCAA CACCAAACTG GGCTACAACA ACGCCGTGGG CGCCGGGACC 
GGCATCGTCA TCGATCCCAA CGGTGTCGTG CTGACCAACA ACCACGTGAT CGCGGGCGCC 
ACCGACATCA ATGCGTTCAG CGTCGGCTCC GGCCAAACCT ACGGCGTCGA TGTGGTCGGG 
TATGACCGCA CCCAGGATGT CGCGGTGCTG CAGCTGCGCG GTGCCGGTGG CCTGCCGTCG 
GCGGCGATCG GTGGCGGCGT CGCGGTTGGT GAGCCCGTCG TCGCGATGGG CAACAGCGGT 
GGGCAGGGCG GAACGCCCCG TGCGGTGCCT GGCAGGGTGG TCGCGCTCGG CCAAACCGTG 
CAGGCGTCGG ATTCGCTGAC CGGTGCCGAA GAGACATTGA ACGGGTTGAT CCAGTTCGAT 
GCCGCGATCC AGCCCGGTGA TTCGGGCGGG CCCGTCGTCA ACGGCCTAGG ACAGGTGGTC 
GGTATGAACA CGGCCGCGTC CGATAACTTC CAGCTGTCCC AGGGTGGGCA GGGATTCGCC 
ATTCCGATCG GGCAGGCGAT GGCGATCGCG GGCCAGATCC GATCGGGTGG GGGGTCACCC 
ACCGTTCATA TCGGGCCTAC CGCCTTCCTC GGCTTGGGTG TTGTCGACAA CAACGGCAAC 
GGCGCACGAG TCCAACGCGT GGTCGGGAGC GCTCCGGCGG CAAGTCTCGG CATCTCCACC 
GGCGACGTGA TCACCGCGGT CGACGGCGCT CCGATCAACT CGGCCACCGC GATGGCGGAC 
GCGCTTAACG GGCATCATCC CGGTGACGTC ATCTCGGTGA CCTGGCAAAC CAAGTCGGGC 
GGCACGCGTA CAGGGAACGT GACATTGGCC GAGGGACCCC CGGCCTGA

Protein sequence

MSNSRRRSLR WSWLLSVLAA VGLGLATAPA QAAPPALSQD RFADFPALPL DPSAMVAQVG 
PQVVNINTKL GYNNAVGAGT GIVIDPNGVV LTNNHVIAGA TDINAFSVGS GQTYGVDVVG 
YDRTQDVAVL QLRGAGGLPS AAIGGGVAVG EPVVAMGNSG GQGGTPRAVP GRVVALGQTV 
QASDSLTGAE ETLNGLIQFD AAIQPGDSGG PVVNGLGQVV GMNTAASDNF QLSQGGQGFA 
IPIGQAMAIA GQIRSGGGSP TVHIGPTAFL GLGVVDNNGN GARVQRVVGS APAASLGIST 
GDVITAVDGA PINSATAMAD ALNGHHPGDV ISVTWQTKSG GTRTGNVTLA EGPPA