Gene Tbd_2091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tbd_2091
Symbol
ID	3671993
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thiobacillus denitrificans ATCC 25259
Kingdom	Bacteria
Replicon accession	NC_007404
Strand	-
Start bp	2182805
End bp	2184199
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	67%
IMG OID	637710794
Product	peptidase S1C, Do
Protein accession	YP_315849
Protein GI	74318109
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGAGAG CGGCTCTGGC CATGACGAGC TTCGTGTTTG TGCTGGCGGC GCCGGTCGCG 
GAAGCGGTCG ACGTCGCCGA TCTGGTCGAA AAGCAGGGTC CGGCGGTGGT CAACATCAGC 
ACCACCAAGC TGGTCAAGCG CGGCGCCGAG GGCTTTCCGT TCGCGGTCCC GGAAGACCCC 
GAGATGCAGG AATTCTTTCG CCGCTTCTTT CCGGGCGTGC CGGGTCGGGC GCCCGGGGCA 
CCGGCGCAGG AGTTTCCGGC GCATGGCGCC GGCTCCGGCT TCATCGTTAG TAGCGACGGC 
TACATCCTGA CCAACGCCCA CGTCGTGAAA GGTGCGGACG AAGTCGTCGT CAAGCTGACC 
GACAAACGCA AGTTCATCGC CAAGGTCGTG GGTTCGGACC CGCGCACCGA CGTGGCCGTG 
ATCCGCATCA CGGCGCGCAA CCTGCCGGCG GTGCGCCTCG GCGACCCGGA AAAACTTCGC 
GTCGGTGAGG CAGTGGCTGC GATCGGCTCG CCTTTCGGCT TCGAGAACTC GGTCACCGCG 
GGCATCGTGT CGGCCAAGGG CCGCTCGCTG CCGTCCGAAA GCTACGTGCC CTTCATCCAG 
ACCGACGTCG CGGTTAACCC GGGTAATTCG GGGGGGCCGC TGTTCAACAT GCGCGGCGAA 
GTCGTCGGCA TCAACTCGCA GATCTACAGC CAGAGCGGCG GCTACCAGGG GGTGGCGTTC 
GCGATCCCGA TCGACATCGC GATGGAGGTC GTCGACCAGT TGAAGGCTGG CGGCAAGGTC 
TCGCGCGGCT GGCTTGGCGT CATGATCCAG GAGGTCAGCG CGGACCTCGC CGAATCCTTC 
GGCCTCGACC GGCCGCGCGG CGCGCTCGTG TCGCAGGTAC AGGATGGAAG CCCCGCGGCC 
CGTGCGGGCG TCCAGACCGC CGACGTGATC CTCAGCTTCA ACGGCAAGCC GGTCGAGAAT 
TCTGGCGACC TGCCGCGCAT CGTCGGCAGC ACCAAGCCCG GGTCGAAGAT CCCGATGCAG 
GTCTGGCGGC GCGGCAAAAT GCAGACCCTG CAGGTCGTCC TGGCCGAGCT GCCGAGCGAA 
GAGCAGGTCG CCGGCGCGGG CAAGAGCGGC AAGAGCTACT CGCGCGGCGG CCTCGCGCTG 
TCCGAACTCA ACCCCGAACA GCGGCGCGAG CTCAAGATCG ACCACGGCCT GCTCGTCGAG 
GAAGTCACCG GCGACGCCGC TCGGGCCGGC ATCCGGGTGG GGGACATCGT CCTCGCCGTC 
AACAATGCAA GGATCGCGAC CGTCGACGCG TTCCGCCAGG CGATCGCGGC GATCCCGAAA 
GGCAAGAGCG CTGCGCTCCT GGTGCGGCGC GGCGAAGGAT CGCTGTACAT CCCGCTGAAG 
ATTTCGGGTG AGTAA

Protein sequence

MLRAALAMTS FVFVLAAPVA EAVDVADLVE KQGPAVVNIS TTKLVKRGAE GFPFAVPEDP 
EMQEFFRRFF PGVPGRAPGA PAQEFPAHGA GSGFIVSSDG YILTNAHVVK GADEVVVKLT 
DKRKFIAKVV GSDPRTDVAV IRITARNLPA VRLGDPEKLR VGEAVAAIGS PFGFENSVTA 
GIVSAKGRSL PSESYVPFIQ TDVAVNPGNS GGPLFNMRGE VVGINSQIYS QSGGYQGVAF 
AIPIDIAMEV VDQLKAGGKV SRGWLGVMIQ EVSADLAESF GLDRPRGALV SQVQDGSPAA 
RAGVQTADVI LSFNGKPVEN SGDLPRIVGS TKPGSKIPMQ VWRRGKMQTL QVVLAELPSE 
EQVAGAGKSG KSYSRGGLAL SELNPEQRRE LKIDHGLLVE EVTGDAARAG IRVGDIVLAV 
NNARIATVDA FRQAIAAIPK GKSAALLVRR GEGSLYIPLK ISGE