Gene TDE1195 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TDE1195
Symbol
ID	2741156
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Treponema denticola ATCC 35405
Kingdom	Bacteria
Replicon accession	NC_002967
Strand	-
Start bp	1227724
End bp	1229781
Gene Length	2058 bp
Protein Length	685 aa
Translation table	11
GC content	41%
IMG OID	637160073
Product	prolyl endopeptidase
Protein accession	NP_971802
Protein GI	42526704
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1505] Serine proteases of the peptidase family S9A
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00494828
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATATA AAAAATCGGA TGTTTCCGAC AATTATTTTG GAACCATCGT GCCTGATCCG 
TACCGATGGC TTGAAGACGA TAATGCACCC GAAGTCATAG CTTGGGTTAA AGAAGAAAAT 
AAAAAAACCG AAGATTTTTT ATCCAAAATC TCTTTCAGAG GAGAGCTAAA AAAACGGCTT 
GAAGAAATTT GGGATTATGA AAAACGTTCA GGTCTTTTTA AGGCAGGAAA TTTCTATTAT 
TTTTTTAGAA CGGAAGGCTT ACAAAATCAA AGCATTATGT GCCGCCAAAG CGGAAACATA 
AAGGCGGAAA GCTCTCCTGA AGTCTTTTTT GATCCGAATA AGCTAAGCGC GGACGGAACT 
ACGGCCTTAA AAAATCTTGC CTTTTCCAAG GATGGAAAAT ACATGGCCTA CTCCGTATCG 
GGAAGCGGCT CCGACTGGGA AGAAATCTTT GTCTTTGATG CCGAAAAAAA AGCCGATACG 
GGAGAACACA TCCACTGGGT AAAATTTTCC AATATTGCAT GGTATAAGGA CGGTTTTTTT 
TACAGCTCAT ACGATACTCC CGATAAAGGA AAATCTTTAA CCGAAAAAAA CGAATTCCAA 
AAGTTAAAAT ACCATAAACT TGGAACAAAA GAAAGCGATG ACCTTCTCAT TTTTGAGGAC 
AAGGATCATC CCCTGCGCTC TTTTTCTGCA AGTACAACTG AAGACGAGAA AACCCTCCTT 
CTTACCGCTT TTGAAGTAGG AAGTGAGGGC AATATGCTCT TTGTTGCGGA TCTAAGCGAA 
GGTCTTCCGA AATGTTCACA CTGCTTTAAA CAATACAACA CTCATTTTAA TGACAGTGTC 
TGGCCCCTTG AAACCGAAAA CGGCTTTTTA TATTTATTAA CAAATAAACA AGCTCCATTT 
TACCGAGTTG TAAAGACATC TTTAAACAAT ATAAGTGAAA AGTCCATCGA TGAAGTAATC 
CCTCAAAAAG ACTGCCTTTT ATCAAGCGCG GCCCTTTGCG GAGGAAAACT TCTTACGGTT 
TACTTGAGGG ATGTTCAGGA TGAGGCCTTT ATCTGCGGCC TTGACGGAAA AAATAGCACA 
AAAATAAATC TGCCTGCAAA TGGAAGTATT TCTTTTTCAG GAACACGAAA AAATGAAGAC 
TCTTTATTTT TCAATTTTAC CTCTTATACA ACTCCCAACA AAATCATACG CTATGATATA 
AAAACAAACA GTTTAACCGA CTTTTTTGTT CCTGCCATTC CAATCAACAC AGGAGATTTT 
AAATGCGAAC AGGTCTTTTT TAAGAGCAAG GACGGAACAA AAATTCCTAT GCACATTGTT 
TCAAAAAAAG ATATTAAACT CGATGGAAGT AACCCTACGA TTATGTATGG GTACGGAGGC 
TTTGCTATTT CTCTTCCACC TGCCTTTTCT GCAGCCAGAA TGGCCTTTTT GGAAAAAGGA 
GGCATCTTTG CCTGCGTAAA TTTACGCGGC GGCCTTGAAT ACGGAGAAGC ATGGCACTCG 
GCAGGAAAAA AGATGAAAAA ACAAAACGTC TTCGACGATT TTATTGCAGC CGGAGAATAT 
TTGATAGAAC ACAAATATAC TTCAAGCAAA AAACTTGCAA TTCAAGGAGG CTCAAACGGA 
GGCCTTTTAA TAGGAGCCGT AACAAACCAA CGCCCCGATC TTTTTGCCGT TGCAATCCCT 
CAGGTTGGAG TCTTGGACAT GCTCCGCTAC CAGCATTTTA CCATAGGCTG GGCTTGGGTC 
GATGAATACG GAAGCAGCGA GGACAGTAAG GAGATGTTTG AATATCTTTA TGCTTACTCG 
CCCCTCCATA ACGTAAAAGA AGGAGTCAAT TATCCTTCCA TTATGGTATG TACGGGAGAC 
CATGATGACA GGGTTGTTCC TGCACACTCC TTTAAGTATG CTCAAGCCTT GCACGATACT 
TACAAGGGAG AAAACCCTAT CCTCATCCGT ATAACCGAAA AAGCGGGCCA CGGAGCCGGC 
AAACCCACTG CAAAGATAAT AGAAGAAACG GCGGATATCT ACGCCTTTAT CTTTAAGCAA 
ACCGGTCATA TAATCTAA

Protein sequence

MQYKKSDVSD NYFGTIVPDP YRWLEDDNAP EVIAWVKEEN KKTEDFLSKI SFRGELKKRL 
EEIWDYEKRS GLFKAGNFYY FFRTEGLQNQ SIMCRQSGNI KAESSPEVFF DPNKLSADGT 
TALKNLAFSK DGKYMAYSVS GSGSDWEEIF VFDAEKKADT GEHIHWVKFS NIAWYKDGFF 
YSSYDTPDKG KSLTEKNEFQ KLKYHKLGTK ESDDLLIFED KDHPLRSFSA STTEDEKTLL 
LTAFEVGSEG NMLFVADLSE GLPKCSHCFK QYNTHFNDSV WPLETENGFL YLLTNKQAPF 
YRVVKTSLNN ISEKSIDEVI PQKDCLLSSA ALCGGKLLTV YLRDVQDEAF ICGLDGKNST 
KINLPANGSI SFSGTRKNED SLFFNFTSYT TPNKIIRYDI KTNSLTDFFV PAIPINTGDF 
KCEQVFFKSK DGTKIPMHIV SKKDIKLDGS NPTIMYGYGG FAISLPPAFS AARMAFLEKG 
GIFACVNLRG GLEYGEAWHS AGKKMKKQNV FDDFIAAGEY LIEHKYTSSK KLAIQGGSNG 
GLLIGAVTNQ RPDLFAVAIP QVGVLDMLRY QHFTIGWAWV DEYGSSEDSK EMFEYLYAYS 
PLHNVKEGVN YPSIMVCTGD HDDRVVPAHS FKYAQALHDT YKGENPILIR ITEKAGHGAG 
KPTAKIIEET ADIYAFIFKQ TGHII