Gene TDE2300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TDE2300
Symbol
ID	2740265
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Treponema denticola ATCC 35405
Kingdom	Bacteria
Replicon accession	NC_002967
Strand	-
Start bp	2340043
End bp	2341524
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	41%
IMG OID	637161189
Product	trypsin domain/PDZ domain-containing protein
Protein accession	NP_972900
Protein GI	42527802
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.726424
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTAAAT TAAAAAATCC GCTTTCAGCG ATGGCCGGAA TTTTATTGAT TATGCTTGTT 
TCGGTTGTTT TTCTTTCAGC CCGATGTTCA AGTAATCCCG AAAATGCTTC TACAGTGTAT 
GCCGATCCGG GGTTAAAGAC CGAGCTGAGT AAAGAGTCTG TTTCGGCTCT TGAATCTCTT 
CAAAAAGCAA ATCGAGAGCT TACTTCCATG ATTTTACCCT CGGTAGTTAC CCTTGATGTT 
GTAGAAACAA GAAAGGTTCA AAACAATATA GACGGTTTTC CTTGGTTTTT CTTTAACCGC 
CCTCAAGATC AAAAAGACGG TCAGGGGGAA AGGGAATATG AAGCCGAAGG TATGGGCTCA 
GGTGTTATCG TAAGAAAGAC GGGAAAAACA TATTATGTTC TGACAAACCA GCATGTTACA 
GGCAATGCCA AGACAATTTC CGTTATGCTT TATAACGGTG ATAAGGTTCA AGGTAAGTTA 
ATCGGTTCTG ATCAGAGGAA GGACGTTGCC CTTGTTTCCT TCGATTATGA TAAGGATTTA 
AGGGTTGCCG TGTTGGGAGA CTCAAATACC GTACAGGTAG GAGACCTTAC ATATGCAATC 
GGTGCTCCTA TGGGTTATGT GTCTACCGTT ACAAGCGGTA TTGTAAGTGC GGTAGGCCGT 
TCAGGCGGAC CGAACAGAAA TAATATAAAC GATTTTATCC AAACGGATGC AGCGATAAAT 
CAAGGCAACT CAGGCGGTCC CTTGGTCAAT ATCTATGGTG AGGTTATAGG CATAAATAAC 
TGGATTGTTT CATCAAGCGG CGGGTCTCAA GGTCTTGCCT TTTCGATTCC TATAAACAAC 
CTCAAAAAAG CTATCGATGA TTTTATTACT TCGGGTGAAA TCAAATACGG TTGGCTTGGT 
GTTCAGCTTC TTGAAATAAA CGATAAGTTT AGAGAAAGCT TAAACTTAAA GGATATTGAA 
GGTGCTTTTG CAGGACAGGT ATTTTTAGGT TCTCCTGCGG ATAAGGGCGG TATAAAGCCC 
GGTGATTATA TTACCGAGGT AAATTCGACA AAGGTTAAAA GTGTTGACGA TATACTGCGT 
GTTATCGCCG ACTTAAAGCC GGGAGAATCT TCATCCTTTA AGATTTTACG AAAAGGAAAA 
GAAATCTCCG CAACCGTAAA AATAGAAGAA AGAGATGAAA AAAATGTAGC CGATTCTTCC 
AAACTTTGGC CCGGTTTTGT TCCGTCTCCT TTAACTGAAG AAATTATAAA ACAACTGGAG 
CTTAAAAAAG GTCAAAACGG CGTTTTGGTA ACAAGTTTAC AGGCTAAGAG CCCTGCTGCC 
GTTATGAGTT TACAGCCGGG CGACCTTATA GTAAAGGTTA ACGGAAAAGA TGTAAAAGAT 
GTTTTGAGCT TTTATGATGA GCTTTCAAAC GCAAAGGGCG AGATTTGGTT TGACTTTATA 
AGAGAAGGCC ACAATTTGGT TACCCCAAAG ATTAAAAGAT AA

Protein sequence

MRKLKNPLSA MAGILLIMLV SVVFLSARCS SNPENASTVY ADPGLKTELS KESVSALESL 
QKANRELTSM ILPSVVTLDV VETRKVQNNI DGFPWFFFNR PQDQKDGQGE REYEAEGMGS 
GVIVRKTGKT YYVLTNQHVT GNAKTISVML YNGDKVQGKL IGSDQRKDVA LVSFDYDKDL 
RVAVLGDSNT VQVGDLTYAI GAPMGYVSTV TSGIVSAVGR SGGPNRNNIN DFIQTDAAIN 
QGNSGGPLVN IYGEVIGINN WIVSSSGGSQ GLAFSIPINN LKKAIDDFIT SGEIKYGWLG 
VQLLEINDKF RESLNLKDIE GAFAGQVFLG SPADKGGIKP GDYITEVNST KVKSVDDILR 
VIADLKPGES SSFKILRKGK EISATVKIEE RDEKNVADSS KLWPGFVPSP LTEEIIKQLE 
LKKGQNGVLV TSLQAKSPAA VMSLQPGDLI VKVNGKDVKD VLSFYDELSN AKGEIWFDFI 
REGHNLVTPK IKR