Gene TDE0654 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TDE0654
Symbol
ID	2739202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Treponema denticola ATCC 35405
Kingdom	Bacteria
Replicon accession	NC_002967
Strand	+
Start bp	689746
End bp	690918
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	43%
IMG OID	637159530
Product	M20/M25/M40 family peptidase
Protein accession	NP_971267
Protein GI	42526169
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0191847
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGATATAT TAAAAAAGGT AAAAGAAATA GAAAAAGACA TAATTTCTTG GCGCCGCCAT 
TTGCATCAAA ATCCTGAGGT TGGCTTTGAA CTTCCTAATA CAATAGATTT TGTATGTAAA 
AAATTGGATG AGTTCGGGAT TAAGTATGAC AGAAATGCGG CAAAAAGTGC CGTTATAGGT 
TATATTCACG GTGCAGAAAA AGGAGATGTT ATTGCTCTGC GTGCAGACAT GGATGCCCTT 
CCTGTTTGCG AAGCTACCGG GCTTGACTTT GCTTCTAAGA ATTCCTTTAT GCACGCTTGC 
GGTCATGATG CTCATACTTC GATATTGCTT GGGGCTGCAA AGGTACTAAA CGATTTAAAG 
GGCAGTTTTA AAGGAACCGT TAAGCTTATC TTCCAACCTG CGGAAGAACT GGGAACAGGC 
TCTGTAGACA TCTGTGAAAA AGGAATTCTT GATGACGTAA AAGAAATCAT CGGTCTTCAT 
GTAGGCTGTA TAAGCGATGA AGCAAAACCC GGCGAATTCC TTTTTTCAAA GGGCTCGATG 
ATGGCCTGTA TGGATAAATT TTCAATTAAG GTTAAGGGCG TAGGAGCTCA CGGAGCTTAT 
CCATCACTTT CAGTAGACCC CGTTGTAATT GGGTCTCACA TAGTTGTCGC CATACAGGAA 
ATCTTAGGCC GAGAGGTACA TCCTACGGAG CCGGCTGTAA TAACGGTTGG ACAATTCCAT 
TCAGGCTCGG CATTCAATAT AATTCCGCCT GAAGCTTATC TTGAAGGAAC CGTACGGGCC 
GTAACAAATG AGACGAGGGA ATTGATAGCA AAACGGATTG AAGAAGTTGC CTCCAATATT 
GCAAAAGCTT TTAGAGGTTC AATTGAATAC CAATTCTTTA GACAGCCGCC TCCTCTTATA 
AACGATGCGA AAGTTACGGA TAAGGCTATG GGAGCCGCCA AGGAGCTTTT CCCGAATGAC 
GTTAAGCTTA TGCAGCGGCC GGTCATGGGA GGAGAAGATT TTGCATGGTA CTTAGAAAAA 
GTTCCGGGTT CATTTATCTT CTTATCGACT CCATCCCCCA TTGAAGGAAA AGTCTGGCCC 
CACCACAATC CCAAATTTGC CTTAGATGAA TCGCAGTTTT ACAAAGGTAC TGCTCTTTTT 
GTAGCTTATG TAATGCAGGA GCTTGGTAAA TAA

Protein sequence

MDILKKVKEI EKDIISWRRH LHQNPEVGFE LPNTIDFVCK KLDEFGIKYD RNAAKSAVIG 
YIHGAEKGDV IALRADMDAL PVCEATGLDF ASKNSFMHAC GHDAHTSILL GAAKVLNDLK 
GSFKGTVKLI FQPAEELGTG SVDICEKGIL DDVKEIIGLH VGCISDEAKP GEFLFSKGSM 
MACMDKFSIK VKGVGAHGAY PSLSVDPVVI GSHIVVAIQE ILGREVHPTE PAVITVGQFH 
SGSAFNIIPP EAYLEGTVRA VTNETRELIA KRIEEVASNI AKAFRGSIEY QFFRQPPPLI 
NDAKVTDKAM GAAKELFPND VKLMQRPVMG GEDFAWYLEK VPGSFIFLST PSPIEGKVWP 
HHNPKFALDE SQFYKGTALF VAYVMQELGK