Gene TDE2228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TDE2228
Symbol
ID	2741333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Treponema denticola ATCC 35405
Kingdom	Bacteria
Replicon accession	NC_002967
Strand	-
Start bp	2267377
End bp	2268822
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	40%
IMG OID	637161117
Product	aminoacyl-histidine dipeptidase, putative
Protein accession	NP_972828
Protein GI	42527730
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01893] aminoacyl-histidine dipeptidase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.371488
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCCAT TACAGAACAC TGAACCTAAG GAAGTATTTA AATGGTTTTA CGAAATCTCT 
CAAGTGCCGA GAGGTTCGGG AAACGAAAGA GCTATTAGCG ATTTTCTTGT AAAATTTGCA 
AAAGATAGAA ATCTTGAAGT ACATCAAGAT AAGGCTATGA ATGTTATCAT AAAGAAGCCC 
GGAACTGCCG GCTATGAAAA ATCTCCGACA GTTATTATTC AGGGACACAT GGATATGGTT 
TGTGAAAAGG ATGCTTCCTC AAATCATGAT TTTTTAAAGG ATCCTATTAA ATTCGTTGTA 
AAGGGAGAAA TGCTCTATGC CGATAAGACA ACCCTTGGAG GAGATGACGG TATAGCAGTC 
GCATACGCTC TTACCGTCCT TGACTCAAAG GATATTCCCC ATCCGCCGCT CGAAGTTTTG 
ATTACGACAG AAGAGGAAAC AGGGATGGGC GGAGCTATGG CTCTTACCGA TGAACACCTG 
CAAGGAACAC GCCTTTTAAA TATAGATTCG GAAGAAGAAG GCGTCTTTTT GGTAAGCTGC 
GCAGGCGGAT CCAATATTAA TATTTTTTTC GATATAAAGA AAGAAGCAGC CAAGGGAACA 
TTCTTAAAAA TCACTGTCGG AGGTCTTCTC GGAGGACATT CGGGTATCGA AATAAACAAG 
CAGAGAGCCA ACTCAATTAA ACTTTTGGGA AGAATTCTGT ATAACATCAA GCAAAACGAA 
AAAATCAATA TAGTAGAAAT TTCAGGCGGT TCAAAACACA ATGCTATTGC AAAGGATGCC 
CATGCTGTTA TAGCGGTTGA AAATAAGGAA GCCGTTTTGA AAATTGTCGA AAAACTTGCT 
GCCGATTTTA AGGGCGAATA CAGAGCTGTT GATAAACTTT TAACTGTTAC TGCAAATGAA 
ACGCAGAATT CTTCAGGCCA AATGTTTACA AAAGAGCTTA CCTTAAATCT AATTGATTTT 
ATGGCAAGTA TTCCCAATGG TGTTCAATAT ATGAGCATGG AGATTCACGG CCTTGTTCAA 
ACAAGTTTAA ATAACGGAGT TTTGGAAGAA ATTGATGGAA GAATCAAATT TACAACCTCT 
GTACGAAGCA GTGTAAAGAG TGCCTTGGAT GAAATTGTGG ACATACTTAG AATCCAAGCC 
GAGCGCTGCG GAGCCGAATT CAAAAAGGTT TCGGAGTATC CCGCTTGGGA GTACAGTCCC 
GATTCTCCTG TACGCGATGC TGCCGTCAAT GTTTACAAAA AGCTTAACAA AAAAGAACCC 
GTTATTACGG CCATCCACGC AGGGCTTGAA TGCGGTCTTT TAAAGAAAAC CCTTCCCAAT 
GTAGATGCTG TAAGTTTCGG GCCCAATTTG TATGATGTTC ATACTCCTAA CGAACATATG 
GACATTGCCT CTGTAGAACG TGTATGGAAG TTCTTGCTGG CTTATTTGGC CGAATTAAAG 
AATTAA

Protein sequence

MNPLQNTEPK EVFKWFYEIS QVPRGSGNER AISDFLVKFA KDRNLEVHQD KAMNVIIKKP 
GTAGYEKSPT VIIQGHMDMV CEKDASSNHD FLKDPIKFVV KGEMLYADKT TLGGDDGIAV 
AYALTVLDSK DIPHPPLEVL ITTEEETGMG GAMALTDEHL QGTRLLNIDS EEEGVFLVSC 
AGGSNINIFF DIKKEAAKGT FLKITVGGLL GGHSGIEINK QRANSIKLLG RILYNIKQNE 
KINIVEISGG SKHNAIAKDA HAVIAVENKE AVLKIVEKLA ADFKGEYRAV DKLLTVTANE 
TQNSSGQMFT KELTLNLIDF MASIPNGVQY MSMEIHGLVQ TSLNNGVLEE IDGRIKFTTS 
VRSSVKSALD EIVDILRIQA ERCGAEFKKV SEYPAWEYSP DSPVRDAAVN VYKKLNKKEP 
VITAIHAGLE CGLLKKTLPN VDAVSFGPNL YDVHTPNEHM DIASVERVWK FLLAYLAELK 
N