Gene TDE2101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TDE2101
Symbol
ID	2740340
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Treponema denticola ATCC 35405
Kingdom	Bacteria
Replicon accession	NC_002967
Strand	-
Start bp	2125639
End bp	2126709
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	46%
IMG OID	637160991
Product	hypothetical protein
Protein accession	NP_972702
Protein GI	42527604
COG category	[S] Function unknown
COG ID	[COG1262] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00076564
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAT TTTTTGTTTT ATTTTTGGCG ATACTTTTTG TATCGGTTTC GGCTTGTAAA 
AACCCGTTTT TTAAAAACAT GCTGGATAAG GATTCGGGGA GTGAAGGGAC CGGAGATTGG 
AATTCTCAAA GTTCCGATGT AGGTTCCTTT GAAGACGCAG GGGACTTTGT AAAAATAATA 
CCTCCTGCAA ACGGCATCGT AGGCGTTGCT CCTAACTACG CCTTACCCGG AAATCATGAT 
TATTGGAAAG GTGTATTTAT TGCAGGGCGC ACGGTAAAAC TGAGCCCCTA TAAGATCGGC 
AAAATGGAGG TAACCTATGA GCTATGGTAT AGTGTACTAA AATGGAATAC TGATAATGGT 
AGGGGATACA TCTTTGCCAA TCAGGGAAGA GAAGGCAGTA ATGGAGGTGA AGGAGTAGCC 
CCCACAGGTG CAAAAAAAGA GCCTGTAACA ATGATAAGCT GGCGAGACTG CATAGTGTGG 
TGTAATGCGT ATACTGAAAA AGAAAAAGGA ATAGGCGAAT GCGTCTACCG CAAAAAGGAC 
AATCATACGG TTGTATTAAA AGATGCGACG GCAACAGCTG CTTGTGATTC AGCCTATGCC 
GATATGAATA AAAAAGGCTT TAGACTTCCG ACGGAAGCCG AGTGGGAATA TGCTGCCCGC 
AGGCAGGGAA GCAATACTGA AAATGCGGCA CAATACGGCG ATGTATGGCT GACCAAATTA 
AACAGTGCAA GCGGAGCCAA AGATAAATGG GATACGGCTG AAACAGGAGA GGTTGCATGG 
TATAAAGGTA ATTCAGGAAA TAAAACTCAT CCGGTAGGAA AAAAGCGGGC AAATGCTCTA 
GGTTTATACG ACATGTCGGG GAATGTCACC GAATGGTGTT TTGATTGGGA TGACACCATA 
GCAGCAGAAA ATGTTACCGA TCCTCAAGGT GCCGCGTCGG GCTCTGCCCG TGTTGAACGC 
GGCGGCAGCT GGCTCAACTA CGCGTACGGC TGCACTGTAG GCGTACGGTA CTGCGTCACT 
CCTGGCAGCA GGAGCGACAA TCTTGGCTTC CGCCTGGCTT GTCGGCCATA G

Protein sequence

MKKFFVLFLA ILFVSVSACK NPFFKNMLDK DSGSEGTGDW NSQSSDVGSF EDAGDFVKII 
PPANGIVGVA PNYALPGNHD YWKGVFIAGR TVKLSPYKIG KMEVTYELWY SVLKWNTDNG 
RGYIFANQGR EGSNGGEGVA PTGAKKEPVT MISWRDCIVW CNAYTEKEKG IGECVYRKKD 
NHTVVLKDAT ATAACDSAYA DMNKKGFRLP TEAEWEYAAR RQGSNTENAA QYGDVWLTKL 
NSASGAKDKW DTAETGEVAW YKGNSGNKTH PVGKKRANAL GLYDMSGNVT EWCFDWDDTI 
AAENVTDPQG AASGSARVER GGSWLNYAYG CTVGVRYCVT PGSRSDNLGF RLACRP