Gene TDE1966 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TDE1966
Symbol	htrA-1
ID	2741529
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Treponema denticola ATCC 35405
Kingdom	Bacteria
Replicon accession	NC_002967
Strand	+
Start bp	1980413
End bp	1981690
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	42%
IMG OID	637160856
Product	trypsin domain/PDZ domain-containing protein
Protein accession	NP_972569
Protein GI	42527471
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000431561
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTTT ATAGTAGAAG ACAGACCCTC GTATTTTCGC TCATTGCAGC GGTTATTTTT 
GCAAGTGCAG GTTTTTTTGC CGGTATAAAA TATAGTACAG GAAACGCCGG CTCGACTGGA 
ATTCAAAGCG GAACCTCAAG CAACCCTGCC GATTTTGAAG AAAGTGCAGA AAACGGATTT 
GCTCAGACGG AAAATTCGCA CAATTTAAAT ATGCAGCAGC ATGGAAATAC GGCAGCTTTA 
AACACTGCAA ATGAAGCAGG ATACATGGGC TATACTCCTG CCGAATCACA GAATATTCGT 
GTATATGAAT CGACCAATGA AGCTGTCGTA AACATAACCA CCGAAACTAT GGGAGCAAAC 
TGGTTTTTTG AGCCTGTTCC GGTTGAAGGC AGTTCGGGTT CAGGCTCCAT AATCGACGAA 
AGCGGATTGG TACTGACCAA TGCACATGTA ATTTCAGAAG CTTCAAAGAT TTATATTTCT 
CTTTCTGACG GAAGTCAGTA CGAGGCAAAA GTAGTAGGAA CGGATGCCGA AAACGATTTG 
GCTGTTTTAA AATTTGATCC GCCTAAAAAT ATTAAACTTA CGGTAATAAA ATTAGGAGAC 
TCAACCAATT TAAAAGTCGG CCAAAGAGTT TTAGCTATCG GAAACCCTTT CGGATTGGAA 
AGAACTCTTA CAGACGGAAT AGTCTCGGCA CTGAAACGCC CGATTCAAAA CGATAAAAAC 
ATTATCATCA AAAATATGAT TCAAACCGAT ACGGCAATTA ACCCCGGAAA CTCAGGCGGT 
CCTCTTTTAG ACACTCAAGG AAGAATGATA GGAATAAATA CCATGATCTA TTCCACATCG 
GGAAGCTCAG CCGGAGTAGG CTTTGCTGTT CCCGTAAATA CGGCTAAAAG AGTTGTTGCA 
GATATCTTAA AATACGGAAA GGTTATCCGC GGTTCCATCG ATGCCGATTT GGTTCAAGTT 
TCAGGAAGAC TAGCCTCTTA TGCAAAACTC CCCGTTTCTT ACGGTCTCCT TGTTTCCGAA 
GTAAAAAAAG GAAGCAATGC GGCAAAGGCC GGCCTTCGCG GAGGAAATGA AGCTGTGCGG 
TCAGGAGTGG GCAGATACAG TTCCGTCTTT TACATAGGCG GCGATATCAT TGTCGAAATA 
GCCGGACAAA AGATAAATAA CATAACAGAT TATTATTCGG TACTGGAGGA TAAAAAACCC 
GGTGAAACGG TAAAGGTTAA AATTGTCAGA GGGAAAAAAC TTGTCGATTT AAGCTTAACC 
TTATCGGAAC GAAACTAA

Protein sequence

MKLYSRRQTL VFSLIAAVIF ASAGFFAGIK YSTGNAGSTG IQSGTSSNPA DFEESAENGF 
AQTENSHNLN MQQHGNTAAL NTANEAGYMG YTPAESQNIR VYESTNEAVV NITTETMGAN 
WFFEPVPVEG SSGSGSIIDE SGLVLTNAHV ISEASKIYIS LSDGSQYEAK VVGTDAENDL 
AVLKFDPPKN IKLTVIKLGD STNLKVGQRV LAIGNPFGLE RTLTDGIVSA LKRPIQNDKN 
IIIKNMIQTD TAINPGNSGG PLLDTQGRMI GINTMIYSTS GSSAGVGFAV PVNTAKRVVA 
DILKYGKVIR GSIDADLVQV SGRLASYAKL PVSYGLLVSE VKKGSNAAKA GLRGGNEAVR 
SGVGRYSSVF YIGGDIIVEI AGQKINNITD YYSVLEDKKP GETVKVKIVR GKKLVDLSLT 
LSERN