Gene Cthe_3165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_3165
Symbol
ID	4809615
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3740168
End bp	3741316
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	38%
IMG OID	640108598
Product	PpiC-type peptidyl-prolyl cis-trans isomerase
Protein accession	YP_001039553
Protein GI	125975643
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.106005
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCTGTGGG TCATAAGGAT AATATTGCAG GAAGGTTTGG TGATGATGGA AAACAATGCC 
GGTATAAGTA AAAAGCCTGT CGTTAAGGTG CACGTCATCT TGCTGGTGGC AGGAATACTT 
GTTCTGTCTG CCGTATTGGC AATTTTGGTT GCATATCAGG CAGGACTTAT ATATGGAGAC 
TTTTCAGAAC TTGCCAGGGT AAACGGTGAG CCTGTCTATG TCAAAGAATA TAAAATGAAG 
CTTTTAAGCA ATACCACCGA AGTAATCAAT TATTTCAGTC AAAGTTACGC AGTTGAAACC 
AAAGAAAATT TCCGCACCGA CAGCTACAGT GGCGAAGCGC CGGTTGAAAT GGCAAGAAAA 
AAGGCATTGG ACGACATTGT GGAAGTAAAG GTTCAACAGA TACTTGCAAA GGAAAAGGGA 
ATTATTGAAA GTACTGATTA TAGAGAGTTT TTAAAAGAAC TGGAAAATGA AAACCGACAA 
AGAAAGGATG CACTCAAAAG CAACAAGGTA GTGTACGGGC CCGACAATTA CGGAGAGATT 
GAGTATTTCA ACTATTCTTT TGACAACATG GTTTCAAAGC TTAAGGAGAA GCTGAAGGAA 
AATGAATTGT CCATACCGGA GGAAAAGCTT GAAAGCATGT ATAATTTGCT TAAAGACACG 
AGATTCAAGC TTCCGGATGA TATAAAGATT CAGGTTATAA GCATTGGTTT TACCGATGAA 
AAGGGTATTA TTAATGATGA CCTGAAGAGT AAGGCAAGGG TTAAGATTGA AGAGGCAAAA 
AAGAGGATTG ACAACGGAGA GCCTTTTGAA GAAGTGGCAC TGGATTATAA TCCGAAAAGC 
GGAGTTTTGG AGTACGTCTT TACAAAAGAG AAGCAGATGG CAAAAGACAT TTCGCATCCC 
GAACTTTTGG ATGAAGCGTT GAAGTTAAAG CCGGGACAGG TGAGTGAAAT AATAGAAAGA 
AGTACGGATT TCGTTTTAAT ATTGTGCAAG GAGAAAAAAA GTACGGGTTA CCTTCCTTAT 
AAGGACGCAC GAAAACAACT TTTGGACGAA TTGATAGAAA AGGATTATCA AGAGTATATA 
GACAAACTTG TTGAACAGGC GGATGTAAAA ATAAATGAAA AATTATATAG GCGGATAAAT 
GTAAATTAA

Protein sequence

MLWVIRIILQ EGLVMMENNA GISKKPVVKV HVILLVAGIL VLSAVLAILV AYQAGLIYGD 
FSELARVNGE PVYVKEYKMK LLSNTTEVIN YFSQSYAVET KENFRTDSYS GEAPVEMARK 
KALDDIVEVK VQQILAKEKG IIESTDYREF LKELENENRQ RKDALKSNKV VYGPDNYGEI 
EYFNYSFDNM VSKLKEKLKE NELSIPEEKL ESMYNLLKDT RFKLPDDIKI QVISIGFTDE 
KGIINDDLKS KARVKIEEAK KRIDNGEPFE EVALDYNPKS GVLEYVFTKE KQMAKDISHP 
ELLDEALKLK PGQVSEIIER STDFVLILCK EKKSTGYLPY KDARKQLLDE LIEKDYQEYI 
DKLVEQADVK INEKLYRRIN VN