Gene Cthe_2764 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2764
Symbol
ID	4810081
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3263552
End bp	3265015
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	39%
IMG OID	640108184
Product	TROVE domain-containing protein
Protein accession	YP_001039156
Protein GI	125975246
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTAAGT TTAATTTAGG GATCGCAAAA GCTGGTAAAA CGGTAAATAA TGAGGGAGCA 
ATCGCTTACT CGATGAGCGA TAAGGAAAAG TTGGTAACGC AGGTACTGAC GAGCTTTTTT 
AATGAAAATA AATTTTACGG AGACAACTCC CAAGATATTT TAAATACTGT TAGAAATGTG 
ATAAAAAATG AAGCTGCTTT TGTTGCCAAC CTGTGTATTT TTGCACGGAA AGAGATGCAT 
CTGAGGACAA TATCCCATGT TTTGGTATCG GAGCTTGCAA AAAGTACAGA GGGAAAAGAA 
TACGTCAGAA GAACTTTGAA TGAGATAATC GAGCGCCCCG ACGATATGAC GGAGGTGCTT 
GCATATTATA TAAATACATA TGGCAAACCC ATACCAAACT CAATAAAAAA AGGCCTGGCC 
GACAGCTTTG GCAAATTTGA TGAGTACCAG CTGGCCAAAT ACAACAGGAA AAATGCTGTT 
AAATTAAAAG ATATCTTATG CCTGGTCCAT CCGAAAGCCA AAGATGAAAT TCAGAATGAC 
CTTTGGAAAA GGCTTTTGGA AGACAGGCTT GAAACTCCTG TCACATGGGA AACGGAGCTG 
TCGCTGAAAG GAAATACGAA AGAAGTCTGG GAAAGGCTGA TTGATGAAAA CAGGCTGGGA 
TACATGGCAA TGATGAGAAA CCTTCGTAAT ATAATTAAGT CGGGTGCGTC AAATATGGAT 
AAAGTATACG AGTATTTGAC TGATGAAGAG AGGGTTTTAA AGAACAAGCA GCTGCCTTTT 
AGGTACTATA GCGCATATAA GGTATTAAGA AATGAGGGAA TAGGAACATC AAAGATTTAT 
GATGCGTTGG AAATTGCTAT TAAAATATCA ACAAAAAATA TTGACAGGCT TCCCGGTAAA 
ACATTAATTG CCGCGGACGT TTCCGGTTCT ATGAATTTTC CTGTCAGTGC GAAAAGCGAT 
CTGACTTGTG CTGAGGTTGC CGTATTGATG CTGTCAATTG CAAACTATAT ATGTGAAGAA 
AGCATTACAA TGACTTTTGA CGACAATCTG TATGCATGTA ATCTGTCAAC GCAAAACGGT 
ATAATTGCCA ATGCCAACAG TATCAAAGTA AACGGCGGTG GAACGGATAT TACTTTGCCG 
TTGCGCTATT TGCTGGACAA GAGGATATTT GTTGACCGCA TTATTCTGTT GTCTGACAAT 
GAGATAAACG CAGTTTATAC CTATGATACC GGTCGTGATA AACCCAAAAC CTGCCAGGCT 
TTGGTTGAAA GATATAAGAA GTGGATAAAT CCTAATGTCT GGGTTCATGC GATAGATATG 
CAGGGATATG GTACACAGCA GTTTAAAGGC CAAAATGTAA ACATTATTGC CGGTTGGAGT 
GAGAGAGTAT TTGATTTTAT ATCTTCCGTC GAACAAGGTA TCGATACTTT GATTGGCAAA 
ATCAGCGGCT ACTATTTTAA GTAG

Protein sequence

MSKFNLGIAK AGKTVNNEGA IAYSMSDKEK LVTQVLTSFF NENKFYGDNS QDILNTVRNV 
IKNEAAFVAN LCIFARKEMH LRTISHVLVS ELAKSTEGKE YVRRTLNEII ERPDDMTEVL 
AYYINTYGKP IPNSIKKGLA DSFGKFDEYQ LAKYNRKNAV KLKDILCLVH PKAKDEIQND 
LWKRLLEDRL ETPVTWETEL SLKGNTKEVW ERLIDENRLG YMAMMRNLRN IIKSGASNMD 
KVYEYLTDEE RVLKNKQLPF RYYSAYKVLR NEGIGTSKIY DALEIAIKIS TKNIDRLPGK 
TLIAADVSGS MNFPVSAKSD LTCAEVAVLM LSIANYICEE SITMTFDDNL YACNLSTQNG 
IIANANSIKV NGGGTDITLP LRYLLDKRIF VDRIILLSDN EINAVYTYDT GRDKPKTCQA 
LVERYKKWIN PNVWVHAIDM QGYGTQQFKG QNVNIIAGWS ERVFDFISSV EQGIDTLIGK 
ISGYYFK