Gene Cthe_2710 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2710
Symbol
ID	4810704
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3197608
End bp	3198717
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	41%
IMG OID	640108129
Product	hypothetical protein
Protein accession	YP_001039102
Protein GI	125975192
COG category	[S] Function unknown
COG ID	[COG3949] Uncharacterized membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00210144
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTCTCAGG ATGTAAAAAA TATATTGAAA GTTGCAAGCA TTTATATGGC AACGGTGATT 
GGGGCTGGAT TTGCTTCGGG ACAGGAAATT ATGCAGTTTT TTTCGTCGTA TTACGAGGGG 
GGATTTTACG GCATTGTTCT GGCAGGAGTT TTGTTTGCGT TGATAGGATA TATTGTGTTA 
GTAAAAGTCT ACAGCGAAAG AATAAGAAAC TACGAGGAAT TCCTTTTTCC CAGCGTCGGA 
TGGGTAATTG GCTGGATTAT GGAGATTATG GTAACGTTGT TTATGGGTTC TGTATTGTGC 
ATAATGGTTG CCGGAGCAGG AAGCATAATA TCCGGTGCGT TAAACATACC TTATCACTAT 
GGCACGCTGA TAGCTGCAAT TTTATGCATG ATTGTCTTTC TTACTGACAT CAAAGGGATT 
GTGGCATTAA GTTCTTTTGT GACTCCCATT TTGGTGCTGG GTATTCTTGG AGCAGGATTC 
TATGTTATAG TCAATATGGA TGCATGGGTA TTCAGCCCTG TACCGGGATT TGATGCGATA 
ACCGACAACT GGCTCGTCTC TTCTCTTCTC TATGTAAGCT ACAACAGCAT AAGCGGCGTT 
GCGGTAATGT GCAGCCTTCT GCCTTACTTA AAAAGCAGGA AAATTGCTGC TGCGGGAGGA 
ATTATCGGCG GGCTTGCGCT AAGTTTTATA GCAATAGTTT TGAACATTAT ACTTTATGTA 
TTTTATCCCG ATATTGTCTC TGAAGAGATT CCGGTTTTAA GTATAATCGG CAGGCATAAT 
TTTATTTTGG GAGAATTCTA TAAAATACTG CTTCTTCTTG CAATGTTCAT TTCGGCTGTA 
ACATCGGGGT ATGGTTTTAT CGAGAGAATA GCAAATAAAG TGAGAATAAG CAGAAAGATA 
CTGATCCCGG TAATATGCGG CTTTGTTGTG CCAATTTCCA ATGTGGGATT TTCCGGACTT 
ATATCATCCG TATATCCGGC ATTTGGGTAT GTAGGAATGT TTATGCTCTT TATGATACTG 
ATCCAGGGAC TAAACATGCT TGTTTCAAAG CTTGCGGCAA GTTTTGCTTT TGTTTCCAGC 
AAGAGGGAGT ACAAAAACAG GGACCGATAG

Protein sequence

MSQDVKNILK VASIYMATVI GAGFASGQEI MQFFSSYYEG GFYGIVLAGV LFALIGYIVL 
VKVYSERIRN YEEFLFPSVG WVIGWIMEIM VTLFMGSVLC IMVAGAGSII SGALNIPYHY 
GTLIAAILCM IVFLTDIKGI VALSSFVTPI LVLGILGAGF YVIVNMDAWV FSPVPGFDAI 
TDNWLVSSLL YVSYNSISGV AVMCSLLPYL KSRKIAAAGG IIGGLALSFI AIVLNIILYV 
FYPDIVSEEI PVLSIIGRHN FILGEFYKIL LLLAMFISAV TSGYGFIERI ANKVRISRKI 
LIPVICGFVV PISNVGFSGL ISSVYPAFGY VGMFMLFMIL IQGLNMLVSK LAASFAFVSS 
KREYKNRDR