Gene Cthe_1151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1151
Symbol
ID	4810819
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1368803
End bp	1369870
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	38%
IMG OID	640106573
Product	hypothetical protein
Protein accession	YP_001037576
Protein GI	125973666
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000920746
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGAAT ATGTGTTCAG GAATGTGAGT CAAATAGGCG AAAAGGAGTA CCAGACAGTA 
ATTGATGGAC AGGAATTAGC AGAGATGTGG AGGGATGGGA TAATAACATA TAACCCAGAA 
ATCCAGAGAG GAACAAAGGT AAAAAGGGGA AAGGACAATA GTGAAGTTGA GGTTGCTGTG 
TACAATAAAG CCAATGTGAA AAAAATCTAT ACTTCTATGC TTTCAGGCCA ATATTTTACG 
GATATGATTA CATTAAATGT TCTTGAAGAT GGCAATGAAA AAGTCGAACT TGATGATGAG 
GGTAATCTTG CTGTAGATGG CGAAATAAAC ATTGCAGATG GGCAGCACAG AATTAGGGCT 
TTAAGCATGA TTCTTGAAGG AAACGAAAAA GGGGATACAT TCTTCGATTT AACCGAACTA 
AAATTCCCTG TAAAAGTTAC CCACTATAAT GTCCAGACCG CACAGCAGCA ATTCCACCAG 
TTCTCTCTAG GGCTGAAAAT CAGTTCAAGC CGTGCGGAAT ATTTTAATCA AACGGGCCTT 
GCAAACATTA TTGTTAGAGA ACTTATGAAA AACAGCGACC TGGCTGGCAG GGTAGAAGTG 
GTGAGAAATT CCATATCAAA GAACGACGAA CGACACATTG TAACCTTTGC TACTCTTGTA 
AATGCCATAG AGATAGTTTA CAAGGATTTA GAAACAAGGG TTCAGGCGAT GGAATTATCT 
AAATACCTTG CAGAATTTTT CAATGAACTG ATAAACCTTA TTCCCGAGTT GCACAACTAT 
GAAAAGAGGG CGCAAAGCAA GGAAACATCG CTAATAGGGG AAAATTTCAT GTTCTACGGA 
TATGTGGCCA TAAGCAAAGT TCTAAGGGAT AAGGAGAATT GGAAGGAGTA TTTGCCATTA 
ATTAATGAAC TAGATTTATC AAAAGGCTCT AAGCAGTGGT ACGGAGATGT TATTAAAAGA 
GGAAAGGAAA AAGGATATAC TATCGTAAAT AACAATGAAA GCAGAAAAAC ATTTGTTAAT 
AAGATTGAAA GAATGTTTAA AAAGTTATTA AACGAAAAAA CAGCGTGA

Protein sequence

MAEYVFRNVS QIGEKEYQTV IDGQELAEMW RDGIITYNPE IQRGTKVKRG KDNSEVEVAV 
YNKANVKKIY TSMLSGQYFT DMITLNVLED GNEKVELDDE GNLAVDGEIN IADGQHRIRA 
LSMILEGNEK GDTFFDLTEL KFPVKVTHYN VQTAQQQFHQ FSLGLKISSS RAEYFNQTGL 
ANIIVRELMK NSDLAGRVEV VRNSISKNDE RHIVTFATLV NAIEIVYKDL ETRVQAMELS 
KYLAEFFNEL INLIPELHNY EKRAQSKETS LIGENFMFYG YVAISKVLRD KENWKEYLPL 
INELDLSKGS KQWYGDVIKR GKEKGYTIVN NNESRKTFVN KIERMFKKLL NEKTA