Gene Cthe_2130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2130
Symbol
ID	4811177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2528764
End bp	2530056
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	39%
IMG OID	640107535
Product	hypothetical protein
Protein accession	YP_001038528
Protein GI	125974618
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0384361
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATAAATG CAAGGCTTGG AAAAAAGGAC GAAATCAATG TTTGTAAGCT GAAAATATCA 
GCTTGGGACG AAGAGGAGGC GGTATGCATT ATGTCAATTA GTGAAGAAAG AATGTTTATA 
CTTAAAATGC TGGAGGAAGG GAAAATTACA AGCGAGGAAG CGGCAAGACT TTTGGAGGCT 
ATTGACCCTG ATAAGGGAAC GGCTGACAGT GGCAGTGGTT TTAAGGCCCA GCAAAGAAAA 
ACCAATTTTG CCGATGAGGT ATCCAAAGTA AGGGATAAGC TTAATGAATG GAAAAAAGAG 
TTCAAGAAGA ATTACAACCA GAAAGACTTT GAAAGAGCGG TGGATGAATT CAGTTCCAAG 
GTGGAAAAGC TGGGTAAAAA CCTTGCTTAT ACCACTATAG GTGTGGCTGA CAAACTTGTG 
GATTTTATAA GCAGCTTTGT GGAAACAAAT TCTTTTAACG TGTTTGGAAA GTACAAGGCA 
ACAAACAGGG TTTTTGAAGT GCCTGATGTG AATGAAGACA TGGAACTTAA TATTGAGGCG 
ATAAACGGGC ACATTCTTGT TAAAAAACAT ATGGAAAATA AAGTTATAAT CAGGACCACG 
GTAAAGAGCC CTGCTGACAA TGCTGATGAA ATCCTTGATT TTAGCCGGGA AGAGAACAAG 
GTGACTTTAA AGTGCAATAA AATCGGCAAC ATCAGCGTAT CCCATGAAAT ATTCCTTCCG 
TCCGTTAAGG TTAAGAACAT CAGCCTGGTT ACCAAAAACG GCAAGGTATA TGTGGAGGAT 
TCAATATCTG AGAATTTTGA AGCGGTTACC AGCAACAGCA ATGTTGACTT GATGGGCGTT 
AACGGCGACA AAATTAATGT TTCCAACAAA AACGGGCGAA TTAACTTCGG TTATATTATC 
GGCAAGGACA TTAATATTGA CGCCGTAAAC TCCGTTATAG AGATTAGACA GATAAAAACC 
ACCAACATAA ATGCCTCTAC CAGGAACGGA AGAATATTTA TTGAAAATGT ACACAACCAT 
AATGACGACC CGAATATAAA TATGAATTTG AAGACATCGT CTGCGGATAT CAAGGTTAAT 
ATGAACGATA TGGAAAAGAG AGGATACAAA ATCAAAGCTC AGACCACCCA TGCGGAAATC 
AACCTCCTTA TTCCTGAAAT GACTTACCGC AACATAAGCA AGCAGATGAG CTCCAATTTC 
GTGGAGGCAG ACAGCGACGG ATATGATGAT TATATAAACA AGGTAAATAT TGTTGCGGAA 
ACCACCAACG GCAATATTGA AATTGTAAAG TAA

Protein sequence

MINARLGKKD EINVCKLKIS AWDEEEAVCI MSISEERMFI LKMLEEGKIT SEEAARLLEA 
IDPDKGTADS GSGFKAQQRK TNFADEVSKV RDKLNEWKKE FKKNYNQKDF ERAVDEFSSK 
VEKLGKNLAY TTIGVADKLV DFISSFVETN SFNVFGKYKA TNRVFEVPDV NEDMELNIEA 
INGHILVKKH MENKVIIRTT VKSPADNADE ILDFSREENK VTLKCNKIGN ISVSHEIFLP 
SVKVKNISLV TKNGKVYVED SISENFEAVT SNSNVDLMGV NGDKINVSNK NGRINFGYII 
GKDINIDAVN SVIEIRQIKT TNINASTRNG RIFIENVHNH NDDPNINMNL KTSSADIKVN 
MNDMEKRGYK IKAQTTHAEI NLLIPEMTYR NISKQMSSNF VEADSDGYDD YINKVNIVAE 
TTNGNIEIVK