Gene Cthe_1321 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1321
Symbol
ID	4809461
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1602930
End bp	1604090
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	45%
IMG OID	640106745
Product	chaperone protein DnaJ
Protein accession	YP_001037746
Protein GI	125973836
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0484] DnaJ-class molecular chaperone with C-terminal Zn finger domain
TIGRFAM ID	[TIGR02349] chaperone protein DnaJ

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGGCA AAAGGGATTA TTACGAGATC CTTGGAGTTG ACAGAGGTGC ATCCGATGCA 
GAAATAAAAA AAGCTTACAG AAAGCTTGCT AAACAGTATC ACCCTGATAT GAATCCCGGT 
GATAAGGCTG CCGAAGCAAA ATTTAAGGAA ATTAATGAAG CCTATGAGGT ATTAAGTGAC 
CCGCAGAAAA GAGCGCGTTA TGACCAATTC GGCCATTCCG CATTTGATCC CAACGGTTTT 
GGCGGAGGAG GTTTTGGCGG GGGATTTACC GGTGGATTTG GCGATTTTGA TTTTGGCGGA 
TTTGGAGATA TTTTTGAAGC GTTTTTCGGA AGTGGATTTG GAACCAGAAC TTCCAGTGCA 
AGAAGAGGGC CTCAAAAGGG TGCGGATCTT AAGTATTCCA TGGAAGTCTC ATTTGAAGAG 
GCAGCTTTCG GAACAGAGAA GGAAGTTACG GTCAGCAGGT TGGAAATATG TCCGACTTGC 
AGCGGTTCCG GAACAAAGCC CGGTCATCAG CCTGTTACAT GCAGGCAGTG TAACGGAACT 
GGCCAGGTGC AGTACAAGCA GAGAACACCT TTTGGACAGA TTGTCAATGT AAGAACATGT 
GACGTATGCC ACGGTGAAGG CAAAATTATT ACAAATCCTT GTGAAACTTG TGGCGGCAAA 
GGAAGGGTAA GAAAGCATAC CAAACTGAAG GTTAGGATAC CTGCCGGTAT TGACAACGGT 
GAGACGATAT CATTAAGAGG TGAGGGCGAG CATGGAATTA AAGGCGGGCC GTCCGGTGAC 
CTTTTCATAA CCATCAAGGT GAAACCACAT CCAATTTTCA AAAGACATGG CAACGACGTT 
AACTGTGAGA TTCCCATAAC TTTTACCCAG GCGGCGCTGG GAGCTGAGAT TGAAGTCCCA 
ACACTGGATG GAAAGGAAAA AATTGTTATT CCTGAAGGTA CTCAGACAGG CACTGTATTT 
AAGCTTAAAG GGAAAGGAAT ACCTTTCTTA AGAAGCAGCG GCAGAGGAGA CCAGTATGTA 
AAGGTAAATA TTGAAGTGCC GAGAAAACTT AATGAAAAAC AGAAAGAGGT TTTAAGACAG 
TTTGCAGAAC TCGTGGGTGA TGAGGTACAC GAGCAGAGAA AAGGATTTTT TAATAAAATG 
AAAGATGCTT TGGGCATGTA G

Protein sequence

MAGKRDYYEI LGVDRGASDA EIKKAYRKLA KQYHPDMNPG DKAAEAKFKE INEAYEVLSD 
PQKRARYDQF GHSAFDPNGF GGGGFGGGFT GGFGDFDFGG FGDIFEAFFG SGFGTRTSSA 
RRGPQKGADL KYSMEVSFEE AAFGTEKEVT VSRLEICPTC SGSGTKPGHQ PVTCRQCNGT 
GQVQYKQRTP FGQIVNVRTC DVCHGEGKII TNPCETCGGK GRVRKHTKLK VRIPAGIDNG 
ETISLRGEGE HGIKGGPSGD LFITIKVKPH PIFKRHGNDV NCEIPITFTQ AALGAEIEVP 
TLDGKEKIVI PEGTQTGTVF KLKGKGIPFL RSSGRGDQYV KVNIEVPRKL NEKQKEVLRQ 
FAELVGDEVH EQRKGFFNKM KDALGM