Gene Athe_1550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1550
Symbol
ID	7409058
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1638932
End bp	1640098
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	41%
IMG OID	643715922
Product	chaperone protein DnaJ
Protein accession	YP_002573421
Protein GI	222529539
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0484] DnaJ-class molecular chaperone with C-terminal Zn finger domain
TIGRFAM ID	[TIGR02349] chaperone protein DnaJ

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACAAA AAAAAGACTA CTATGAGATT TTAGGTGTTC CAAGGAATGC AACAGAAGAA 
GAGATAAAAA GAGCCTACAG AAGACTTGCA AAACAATACC ATCCTGATGC AAATCCAGGT 
AATAAAGAGG CAGAAGAAAA ATTTAAGGAG ATAAACGAGG CATACGAAGT CTTGAGCGAT 
CCTGAAAAGA GAAAGCTTTA TGACCAGTTT GGTCATGCAG CGTTTGACCC GAAATATGGT 
GCACAAGGTA GCGGTGGTTT TTCTGGTGGA TTTGGCGGTG GATTTGCTGA CTTTGATTTT 
GGCAGTTTTG GTGATATTTT TGAAGACCTA TTTGAAGGCT TTGATATATT TGGAACATCC 
AGAAGAAGAA AAGAAGCACC AAGAAAAGGT GCTGATATAT ATGTCGATTT AGAACTTACT 
TTAAAAGAGT CTGTATTTGG CTGTGAAAAA GAGATTCCAA TTTACAGAAC TGAAAAGTGC 
AGTGTTTGTG GTGGAAGTGG TGTAAAACCA GGTTCTGCAC CTGTGAGATG TCAAAAGTGC 
GGCGGCACGG GTCAGATAAG ATCAAGACAG GCAACATTCT TTGGGGAGTT CACCACCATA 
AAAACCTGTG ATGCATGCGG CGGAACAGGA ACTATTATAA CAGACCCATG TAGAGAATGT 
GGAGGAACGG GAAATGTAAG AAGACAGCGA AGAGTAAAGA TTAATATTCC AGCAGGAATT 
GATGATGGCC AAGTGATAAC GTTAAGAGGT GAGGGCGAGA GCGGCATCAA AGGCGGTCCT 
AACGGTGATT TGCATATTAA AATAAAAATA GCACCTCATC CTGTGTTCAA AAGAGTCGGG 
CAGGACCTTT ATATTGAGGT TCCAATAACA TTTGTTAATG CAGCTTTGGG TGGAGAGATA 
GAAATTCCGA CACTTGATGG TAAGACAAAA GTAAGAATTG AGCCAGGGAC ACAAAATGGT 
GATGAGGTCA GAATCAAAGG CAAGGGCGTT CCGAACCTGC GTTCGCGAGG AAGAGGCGAC 
CTTGTTGTGA AGTTTATAGT GGAGGTTCCA AAAAAGCTTA CAGAAAAGCA GAAAGAGCTT 
TTGAGAGAGT TTGAAAGACT TTCATCAGAA GAGGGATATG AAAAGAGAAA ACATTTTTGG 
GATAGGATAA GAGAAGCTTT TTCTTAA

Protein sequence

MAQKKDYYEI LGVPRNATEE EIKRAYRRLA KQYHPDANPG NKEAEEKFKE INEAYEVLSD 
PEKRKLYDQF GHAAFDPKYG AQGSGGFSGG FGGGFADFDF GSFGDIFEDL FEGFDIFGTS 
RRRKEAPRKG ADIYVDLELT LKESVFGCEK EIPIYRTEKC SVCGGSGVKP GSAPVRCQKC 
GGTGQIRSRQ ATFFGEFTTI KTCDACGGTG TIITDPCREC GGTGNVRRQR RVKINIPAGI 
DDGQVITLRG EGESGIKGGP NGDLHIKIKI APHPVFKRVG QDLYIEVPIT FVNAALGGEI 
EIPTLDGKTK VRIEPGTQNG DEVRIKGKGV PNLRSRGRGD LVVKFIVEVP KKLTEKQKEL 
LREFERLSSE EGYEKRKHFW DRIREAFS