Gene TM1040_1020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1020
Symbol
ID	4078532
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1091340
End bp	1092602
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	64%
IMG OID	638006324
Product	molecular chaperone, DnaK
Protein accession	YP_613015
Protein GI	99080861
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0443] Molecular chaperone
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.31559
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTCCC CTGCTATGTC CCCCAACACG CTTGGCATAG ACTTTGGCAC CTCAAATTCT 
GCTGCGGGAC TTGCGGTGGC GGGGCGGCCC TGGCTGGTGG AACTTGAACC GGGCGAGACA 
ACGCTGCCCA CGGCGGTGTT CTTTGACAGC GACAGCAAGA AGATGCGCAT CGGGCGCAGC 
GCGACCCGCG CGCTCATTGA GGGCGAAGAG GGCCGCTTCA TGCGCGCATT GAAAAGCCTG 
CTTGGCACAT CGCTCCTTTA TGAAAAACGT CGCCTCGGTG GTGTGACGAT GGATTTCACC 
GATGTGATCG CGCATTTCCT GCGCGAGGTG AAAACCCGCG CCGAAACTGC AACCCGGATG 
GAATTCACCC ATGCGCTCTC GGGGCGGCCG GTAAAGTTTC ACTCCAAGGA TGAGACCCGC 
AACGCCCGCG CCGAAGAAGA CCTGCGCCAT TGCTACAAGA AGGCCGGATT TCAGGATGTG 
ACCTTTATGT ATGAGCCCGA AGCCGCCTTG CGCGCGGCGC GCCCGCATCC GGGCATCGGC 
CTTGTGGTGG ACATCGGCGG CGGCACCTCG GATTTCACCT GCTTTGAACA AGATGCGACG 
GGCGGGACGC GTATTCTGGC CAGCCATGGC CTGCGGTTGG GGGGCACCGA TTTTGACCGC 
CAGATCAGCA TCGACCATGT GATGCCGCAT CTGGGGCGCG GGGCGATGAT CCGCAACAGC 
TTTGGTGAGG GCAGCCTGCC CGCCCCCAAT CGGATCTTCA ACGATCTTGC CACATGGCAG 
ATGATCCCCT TTCTCTATGG TCTCGACACT CGCCGCGCCG CGCGGGATCT GGCGCAGAAC 
GCCGAAGACC CCACCACGCT CAACCGTCTG GTGCAGGTGC TCGAAGACGA ACTGGGGCAT 
GATCTGGCCT TTGCAACGGA GGCCGGGAAA ATCCGTGCCA ATGGCAGCGA CGACGCGGGC 
GCCCAGATCG ACCTGCGCCT GATCGAACGC GGTCTTTCTG CCGCCCTGCC CCGCGCCGCG 
CTGGAAGCGT CGCTGGCGCA GATGGTGCGC GAGATCCAGG ATGAGGCCAA GGAGACACTC 
CGGCTGGCCG ATGTGGCGCC AGAGGCGGTC ACGCGGTGTG TCATGGTTGG GGGTTCGGCC 
TTGCTGATGG CGGTGCGCGC CGCCCTTCAG GACCTCTGCC CCACCGCCGA GATCGAGACC 
GAGCGCGCCC TCACCGCAGT GGCCGATGGG CTAGCGCTTG AAACGCAGGA TGGCGCCGCC 
TGA

Protein sequence

MNSPAMSPNT LGIDFGTSNS AAGLAVAGRP WLVELEPGET TLPTAVFFDS DSKKMRIGRS 
ATRALIEGEE GRFMRALKSL LGTSLLYEKR RLGGVTMDFT DVIAHFLREV KTRAETATRM 
EFTHALSGRP VKFHSKDETR NARAEEDLRH CYKKAGFQDV TFMYEPEAAL RAARPHPGIG 
LVVDIGGGTS DFTCFEQDAT GGTRILASHG LRLGGTDFDR QISIDHVMPH LGRGAMIRNS 
FGEGSLPAPN RIFNDLATWQ MIPFLYGLDT RRAARDLAQN AEDPTTLNRL VQVLEDELGH 
DLAFATEAGK IRANGSDDAG AQIDLRLIER GLSAALPRAA LEASLAQMVR EIQDEAKETL 
RLADVAPEAV TRCVMVGGSA LLMAVRAALQ DLCPTAEIET ERALTAVADG LALETQDGAA