Gene Dbac_1100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dbac_1100
Symbol
ID	8376764
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfomicrobium baculatum DSM 4028
Kingdom	Bacteria
Replicon accession	NC_013173
Strand	+
Start bp	1208447
End bp	1209787
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	60%
IMG OID	645000333
Product	heat shock protein HslVU, ATPase subunit HslU
Protein accession	YP_003157620
Protein GI	256828892
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1220] ATP-dependent protease HslVU (ClpYQ), ATPase subunit
TIGRFAM ID	[TIGR00390] ATP-dependent protease HslVU, ATPase subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACCT TGACCCCACG TGAGATCGTG TCCGAACTGG ACAAATACAT TGTCGGCCAG 
ACCCAGGCCA AGCGCATGGT GGCCATCGCC CTGAGAAACC GCTGGCGTCG TCGTCAGCTC 
GATCCCGAGC TGGCCGAGGA GATCGCGCCC AAGAACATTC TCATGATCGG CCCCACGGGC 
GTTGGCAAGA CCGAGATCGC CCGCCGCCTG GCGAAACTTG CCGGTTCGCC CTTCATCAAG 
GTCGAGGCCA CCAAGTTCAC CGAAGTGGGC TATGTCGGCC GCGACGTGGA ATCCATCATC 
CGCGACCTGA TGGAGATCGG CGTCAACCTG GTCCGCCAGG AAGAAGAGGC CAGCGTGCGC 
ATCAAGGCCG AGGTTTCGGC CGAAGAGCGC CTGCTGGACC TGCTGCTGCC TACCAAACCC 
CTGGAGTCGG CCGGAATCGA TTATATCGGT CCCGAATCCC AGGCCGAAGG CTCCACCCGC 
GAGAAGCTTC GGCAGCTGTG GCGGGCGGGC AAGCTCGACG ACCGCATGGT GGAGGTGGAG 
GTTGCCACCG GGGGCGGCGT GCAGGTCATG GGCGTTCCGG GCATGGAAGG CATGGAAATG 
CAGATGCAGG ACATGTTCTC CAAGGTCTTT CCCAAGAAAA AGAAGACCAA GAAGGTGGCG 
GTGAAGAGCG CCTACGATAT CCTCATCCAG TCCGAATGCG AGCGCCTCAT CGATATGGAC 
AAGGTGCACG AGACCGCCCG CGAAAGGGTG CAGGAATCAG GCATTGTCTT TCTGGACGAG 
ATCGACAAGA TCTGCGGCGC GAACAGCTCC GGCAAGGCCG ACGTATCGCG CGAGGGCGTG 
CAGCGCGACC TCCTGCCCAT CGTCGAAGGC AGCACCGTCA ACACCAAATA CGGCATGGTC 
CGCAGCGATC ATATCCTCTT CATTGCCGCC GGGGCGTTCC ACATGTCCAA GCCCTCGGAC 
CTGGTGCCCG AGTTGCAGGG ACGCTTCCCC TTGCGCGTGG AGCTTTCGGC CCTGACCAAG 
GAGGATTTTT ACCGCATCCT GACCGAACCC AAAAACGCCC TGACCGTGCA GTACAAGGCG 
CTTCTTGGCA CCGAAAAGGT CGAGATCACC TACACCGACG AGGCGCTGCT CGAAATCGCC 
CGCTTCGCCC AGAAGATCAA CGAAGAGACC GAGAACATCG GCGCGCGCAG GCTCTATACC 
ATCATGGAGA AAATCGTTTC TGACCTGTCC TTCGACGCTC CGGACATGGA ACAGGCCACT 
GTGACCATCG ACAAGGACTA TGTGGCCAAG GCCCTGCTAG ATGTGCAGGA AGACCGGGAT 
CTTACGCGCT ACATCCTGTA G

Protein sequence

MNTLTPREIV SELDKYIVGQ TQAKRMVAIA LRNRWRRRQL DPELAEEIAP KNILMIGPTG 
VGKTEIARRL AKLAGSPFIK VEATKFTEVG YVGRDVESII RDLMEIGVNL VRQEEEASVR 
IKAEVSAEER LLDLLLPTKP LESAGIDYIG PESQAEGSTR EKLRQLWRAG KLDDRMVEVE 
VATGGGVQVM GVPGMEGMEM QMQDMFSKVF PKKKKTKKVA VKSAYDILIQ SECERLIDMD 
KVHETARERV QESGIVFLDE IDKICGANSS GKADVSREGV QRDLLPIVEG STVNTKYGMV 
RSDHILFIAA GAFHMSKPSD LVPELQGRFP LRVELSALTK EDFYRILTEP KNALTVQYKA 
LLGTEKVEIT YTDEALLEIA RFAQKINEET ENIGARRLYT IMEKIVSDLS FDAPDMEQAT 
VTIDKDYVAK ALLDVQEDRD LTRYIL