Gene Dole_2981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2981
Symbol
ID	5695840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	3576677
End bp	3577840
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	59%
IMG OID	641265597
Product	helix-turn-helix domain-containing protein
Protein accession	YP_001530861
Protein GI	158522991
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2856] Predicted Zn peptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCAGA AAACCACCGA CCTCACCTTT ATCGGCAGAA ACATCCGCAA GCTGCGCCGC 
CAGCGCGGCT GGACCATCAG CCGCCTGGCC GGCGAAATCG GCATGGCGGA AATTCCCCTG 
GGCCGCATCG AACGCGGGGG AAACGCGCCC TCCGCCGCTG TTATCTTTCA ACTCTCCAGG 
GCCCTGGGTG TGTCGGTGGA CACCCTGTTT GCCGAAGACG AAAGCGACCT GCTGGCCGAA 
CGGGTCAAAA CCCCGGGCAC CGGGTTTGTG CCGGCCCGGT CCGTGGAACA CCTGCCGCCC 
AGCATCCTGA CCCCCATTTA CGAAGTCATC GACGCCATAT GCAGCCTGGA AGATATATGC 
CGCGCCCATA AACGGGCCAA AATCCCCCTG AACATATCAT TTGAGACCAA CCAGCGGGGC 
CTTCAGGACC TTTCCGAGGC CGCCAGAAAT CATATGGGTA TCGGCCGGGG CGTGGTATTC 
GATTACATCG AGCTGTTCGA GGCCATGGGG TTTCGCGTGA TATTCCTGCC CCTGCCCAAA 
GAGACCCCGT CCATGACCTT TTACGATATG GAAAACAGCA ACGCCTTTTT CTTTATTCGT 
CACAAACAGA ACCCGGAGCG CCAGATTTTT CACCTGGCCT ACGGGCTGGG CCGCATCTTT 
TTTCTGCGGC AGGCCAGGCA CACAGGCGCC AATCCCTTTC CATCCGATGA CGACGCCCGG 
ACCGAAGAGA TGCCGCCCGC GGAAAAAGAA GGGAAAAAGA CCCTGACCAT GCACCGGGCC 
GGCCGCAAGT TTGCCGCCTT TTTCCTCATG CCCGAGCAGG CCATCCGGGC CACGGTCAAC 
CAGCTGGGCA TTCAGAACAA GCAGTGGTCC TGGGAACTGC TGCTGCGCAT CAAGCACCGG 
TTCGGGGTGT CGGCCCAGGC CTTTCTTTTC CGGTTAAAAG AGCTGGACCT GATCACCGGC 
AAACTCCACG ACCGGTTTTC CAAACAGATC GAAGACCATT ACAAAAAAAC AGGCTATGCC 
GAGCCCGACT CGTCCCGCCG CATCCTCACA CCCAACGGCC GCGTGTGGGA CCTGGTGCTG 
ACCGCAAGGC AGCATGCAGA GGCCAAAGCC GAAGTGGCCC GCATAGAAGA AACCCTTAAC 
CAGTGGAAGG TGGTAAAAGT TTAA

Protein sequence

MIQKTTDLTF IGRNIRKLRR QRGWTISRLA GEIGMAEIPL GRIERGGNAP SAAVIFQLSR 
ALGVSVDTLF AEDESDLLAE RVKTPGTGFV PARSVEHLPP SILTPIYEVI DAICSLEDIC 
RAHKRAKIPL NISFETNQRG LQDLSEAARN HMGIGRGVVF DYIELFEAMG FRVIFLPLPK 
ETPSMTFYDM ENSNAFFFIR HKQNPERQIF HLAYGLGRIF FLRQARHTGA NPFPSDDDAR 
TEEMPPAEKE GKKTLTMHRA GRKFAAFFLM PEQAIRATVN QLGIQNKQWS WELLLRIKHR 
FGVSAQAFLF RLKELDLITG KLHDRFSKQI EDHYKKTGYA EPDSSRRILT PNGRVWDLVL 
TARQHAEAKA EVARIEETLN QWKVVKV