Gene Dole_0644 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0644
Symbol
ID	5693474
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	763689
End bp	764855
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	58%
IMG OID	641263236
Product	hypothetical protein
Protein accession	YP_001528531
Protein GI	158520661
COG category	[R] General function prediction only
COG ID	[COG1373] Predicted ATPase (AAA+ superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATGGTT ATATCCCCAG GCTTATTGAA ACGGATATTC TCCGGTCCCT TGCCCGGTCT 
CCGGCCGTGG CAATCCTCGG CCCCCGGCAA TGCGGGAAAT CCACCACTGC CCGGCAGTTG 
ATTGATCCGG CCACATCGAT CTATTTGGAT TTGCAGGACC GGGTGGACCG GAACAAGCTT 
TCTGAGCCGG AACTGTTTTT TGAGCAATAC CGGAGCAGAC TGATCTGCCT GGATGAGATT 
CAGCTGCTGC CGGAATTTTT TTCCGTGCTG CGCTCGGAGA TCGACAAGGA TCGACGGCCG 
GGTCGCTTTT TGATTTTAGG GTCGGCGTCC CGGGACCTGA TCCGGCAGTC AACCGAGTCC 
CTGGCCGGGC GGATCGCTTA TCATGACCTG ACGCCCTTTT TGCTGGCGGA AATGGTCGGC 
AAATTGTCGT GGGCGGACCT GTGGCTTCGG GGCGGGTTCC CGGAAAGCGC CCTGGCCCAT 
GACGAGCAGG CCGGTTTTGA ATGGCGCCTG GATTTTATCC GTACATTCAT GGAGCGCGAT 
ATCCCGGCCC TGGGATTTAA CATTCCGGTG CCGGTGATCG AACGGCTGTG GCTGCTTCTG 
GCCCACTGCC ACGGCCAGAC CATCAACTAC CAGAAACTGG CCGCATCAGC GGACCTGGCC 
GTGCCGACCC TGAAAAAGTA CCTGGCCCTG CTGGAACAGA CCTATATGGT CCGGCTGCTG 
CCCCCGTTTG CCGCCAATCT TAAAAAACGG CTGGTCAAGT CGCCCAAGGT GTTTCTGACC 
GACAGCGGTA TTCTTCACGC GTTGCTGGAT ATTGAGTCCT ATGATTACCT GCTGGCCAAC 
CCAACGGCCG GCGCCTCCTG GGAAGGGTTT GTGATTGAAA ATCTTATTGC CCTGCATCCC 
CGCTGGCGGC CGTCGTTCTT ACGCACCTCC AACGGCGCTG AAATCGACCT GGTGCTGGAG 
CGGGCCGGGC GATACCATGT TTTTGAATGC AAGCTCTCCA AGGCCCCGCA ACCCTCCCGT 
GGCTTTTACG AGCTGGTTGA TGGTCTGCGA CCCGAAACCG CCTGCGTGGT CGCGCCGGTG 
GATGAGCCGT TTGAAATAAA AAAAGGGATT TGGGTCTGTT CGCCCCTGCA TTTGATTAAG 
GAGGAAAAAA AATCGGGGGT GGGATAA

Protein sequence

MHGYIPRLIE TDILRSLARS PAVAILGPRQ CGKSTTARQL IDPATSIYLD LQDRVDRNKL 
SEPELFFEQY RSRLICLDEI QLLPEFFSVL RSEIDKDRRP GRFLILGSAS RDLIRQSTES 
LAGRIAYHDL TPFLLAEMVG KLSWADLWLR GGFPESALAH DEQAGFEWRL DFIRTFMERD 
IPALGFNIPV PVIERLWLLL AHCHGQTINY QKLAASADLA VPTLKKYLAL LEQTYMVRLL 
PPFAANLKKR LVKSPKVFLT DSGILHALLD IESYDYLLAN PTAGASWEGF VIENLIALHP 
RWRPSFLRTS NGAEIDLVLE RAGRYHVFEC KLSKAPQPSR GFYELVDGLR PETACVVAPV 
DEPFEIKKGI WVCSPLHLIK EEKKSGVG