Gene Dole_0439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0439
Symbol
ID	5693259
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	506560
End bp	507633
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	58%
IMG OID	641263021
Product	deoxyguanosinetriphosphate triphosphohydrolase-like protein
Protein accession	YP_001528326
Protein GI	158520456
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0162186
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGATTC GTTCAGATTT TGAAGAGCGG GAAAAAACCT TTATATCTCC TTATGGATGC 
CTGAGTTCCA ACCTTCGGGG CCGGGACCAC GAGGAGCCGG AGGGCGCCAT CCGCACCGAG 
TTCCAGCTGG ACCGGGAGCG GATTGTTTAT TCTAACGCTT TTCGGCGGTT GAAGCACAAA 
ACCCAGGTGT TTCTGTCGCC CCTGGGAGAC CAGTACCGCA CCCGGCTGAC CCACACCCTG 
GAGGTGGCCC AGATATCCCG CACCCTGGCC CGGGCCATGC GGCTCAACGA AGACCTGGCC 
GAGGCCGTGG CCCTGGGCCA CGACCTGGGC CACACGCCCT TTGGCCACAG CGGGGAGACC 
GTGCTGCGAA AGATATCTCC CGCCGGTTTC GCCCACAACG AACAGAGCCT GCGGGTGGTG 
GAGAAGCTGG AAAACAACGG TAAAGGCTTG AACCTCACCT TTGAAGTGCG GGACGGTATT 
CTCAAGCACT CCAAGGGATA CGGCAACATT CTGGACGACG ACCCCAGCGA GATGGCAATC 
ACCGTGGAAG GCCGCATCGT GCGGGTGGCC GACATCATGG CCTACCTGAA CCACGACCTG 
GACGACGCCC TGCGGTGCAA TGTGATCGAG CGATCTCACA TTCCGGAAAA ATGCGTGAAG 
GTGCTGGGCA AAAACCACTC TGAACGGGCC ACCACCATGA TCCGGGACGT GGTCTACTCC 
AGCAGCTCCG AAGACGGCCT GCTGCGGCTG CGCATCAGCG ACCCGGTGTT TGAGGCCATG 
ACCGAACTGC GCCATTTTCT GTACGACCAT GTGTACCGAT CTCCCAAGGT GCATGCCGAG 
TTTGAAAAGG CCAACCGCAT TCTCACCGAG CTGTACGAGT TTTTCTACAA GCATACCGAC 
ATGCTGGAGG CTGAACTTAA AAAAATGGAG ATGGGCAACT GCATGGACAC GGACGACACC 
GACCGGGTGG TGTGCGACTT TATCGCCAGC ATCACCGACG AATACGCCCT GGCCCTCTAC 
TCCAAGCTTT TTTTCCCCAC ACCCATTATC TATCCGGGGC CGATGCATGT CTGA

Protein sequence

MSIRSDFEER EKTFISPYGC LSSNLRGRDH EEPEGAIRTE FQLDRERIVY SNAFRRLKHK 
TQVFLSPLGD QYRTRLTHTL EVAQISRTLA RAMRLNEDLA EAVALGHDLG HTPFGHSGET 
VLRKISPAGF AHNEQSLRVV EKLENNGKGL NLTFEVRDGI LKHSKGYGNI LDDDPSEMAI 
TVEGRIVRVA DIMAYLNHDL DDALRCNVIE RSHIPEKCVK VLGKNHSERA TTMIRDVVYS 
SSSEDGLLRL RISDPVFEAM TELRHFLYDH VYRSPKVHAE FEKANRILTE LYEFFYKHTD 
MLEAELKKME MGNCMDTDDT DRVVCDFIAS ITDEYALALY SKLFFPTPII YPGPMHV