Gene Daro_1938 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1938
Symbol
ID	3567867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	2086749
End bp	2088095
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	60%
IMG OID	637680409
Product	deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_285154
Protein GI	71907567
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	0.0886693
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.205708
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCAAAC GAAAAATCTG GGAAAAGCTG CTGTCGAGCG AACGCCTGGG GGCCGGCAAG 
GCGCCCGGTA CGGCTGAGCG TACGGCATTC CAGCAGGATT ACGACCGCAT CGTCTTCACT 
TCTGCCTTCC GGAGAATGAA GGACAAGACG CAGGTTTTCC CGCTGTCCAA GAGCGACTAT 
GTCCGGACTC GCCTGACGCA CAGCCTTGAG GTCAGTTGTG TCGGGCGTTC GCTCGGCGCT 
GTGGTTGGGC GCGAGATCAT TGCCCGGCAC GGTTTGCAGC ATGTCGAGTC TGGTGATTTT 
GGCGCCATCG TCGCCGCCGC TTGTCTGGCC CACGACATTG GCAATCCACC CTTCGGCCAT 
GCCGGCGAGG ACGCCATCCG CGAATGGTTC CGCCATTCCG GCCTGCTTGA ACGTCACGAC 
TTCACGCCAG CGCAGAAGGC AGATTTCGAG CGCTACGAGG GTAATGCACA AGGTTTTCGC 
ATCGTCAGTC GGCTGCAAAG CCCGGCCAAC CCAGGCGGCC TGCAGTTAAG TAGTGCGGTC 
CTGGCGACCT TTACCAAATA TCCACGGCCA TCCCATCTTG ACGCTGAGCT GGATGGCAAG 
AGCGGCAAGA AGTTTGGCTT CTTCCAGCAG GATGTTGGGG CCTTTCAGCA AGTGGCCCGC 
GCGACCGGTC TGGTCGAACG TATCCCGGGT ACCGCCTGGC GGCGCCATCC GCTGGCTTTC 
CTGGTCGAGG TGGCCGACGA TACCTGTTAC CTGATTGTCG ATCTGGAAGA CGCTTCGCGG 
CTCGGTTTCG TGCATTACAA GGACGCCGAA TGTCTGCTGG CCGACCTGGC CGGGAATACG 
GTCAATGGCG GGCGGCTGGA TCGGCTGCAC GATCCAAAAG AGCGCCTGGA GTACCTGCGT 
GCCAAGGCCA TCGGCTGCCT TCTTGAAAGT GCCGCGGCGG TTTTTCTGGA AAACGAGGAC 
GCCATCCTGA GTGGCACGTT CGATGACGAG CTGCTTGAGA ACTCGCCGAT CTCCCATCCC 
CTGCAGGCCA TTCTCAAACT GGCCAAGGAA ACGATCTACA CGGCCCGCCC GGCGCTGGAA 
ATCGAAACGG CAGGCTTCGA GGTGCTTGGC GCCTTGCTTG GCTTATTTAC CAATGCGGTC 
GAGGCGAAAG CTGGTCATGC CCGTTTCACC ACCCGCGAAC GCATGTTGCT CAAGTTGTTG 
CCGGCTCAGT TCCTTGGCCA CAATGGTGAG CCGGATACCG ATCCATACAT TCGCCTGTTG 
CAGGTGGCCG ATTTTGTCGC CGGAATGACC GATTCCTATG CGGTGGACAT GTACCGCAAG 
CTGAAGGGTT TCGACTTGCC GACCTGA

Protein sequence

MGKRKIWEKL LSSERLGAGK APGTAERTAF QQDYDRIVFT SAFRRMKDKT QVFPLSKSDY 
VRTRLTHSLE VSCVGRSLGA VVGREIIARH GLQHVESGDF GAIVAAACLA HDIGNPPFGH 
AGEDAIREWF RHSGLLERHD FTPAQKADFE RYEGNAQGFR IVSRLQSPAN PGGLQLSSAV 
LATFTKYPRP SHLDAELDGK SGKKFGFFQQ DVGAFQQVAR ATGLVERIPG TAWRRHPLAF 
LVEVADDTCY LIVDLEDASR LGFVHYKDAE CLLADLAGNT VNGGRLDRLH DPKERLEYLR 
AKAIGCLLES AAAVFLENED AILSGTFDDE LLENSPISHP LQAILKLAKE TIYTARPALE 
IETAGFEVLG ALLGLFTNAV EAKAGHARFT TRERMLLKLL PAQFLGHNGE PDTDPYIRLL 
QVADFVAGMT DSYAVDMYRK LKGFDLPT