Gene Saro_1848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1848
Symbol
ID	3918408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1947716
End bp	1948885
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	67%
IMG OID	640444590
Product	deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_497122
Protein GI	87199865
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.405651
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGCTT GCGCGCCTTA CGCCAGTGAC CCGGCGCGCA CCCGGGGGCG GGAGTTCGGT 
GTGGATGACA AGGCCTCGCG AGGCCCGCGC AGCGCGTTCC AGCGCGACCG CGACCGGATC 
ATCCATTCCA TCGCCTTCCG CCGCCTGCGC CACAAAACGC AGGTGTTCAT CGCTCCCGAT 
GGCGACCACT ACCGCGTCCG CCTCACCCAT AGCCTCGAGG TTGCCCAGAT CGGCCGCGTG 
ATCGCCCGCG CGCTCGGCCT GGACGAGGAC CTGACCGAGG CGCTCTGCCT TGCGCATGAT 
ATCGGCCATC CTCCTTTCGG CCACGCGGGC GAGGATGCGC TGGAAGAAGC GATGGCTGGC 
TCGGGCGGGT TCGATCACAA CGCCAATACG CTGCGCGTGC TGATGCGGCT CGAAAGCCCC 
TACTGCGGGC ACGAGGGCCT CAACCTCACC TGGGAAACGC TGGAAGGGCT GGCGAAGCAC 
AACGGCCCCA TCTTGAAACC CTCCTGGGCG CTGGAGGAAC TCGACGCCGC CTTTCCGCTC 
GACCTTGCGA CCTTCGCCTC GCTGGAAGCG CAGGTCGCCG CGATCTCCGA CGATATCGCC 
TACGACAACC ACGACATCGA CGACGGGCTG CGGGCAGGCT TCCTTTGCCT GGACGACCTG 
ATGCAGCTCC CCTCGGTGGC CGAACAGTGG CGGGGGATAG AGCGCCGCTT TCCCGGTGCG 
CCGCAGGACC GGATGCTGCG CGAACTGGTG CGCGGGCAGA TCGGCCGCAT GGTCAACGAC 
GTGATCGGGG AAGCTCGCAC CCGGATTGCC GAGACAGGAG TGGAAACCGT CGAGGACGTG 
CGTGCTGCCG GTCGTCCGCT CGCCAGCTTC TCCGCCGCGA TGGGCGAGGA AGAACGCGCG 
CTCAAGCAGT TCATGTACCA GCGGCTCTAT CTCCACGACG AACAGCGCCA GACCGCCGAC 
CGGGCACGCG AAGTCATCGC CGCGCTCTTT TCCGCGTTCG CCGCCGATCC TTCGCAGATG 
CCCGCAAGCT GGCAGGCGAA CCTTCCGGCG CAGGAACCCG CGCGGACGCG CCACATCGCG 
GACTTCATCG CCGGCATGAC CGATCGCTAT GCGATCGACA GCTATGCCCG GCTCTTCGGC 
CACGCTCCGG AGGGACTCAG CAATGTCTGA

Protein sequence

MIACAPYASD PARTRGREFG VDDKASRGPR SAFQRDRDRI IHSIAFRRLR HKTQVFIAPD 
GDHYRVRLTH SLEVAQIGRV IARALGLDED LTEALCLAHD IGHPPFGHAG EDALEEAMAG 
SGGFDHNANT LRVLMRLESP YCGHEGLNLT WETLEGLAKH NGPILKPSWA LEELDAAFPL 
DLATFASLEA QVAAISDDIA YDNHDIDDGL RAGFLCLDDL MQLPSVAEQW RGIERRFPGA 
PQDRMLRELV RGQIGRMVND VIGEARTRIA ETGVETVEDV RAAGRPLASF SAAMGEEERA 
LKQFMYQRLY LHDEQRQTAD RAREVIAALF SAFAADPSQM PASWQANLPA QEPARTRHIA 
DFIAGMTDRY AIDSYARLFG HAPEGLSNV