Gene Saro_1473 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1473
Symbol
ID	3916138
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1513254
End bp	1514396
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	60%
IMG OID	640444216
Product	GTP cyclohydrolase II / 3,4-dihydroxy-2-butanone 4-phosphate synthase
Protein accession	YP_496750
Protein GI	87199493
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase [COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGAAG TTTCACCGAT CGAGACGATC ATCGAGGACG CTCGCAATGG CCGGCCGTAC 
ATCCTTGTGG ATGCGCCTGA TCGCGAGAAC GAGGGTGACG TGATCATCCC AGCGCAGTTC 
GCAACTCCCA ATGCCATCAA TTTCATGGCG ATGCACGCGC GAGGGCTCAT TTGCCTTGCA 
ATCTCGAGCG AGCGCGCCAG TCACCTCGAT TTGCCAATGA TGGAGGCGCG CAACCAATCT 
TCCCTTAGCA CTGCCTTCAC CGTCTCGATC GAGGCGCGTG ACGGAGTTAC GACAGGAATA 
TCTGCACATG ACCGCGCCCA CACCATTGCG GTTGCCGTCG ATCCTTCCAA AGGGCCGGAA 
GACCTGGTCT CTCCCGGCCA TGTGTTCCCG CTGGTTGCGC GAGATGGTGG GGTGCTTGTC 
CGCGCTGGGC ACACCGAAGC CGCCGTTGAT ATCTCGCGGC TGGCGGGGTT GGCGCCTGCT 
GGCGTCATCT GCGAAATCAT GAATCCTGAC GGGTCTATGG CGCGTCTACC GGAATTGATT 
GAATTCGCGC GCAAGCACGA GATGAACATC GGCACCATCG CCGACCTCAT CGAATATCGC 
CGCCGTTCCG AGTCTCTTGT AGAGCGCGTG GTGGAGGCGC CGTTCGACAG CTGGCACGGC 
GACTTCCGTA TCATCGTTTA TCGTAATGTG ATCGACAGCG GCGAACACGT GGCGCTGGTT 
CGCGGGGATC CCCACCAGGA CATGCCAACG CTGGTGCGGG TCCATCAGCT TGACCTAACT 
GCGGATGTGC TGGGATGGCG CGCGGCGCAT CGCGACTATG TTCCGGCAGC GCTAGAGGTG 
CTTGCTGCGC ACGATGGGCC TGCCGTGGCT GTTTTCGTCC GCGACAACAG TCCCACGTCA 
ATTTCGGAAA GAGTTAAGGG CAATCGTAAG GCCTATGCCG ACACGCATGG CTACCGAGAT 
TATGGCATAG GTGCTCAGAT ACTTCGCGAC GTTGGTGTGC GCGAGATGGT CCTACTGTCT 
TCCAGCGCGG GCAAGCTCGC AGCGCTGGAG GGTTTCGGGC TTTCGGTGGT AAACCGTGTG 
CCGCTGGTAG AGGACGAACG TGGAAAGCCG TCACGGTCGG ATCAGCCGTT CGCATCAGCT 
TGA

Protein sequence

MTEVSPIETI IEDARNGRPY ILVDAPDREN EGDVIIPAQF ATPNAINFMA MHARGLICLA 
ISSERASHLD LPMMEARNQS SLSTAFTVSI EARDGVTTGI SAHDRAHTIA VAVDPSKGPE 
DLVSPGHVFP LVARDGGVLV RAGHTEAAVD ISRLAGLAPA GVICEIMNPD GSMARLPELI 
EFARKHEMNI GTIADLIEYR RRSESLVERV VEAPFDSWHG DFRIIVYRNV IDSGEHVALV 
RGDPHQDMPT LVRVHQLDLT ADVLGWRAAH RDYVPAALEV LAAHDGPAVA VFVRDNSPTS 
ISERVKGNRK AYADTHGYRD YGIGAQILRD VGVREMVLLS SSAGKLAALE GFGLSVVNRV 
PLVEDERGKP SRSDQPFASA