Gene Saro_1582 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1582
Symbol
ID	3917257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1638340
End bp	1639614
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	64%
IMG OID	640444322
Product	GTP cyclohydrolase II / 3,4-dihydroxy-2-butanone 4-phosphate synthase
Protein accession	YP_496856
Protein GI	87199599
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase [COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.482079
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACAGG ATATTGTAGC ACGCGCTCGT CAGCTCATCG AAGACCGGAT CATCTCGCGG 
GCCGCGCTGG CGCGTGCCGC CGGGCTGCAT CCCAATACGT TGCGCGATGC GCTTTCGCCC 
GACTGGAACC CCACCGTCGA TACGCTGACC AAGCTGGAGC GGGCAATGGA CGATAGCGAG 
GACGACGACT TCGCCCTCGC CTCGGTCGAA GAAATCATCG CCGAAGTCCG CAACGGCCGC 
ATGGTGGTGC TGGTCGACGA CGAGGACCGC GAGAACGAGG GCGATCTGCT TATTCCGGCA 
CAAATGGCCA CGCCCGAGAC GATCAACTTC ATGGCAACGC ACGGTCGTGG CCTCATCTGT 
CTGTGCCTTA CCAGCGACCG CGCCAGCAAT CTTGGCCTCG AACTGATGAG CCGGCATAAC 
GGCACCCGTC ATGGAACAGC CTTCACTGTA TCCATCGAGG CCCGCGAGGG TGTCGATACC 
GGCATTTCCG CCGCAGACCG CGCCCGCACC ATTGCCGTTG CCGTCGATGC GACGAAGACC 
CGCGACGATC TGGTGACGCC CGGCCACGTC TTCCCGCTGA TCGCACGTGA CGGCGGCGTC 
TTGGTCCGCG CCGGACACAC CGAGGCAGCA GTCGACCTTC CGCGCCTTGC CGGCCTCAAT 
CCCTCGGGCG TGATCTGCGA GATCATGAAC GACGATGGCA CCATGGCGCG CCTCGACGAT 
CTCATTCCCT TCGCCCGCAA GCATGGCCTG AAGATCGGCA CGATCCGCGA CCTGATTGAA 
TATCGCCGCC GCCACGACCA CCTTGTCGAA TGCGCGAACC AGGCTCCGTT CCACACCGAT 
TACGGCGGCG AATGGACGAT CAAGACCTAT CGCAACAAGG TGGACGGATC GGCCCACCTC 
GTGCTCCAGA AGGGCGCGGT CGTGCCGGGC AAGCCCACGC TAGTGCGCAT GCATGCGATC 
TCGGTCCTGT CCGATGTTCT CGGCCAGCCG GGACCGCGCA AGCGCATCCT GCAGCGCGCC 
ATGACCGCGA TCGGCGAGGC AGGCTCCGGG GTGATCGTGC TGCTCATGCC GACCGACCCG 
CAGCAACTGA TGAACGAAGT TGCCGGAACG GCCGGACACG ACATGGAACT GCGCAGCTAT 
GGCATCGGCG CGCAGATCCT TGCCGATCTG GGCGTGCATG ACATGGTCCT GCTAACCAAT 
TCGCACCACA ACCTTGTTGC GCTCGAAGGC TACGGGCTGA GCATCGTCGG CGAACAGGCC 
ATTCCGGAGG CCTGA

Protein sequence

MAQDIVARAR QLIEDRIISR AALARAAGLH PNTLRDALSP DWNPTVDTLT KLERAMDDSE 
DDDFALASVE EIIAEVRNGR MVVLVDDEDR ENEGDLLIPA QMATPETINF MATHGRGLIC 
LCLTSDRASN LGLELMSRHN GTRHGTAFTV SIEAREGVDT GISAADRART IAVAVDATKT 
RDDLVTPGHV FPLIARDGGV LVRAGHTEAA VDLPRLAGLN PSGVICEIMN DDGTMARLDD 
LIPFARKHGL KIGTIRDLIE YRRRHDHLVE CANQAPFHTD YGGEWTIKTY RNKVDGSAHL 
VLQKGAVVPG KPTLVRMHAI SVLSDVLGQP GPRKRILQRA MTAIGEAGSG VIVLLMPTDP 
QQLMNEVAGT AGHDMELRSY GIGAQILADL GVHDMVLLTN SHHNLVALEG YGLSIVGEQA 
IPEA