Gene Saro_3191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3191
Symbol
ID	3917449
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	3410715
End bp	3411779
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	68%
IMG OID	640445975
Product	GTP cyclohydrolase II
Protein accession	YP_498460
Protein GI	87201203
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00505] GTP cyclohydrolase II

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGAAT CGCGCAACGT TGCAAGGGCG CTCGACGCGC TGCGCCACGG CTGGGCGATC 
CGTGTGACCG GCCCGGAGGG GGCGCTCGAC CTGCTCCCCG CCGAAACCGC CTTCGTGCAG 
CCCGGCATCT ACGCGGCCCG ACTGCTCATC TCCGCCGCCC GGGCCGCCAC GTTGAAGCTT 
GCCAACCAGC GCGACGCCGC GGTGCCCGAA GCGCCGGTGA TGATCCACGG CGCGGAGCCG 
TTCAGCCTGT CCGCCGCGCG CAACCTTGCC GATCCGGCGC AGGACCTTGG CTCTCCCTTG 
CGCGGCCCGT TCAAGGCCGA TGCCATCGAA GCACATGAGG CCGCCGTCGC CGCGATGGAC 
ATGGCGCGCC TTGCCGGCAT CCTTCCGGCG TTCCTGATCT CGACAGGCGT GGAAATCGCG 
GCGGAAGTCT CCACCGCCGA TCTTGCCGCG TTCAAGGACC CGCTGAACCT TTCGATACAG 
GCCCGCGCGC GCCTGCCGGT CCACGCCTGC GAGCATGCGG AAATCATCGC CTTCCGTGCC 
CGCGACGACC TGCGCGAACA TGTCGCGCTC GTGCTAGGCA CCCAGACCAG CGAACGCGAG 
CCGCTGGTGC GCCTGCACAG CGAATGCCTG ACGGGCGACG TGCTGGGCAG CCTGAAGTGC 
GATTGCGGCC CGCAGCTCGA CGCAGCGTTG GCGCGCATGG CCGAGGAGGC CAATGCGGGC 
GGCTGGGGCA TACTGCTCTA TCTCAGGCAG GAAGGGCGGG GAATCGGCCT GATCAACAAG 
CTGCGCGCCT ACGAATTGCA GGACCAGGGG TTCGACACGG TCGATGCCAA CGAGCGACTG 
GGACTGCCGA GCGAGGCGCG CGACTTCCCG GTCGCGGCGC GCATGCTTGA CCTGCTGGGC 
GTGCGCAGCC TGCGCCTGTT GACCAACAAT CCGCAGAAAG TGGCGACATT GCAGGCGCTT 
GGGCTGGAGG TGACGGAGCG CGTGGCGCAC CAGTTGCCGT CCAATCCGCA CAACCAGCGC 
TATCTCGACA CCAAGCGAGA CCGGACCGGC CACCTCTTGC GATAG

Protein sequence

MSESRNVARA LDALRHGWAI RVTGPEGALD LLPAETAFVQ PGIYAARLLI SAARAATLKL 
ANQRDAAVPE APVMIHGAEP FSLSAARNLA DPAQDLGSPL RGPFKADAIE AHEAAVAAMD 
MARLAGILPA FLISTGVEIA AEVSTADLAA FKDPLNLSIQ ARARLPVHAC EHAEIIAFRA 
RDDLREHVAL VLGTQTSERE PLVRLHSECL TGDVLGSLKC DCGPQLDAAL ARMAEEANAG 
GWGILLYLRQ EGRGIGLINK LRAYELQDQG FDTVDANERL GLPSEARDFP VAARMLDLLG 
VRSLRLLTNN PQKVATLQAL GLEVTERVAH QLPSNPHNQR YLDTKRDRTG HLLR