Gene Saro_1492 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1492
Symbol
ID	3916157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1534481
End bp	1536040
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	61%
IMG OID	640444234
Product	vanillyl-alcohol oxidase
Protein accession	YP_496768
Protein GI	87199511
COG category	[C] Energy production and conversion
COG ID	[COG0277] FAD/FMN-containing dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCGC TACTTGCCCA AGGCGTTTCC CCCGCGCAAT TTGCACAAGC GCTGGATGCG 
ATGCGCGCTG TCGTTGGCCC ACAGTGGCTT TTTGCCAGCG AAGAAGACAT CGCGGCCTAC 
AGTGATCACT TCGCCTTCGA AGACGTGACT GCCAACATGG CATCGGCGAT CGTCGCCCCG 
CTAGGCCTCG ACCAGATCAC CAGGATCATC GGCATTGCAC GCGATCACCG GATCCCGGTC 
TGGGCGATTT CGACCGGTCG CAACCTTGCC TACGGCGGAT CCGCGCCGCG TAAGCACGGC 
ACGCTGACGC TGGATCTCAA GCGCAACAAC CGCATCCTCG AGGTTAACGA AGAGTTGGCC 
TACGCGGTGG TCGAGCCGGG GGTATCGTTC TTCCAACTGT ATCGCCACTT GCGCGAAACT 
GGCTCCAAGC TCTGGATCGA CACGCCATCG CCAGGCTGGG GCGGTATTAT GGGCAATATG 
CTCGAACGCG GGGTCGGCTA CACGCCCTAC GGCGACCGCT TCATGTGGCA ATGCGGGATG 
CAGGTGGTGC TGGCCGACGG TACGGTTGTG GACACCGGCA TGGCCGCGCA GGAAGGTGCG 
CCCGGCAATC ACACGTATCG TTATGGCGGC GGCCCGTGGA TCGACGGAAT TTTCACGCAG 
TCCAATTTCG GCATCGTCAC CAAGGTCGGC ATCCAGTTGA TGCCTGAACC ACCGGGATAT 
CGCCCGTTCC TTGTCACCTT TGCTGAAGAT GATGACATCG AGCCGGTCTC AGACCTGATC 
CGCCCGCTCA AGATGACGCA CATCATCCCC AACGCGGCCG TCACCTGCAG CCTCAACCTG 
GAAGCAGCCA CATCGCTGGA CCGGACGAAG TACCATTCAG ATTCTGGCCC CGTGCCAGAA 
GCGGGCCGCC GCCGGATGAT GGAGGATCTG GGCGTCGGCA AATGGAACTT TTACGCCGCC 
CTCTATGGCC CTGAACCGGT CATGGATGCC CATTGGGAAG TAATCCGCGA CAGCTTCTCT 
TCGGTGAAGG GCGCGCGCTT CTTCACCGAA GAAGACCGCA AAAACGATGT CGTGTTCGGA 
TATCGCACCC AGTTGATGCG CGGAGAACCG AACATGACCG AGTTCGGTAT CCTCAACTGG 
ATGCCGAATG GTGCCCACCT CGGTTTTTCG CCTGTGGCCC CGGTCGACGG CAAAACCGCG 
CTCGACCAGT ACCGCCTAGC CGAAGCAATC TGTAACCGGC ATGGCTTCGA CTATACCGGC 
ATGTTCATCG TCGGCTTCCG CGCGATGCAC CACATCGTCG AACCGATCTT CTCGCGTAGC 
GATGAGGATC AGCGCGGTCG AGTGGTCAGC ATGGTCACCG AACTGATCGA TGAGGCCGCC 
AAGCGTGGCT ACGGCGAATA TCGCGGTCAC CTCAGCTTCA TGGATCAGAT CGCCGGTACT 
TATGGCTGGG GCGACGACGC GCTCATGAAG CTTAGCCAAC GCATCAAGCG CGCACTGGAC 
CCTTCGGGCA TCATGGCCCC CGGGAAGAGT GGCATCTGGT CGGATGGAGC GTCCTCATGA

Protein sequence

MSALLAQGVS PAQFAQALDA MRAVVGPQWL FASEEDIAAY SDHFAFEDVT ANMASAIVAP 
LGLDQITRII GIARDHRIPV WAISTGRNLA YGGSAPRKHG TLTLDLKRNN RILEVNEELA 
YAVVEPGVSF FQLYRHLRET GSKLWIDTPS PGWGGIMGNM LERGVGYTPY GDRFMWQCGM 
QVVLADGTVV DTGMAAQEGA PGNHTYRYGG GPWIDGIFTQ SNFGIVTKVG IQLMPEPPGY 
RPFLVTFAED DDIEPVSDLI RPLKMTHIIP NAAVTCSLNL EAATSLDRTK YHSDSGPVPE 
AGRRRMMEDL GVGKWNFYAA LYGPEPVMDA HWEVIRDSFS SVKGARFFTE EDRKNDVVFG 
YRTQLMRGEP NMTEFGILNW MPNGAHLGFS PVAPVDGKTA LDQYRLAEAI CNRHGFDYTG 
MFIVGFRAMH HIVEPIFSRS DEDQRGRVVS MVTELIDEAA KRGYGEYRGH LSFMDQIAGT 
YGWGDDALMK LSQRIKRALD PSGIMAPGKS GIWSDGASS