Gene Saro_3680 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3680
Symbol
ID	5077828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	-
Start bp	314150
End bp	315754
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	68%
IMG OID	640481403
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_001166065
Protein GI	146275905
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID	[TIGR01810] choline dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGAGGT TCGAGTTCGA TTTCGTCATC ATCGGCGGCG GCGTCGCGGG GTGCATCCTC 
GCCAATCGCC TGTCCGCCGA TCCCGCCACC CGCGTCCTGC TGCTCGAGGC GGGCGGCTCC 
GACAGGAGCC CGCTGATCGC CGCTCCCGGC GGGCTGCTTC CGATCATGAT GTCGGGCGCC 
CACGCATGGC GCTACGTGTC CGCGCCCCAA CGCCATCTCG ACGACCGCGT GCTCTATCTC 
CCGCGCGGCA AGGTGCTTGG TGGAGGCTCC TCCATCAACG GCATGACCTA TGACCGGGGC 
TTCCATTCGG ACTACGATCG CTGGGCACAG GCGGGCAATC GGGGCTGGTC ATTCGAGGAT 
GTCCTCCCCT ATTTCCGCAA GCTCGAGAAC TACCTGCCCA GCGAGGACGA ATGGCACGGT 
AGGGGTGGCC CGATCCAGGT TACCCGCGCC GCGCAGGACC ATCCCTTTGC GAAGGCCTTC 
CTCAAGGCGG GCGCCGAAGC CGGCTACCCC CTGACGCAAG ATCTCAACGG CGCCTCGCGC 
GACGGCTTCG GCGCGGTGGA CCTTACCGTC GGCCGGGGTC GCCGTTCCAG CGCCTCGTCC 
GCCTACCTGC GCCCTGCCAA GGGCAGGCCC AACCTCACCG TCCTGACCCA GGCGCATACC 
CGCCGCATCG TGATCGAGAA CGGCCGCGCC ACCGGCGTGA TCTTCCGCCG CAAGGGCGCG 
GACCGGCTGG CACTGGCCGC GCGCGAGGTG ATCCTTTCGG CAGGCGCGAT CAACAGCCCG 
CAAATCCTCA TGCTCTCGGG ACTGGGCCCG GCCGCGCACC TTGCCGAACA CGGCATTCAG 
GTCCTGCACG ATCTTCCCGG CGTCGGGCAG GGCCTGCAAG ACCATCTCGC CGCCCACGTA 
AAGTACCGCT CGACCAAGCC CTGGTCGATG CTGCGCTATC TCAATCCCCT GCGCGGCGCG 
CTCGCCATGG CCCAGTATGC CCTCCTGCGC CGAGGTCCAC TCGCCGATCC CGGCATGTCC 
GTCGCCTGCA TGGTCCGCTC CGATCCCTCG CTGGATGAAC CCGACATCAA GATGCTGCTG 
GTGAGCGCGC TCTTCGCGCA GAACGGGCGC GAGATGGTGC CGATGCACGG CTTCTACGCC 
CATATCAACG TCGCCCGCCC GCAATCGCGG GGTTCGGTCA CGCTCGCCAG CGCCGATCCG 
GAAGTGCCGC CGGTCATCGA CCAGAACTAC AACGCCGCTC AGGAAGACCG CCGCGCCATG 
CGCGAAGGCG TGCGCATCGC CCGCCGCATC TTCGCCCAGC CCGCTTTCGA CATCATGCGC 
GGAGAGGAAC TGGCGCCCGG CAGCGGGGTC GAATCCGATG CGCAGATCGA CGCCTATATC 
CGCGCCACCG CCGAGGCCGA CTATCACTCC ACCAGCACCG CCCGCATGGG TCGCGATCCG 
ATGGCCGTGG TCGATGACCG ACTGCGCGTC CACGGCGTTG CAGCCCTGCG GGTGGTCGAT 
GCTTCGGTCA TGCCGCACCT TCCGGGCGGC AACACCGCCA TCCCCGTCGC GATGATCGCC 
GAAAAGGCCG CCGACCTCAT TCTTTCGAAG GATTCCCGCC CATGA

Protein sequence

MERFEFDFVI IGGGVAGCIL ANRLSADPAT RVLLLEAGGS DRSPLIAAPG GLLPIMMSGA 
HAWRYVSAPQ RHLDDRVLYL PRGKVLGGGS SINGMTYDRG FHSDYDRWAQ AGNRGWSFED 
VLPYFRKLEN YLPSEDEWHG RGGPIQVTRA AQDHPFAKAF LKAGAEAGYP LTQDLNGASR 
DGFGAVDLTV GRGRRSSASS AYLRPAKGRP NLTVLTQAHT RRIVIENGRA TGVIFRRKGA 
DRLALAAREV ILSAGAINSP QILMLSGLGP AAHLAEHGIQ VLHDLPGVGQ GLQDHLAAHV 
KYRSTKPWSM LRYLNPLRGA LAMAQYALLR RGPLADPGMS VACMVRSDPS LDEPDIKMLL 
VSALFAQNGR EMVPMHGFYA HINVARPQSR GSVTLASADP EVPPVIDQNY NAAQEDRRAM 
REGVRIARRI FAQPAFDIMR GEELAPGSGV ESDAQIDAYI RATAEADYHS TSTARMGRDP 
MAVVDDRLRV HGVAALRVVD ASVMPHLPGG NTAIPVAMIA EKAADLILSK DSRP