Gene Saro_3164 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3164
Symbol
ID	3918206
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3378071
End bp	3379762
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	65%
IMG OID	640445948
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_498433
Protein GI	87201176
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.115784
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCGACG CAATCGTAAT CGGATCGGGA ATGAGCGGCG GCATCGCCGC CAAGGAACTG 
TGCGAACGCG GCCTCAAGAC GCTCGTGATC GAGCGTGGCC GCAAGCTCGA GCACGGCGCG 
TCCTATACTG ACTGGATGAA CCCCTGGGAC GTCCCCAACG CTGGCCTCAT TCCCGAAGAG 
GAACTGGCCC GCGACTATGC CGTCCAGCGC AACTGCTATG CCGTGAACAC CGCTACGCAG 
CAGTATTGGG TCAAGGATAG CGAGCATCCC TACACCACGC CGGAAGACAA GCCCTTCTGG 
TGGATTCGCG GCTATCACCT GGGCGGCCGT TCGATCATGT GGGGTCGCCA GACCTATCGC 
ATGTCGGAAA TGGACTTCGA GGCCAATGCG CGCGACGGGC ACGGCTCGGA CTGGCCGATC 
CGCTATGCCG ATCTCGCGCC GTGGTACGAT CATATCGAGC GGTTCATCGG CGTTTCCGGA 
TCGAAGGAGG GATTGCCGCA GCTTCCGGAC GGCGAATTCC TGCCCGCCAT GCCGATGAAC 
GACGGCGAAA AGGCGTTCAA GTCGGCGGTG GAGCGCAACT ATCCCGATCG CAAGGTCATC 
ATCGGCCGCT GTGCGCACCT GACCGAAGCG CGCGAGCATC ACACGGAACT GGGGCGCAAC 
CCCTGCCAGT ACCGCTCGCT CTGCGAACGA GGTTGTTCCT ACGGGGCTTA TCACTCCAGC 
CTGTCTTCGT CGCTCCCCGC GGCGGAAGCG ACCGGCAACC TTACCATCGT GACCGACGCC 
ATCGCCCATT CGATCATCAC CGATCCCCGG ACGGGCAAGG CCACCGGCGT GCGGGTGATC 
GACCAGAACA CCCGCGAAGG CCGGACCTAT GAGGCCAAGG TTGTGTTCCT GTGCGCCTCG 
ACCATTCCCA CCGCGCAGAT CCTGCTCAAT TCGCGCAGCG AGGCGAACCC GCGCGGCCTT 
GCCAATTCGT CGGACATGGT CGGACGCAAC CTGATGGATC ACCTCTACGG CCTCGGGTAC 
GCGGCGCGCA TGCCGGGGCC GGAGACGACC TTTCGCGGGC GGCGCCCCAA CGGTCTCTAC 
ATCCCGCGCT ATCGCAACCT GCCAGGCGCC GGCGACACTG CCGGCTTCCT GCGGGGCTAC 
GGCTTCCAGG GTGCGGTTGA CCGTAGTCCG TGGCGGGCGG TTGCGAATGC CGCGCCGGGC 
GTCGGTGCGG AACTCAAGGA GCGGGTCCGC CACCCCGGCG AATGGATGAC CTACTTCTCC 
GGCTTCGGCG AAATGCTGCC GAACCCGGAG AACCGGGTGA CGCTCCATGC GACCAATGTC 
GACAAGTGGG GCATGCCCAT CGCCCATATC GACTGCGCGC ACGGCGAGAA CGACCGCAAG 
ATGGCGCAGG CGATCCTTGC CGACGGCAAG GCGATGATCG AGGCGGCGGG CGGCCAGATC 
GTCATGGCCC GCACGGACCT CGTGCCGCCC GGCCTCGGCA TCCACGAAAT GGGCACCGCC 
TGCATGGGCA AGGACCCGAA GACCTCGGTG CTCAACAAGT ACAACCAGGC CCATGACGTG 
CCGAACCTGT TCGTCACAGA CGGCGCGGCA ATGGCGTCGG GCGGCTGCCA GAACCCGTCG 
CTGACCTACA TGGCGCTTTC CGCCCGCGCG GCGCACCATG CCACGGAGTT CCTCAAGGCC 
GGGACGATCT GA

Protein sequence

MFDAIVIGSG MSGGIAAKEL CERGLKTLVI ERGRKLEHGA SYTDWMNPWD VPNAGLIPEE 
ELARDYAVQR NCYAVNTATQ QYWVKDSEHP YTTPEDKPFW WIRGYHLGGR SIMWGRQTYR 
MSEMDFEANA RDGHGSDWPI RYADLAPWYD HIERFIGVSG SKEGLPQLPD GEFLPAMPMN 
DGEKAFKSAV ERNYPDRKVI IGRCAHLTEA REHHTELGRN PCQYRSLCER GCSYGAYHSS 
LSSSLPAAEA TGNLTIVTDA IAHSIITDPR TGKATGVRVI DQNTREGRTY EAKVVFLCAS 
TIPTAQILLN SRSEANPRGL ANSSDMVGRN LMDHLYGLGY AARMPGPETT FRGRRPNGLY 
IPRYRNLPGA GDTAGFLRGY GFQGAVDRSP WRAVANAAPG VGAELKERVR HPGEWMTYFS 
GFGEMLPNPE NRVTLHATNV DKWGMPIAHI DCAHGENDRK MAQAILADGK AMIEAAGGQI 
VMARTDLVPP GLGIHEMGTA CMGKDPKTSV LNKYNQAHDV PNLFVTDGAA MASGGCQNPS 
LTYMALSARA AHHATEFLKA GTI