Gene Saro_3578 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3578
Symbol
ID	5077727
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	+
Start bp	195813
End bp	197438
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	69%
IMG OID	640481302
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_001165964
Protein GI	146275804
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGAAT TCGATTACAT CATCGTCGGC GCGGGTTCGG CGGGCTGCGT CCTGGCCAAC 
CGGCTCAGCG CCGATCCCGC CAACCGCGTC CTGCTGATCG AGGATGGCGG CGACAACCAG 
CACCCGTTCA TCAAGATGGC CGGCGGCTTC ATCAAGATCA TGGGCAACCC GGACTATTTC 
CGCGTGTTCC CGACAGAACC GCGCCCCGGG ATGCGCCCCG GCATCCACAC CTACGGGCGC 
GGGCTCGGCG GATCATCGGC GATCAACGGC ACGTGGTATC TCACCGGCAT GCCCAAGGAC 
TTTGACGGCT GGGCGCAATC CGGCCTTGCC GGATGGGGCT GGGACGAAAT CGCCCGCTGC 
TACCGCAAGT TCGAGGACTA TCGCGAGCCC GGCGCCCATC CCGGACGCGG CCGCGGCGGC 
GAGCTTCAGG TCACTGCCTC GACCTACGAA TCGCCGGTGT TCGATGCCCT CGCGCAAGGG 
TTCGCCGCGC AGGGCATGCC CTGGCTGGAC GACATCACCA CGCCGGGCGT GCAGGGGGTA 
GGCCGCAGCC AGTACACCGT GGACCGCAAG GGCGTGCGCG AAAGCACCTA CAAGGCTTTC 
GTCATGCCGA TCCTGGGCCG CCACAACCTG ACGATCGCAC AGCACACCGC CGTCAAGCGC 
GTGACGATCG AACAGGGCCG CGCCACGGGC GTCGTCACCG AGGCGCACGG GCAGGAAAGC 
ACCCATGTCG CCAAGCGCGA AGTGATCCTC GCCGCCGGCG TCTATGGCTC GCCCCAACTC 
CTTCAGCTCT CGGGCATCGG CGCGGGCGCG GTGTTGCAGG AGCTCGGCAT TCCGGTCCTC 
AAGGCCCTGC CGATGGTCGG CCGCCAGCTT TGCGACCACA CCAAGTTCGG CGTCTCGTTC 
GACCTCACCA ACCACCCCGG CACCAACCGC GAGTTCTTCG GCTGGCGGCT CTATCGCAAC 
GCGCTGCAAT ACTTCCTTAC CGGCACCGGC CACCTCGCCC GCGTCGGCAT GCCCCTGACC 
GGCCTATACG CCAGCGAGGG CACGGACAAG GACTGGCCCG ACCTCCAGGT CGCCGCCGCG 
CCCTTCGCGA TGCGCACCGT CAACGAGATG GCCGCGCGTC CCGGCAGCCC GCTCACGCCG 
AACCCGGGCC TCACCTTCTC GGGCTACCAC CTGCGCCCGA AGAGCCGCGG ATCGATCCGC 
CTGGTCTCCC CCGATTTCCG CGATGCGCCC GTCGCCGATG CCGCGATCTG GGCAGATCCT 
CACGACAAGG CCAAGAGCCT CGAACTGTTC CGCCTGTTCC GCGCCATCGC CGCATCCGAA 
CCGCTGCGGC CCTTCATCGG CAAGGAGCGC ATGCCGGGCC CCGACGTGCA GGACGAAGCC 
GCCATCCTCG CCGAACTCGG CAAGATGGTT GAGGTCGGCC TCCACGGGAC AGGCACCTGT 
TCGATGGGCA CCGACGAGGC GACCTCCGTC ACCGACGCCC GCGCCCGCGT CCACGGCGTC 
GGCGCGCTGC GCGTGGTCGA CTGCTCGATC ATGCCAACCC CCGTTTCGGG CAACACCAAC 
GGCCCCGCCA TGGCCTTGGC CGAACGCGCC GCGGAACTGA TCCTCGAGGA CGCCCGCCGA 
GGCTGA

Protein sequence

MAEFDYIIVG AGSAGCVLAN RLSADPANRV LLIEDGGDNQ HPFIKMAGGF IKIMGNPDYF 
RVFPTEPRPG MRPGIHTYGR GLGGSSAING TWYLTGMPKD FDGWAQSGLA GWGWDEIARC 
YRKFEDYREP GAHPGRGRGG ELQVTASTYE SPVFDALAQG FAAQGMPWLD DITTPGVQGV 
GRSQYTVDRK GVRESTYKAF VMPILGRHNL TIAQHTAVKR VTIEQGRATG VVTEAHGQES 
THVAKREVIL AAGVYGSPQL LQLSGIGAGA VLQELGIPVL KALPMVGRQL CDHTKFGVSF 
DLTNHPGTNR EFFGWRLYRN ALQYFLTGTG HLARVGMPLT GLYASEGTDK DWPDLQVAAA 
PFAMRTVNEM AARPGSPLTP NPGLTFSGYH LRPKSRGSIR LVSPDFRDAP VADAAIWADP 
HDKAKSLELF RLFRAIAASE PLRPFIGKER MPGPDVQDEA AILAELGKMV EVGLHGTGTC 
SMGTDEATSV TDARARVHGV GALRVVDCSI MPTPVSGNTN GPAMALAERA AELILEDARR 
G