Gene Sala_2331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2331
Symbol
ID	4080578
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	2459232
End bp	2460818
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	67%
IMG OID	638010711
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_617373
Protein GI	103487812
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.745478
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCAGT TCGACATCAT CGTCATCGGC GGCGGCAGCG CGGGGAGCGC GGCGGCCGGG 
CGGCTCGCCG AGGACGGGGC GCGCACCGTC TGTTTGGTCG AAGCGGGCGG GACGAACGAC 
ATCGTGCGGG TGAAGACACC GGGTTTCATG CCCTTCATCC CCAAATCGTC GAACTGGCGA 
TATGACACCG TGCCGCAACA GGGACTGAAC GGCCGCATCG GATATCAGCC GCGCGGGCGC 
GGGCTGGGCG GGTCGAGCGC GATCAACGCG ATGGTCTATA TCCGGGGGCA CGCCTTCGAT 
TACGACCAGT GGGCGGCGCT GGGCGCGACC GGCTGGAGCT ATGCCGACGT GCTGCCTTAT 
TTCAAGCGCA GCGAGGGCAA TGAGCGCGGC GGTGACGAGT TTCACGGCGG GGACGGGCCG 
CTGAATGTGA TGGACCAGCG CTGGCCCAAT GTGACGAGTC GACGCTTCGT CGAGAGCGCG 
ACGGCGCTGC AATTGCCGCG CACTGCTGAT TTCAACGGCC CTGACAATGA AGGCTTCGGC 
CTCTATCAGG TGACGCAGAA AGGCGGCGAG CGCTGGTCGG CGGCGCGCGC CTATGTCGAG 
CCGCTGCGCG GGCGATCGAA CTTCGACATC CGCACCGGCG CGCTGGTCGA GAAGATTTTG 
ATCGAGGAGG GGCGCGCGGT CGGTGTCACG ATCCGCTGCG GGCGCCGCCG CGAGACGCTG 
CGCGCACGGG GTGGGGTCGT GTTGTCGGCG GGGGCGTTCG GCAGTCCGCA GATATTGATG 
CTGTCGGGGA TCGGGCCCGG CGCGCATTTG CAGGAGATGG GGATTGCCGT CGCGCGCGAC 
CATGCCGGGG TCGGCGACAA TCTGCAGGAC CATATCGATT ATGTGTCGAG CTGGGAAACG 
CGCTCGACCG ATCCCTTCGG CGACAGTTTC GGTGGCACCT GGCGGATGGT GAAGGCGATC 
GTCGAGCATC GCCGCCGCCG GACGGGGATC ATGACGACCT GTTTCGCCGA AGCGGGGGGA 
TTCTGGAAAT CGCGCCCCGA CCTGCCTGCG CCCGACGTGC AGTATCATTT CGTGCCCGCG 
ATGCTCGAGG ATCATGGCCG CACCAAGGTC AAGGGGCACG GCTTTTCGTG CCACGCCTGC 
GTGCTGCGGC CTGAAAGCAG AGGCACGGTG CGGCTGGCGT CCTCCGATGC CGCGGCGGCA 
CCGACGATCG ACCCCGGTTT TTTGACCGAC GAGCGCGACA TGGCGACGCT TCGCGCCGGG 
GTGCGGATGA TGCACCGCAT CGTCGCGGCG CCGCCGCTCG CCGATTATGC GGGGGTCGAC 
CGCCATCCGG TGAACCTCGA TGACGATGCC GCGCTCGACG CGCTGATCCG CAGCCGCGCC 
GACACCGTCT ATCATCCCGT CGGCACGTGC CGGATGGGCA GCGATGCCGA TGCGGTGGTC 
GATCCGACAC TGAAGCTCAA CGGCATCGAC GGGCTGTGGG TTGCCGATGC GAGCATCATG 
CCACGACTGG TCAGCGGCAA CACCAACGCG CCGAGCATCA TGATCGGCGA AAGGGCAGCG 
GATTTCGTGA AGGCGGCTTT GAGTTAA

Protein sequence

MDQFDIIVIG GGSAGSAAAG RLAEDGARTV CLVEAGGTND IVRVKTPGFM PFIPKSSNWR 
YDTVPQQGLN GRIGYQPRGR GLGGSSAINA MVYIRGHAFD YDQWAALGAT GWSYADVLPY 
FKRSEGNERG GDEFHGGDGP LNVMDQRWPN VTSRRFVESA TALQLPRTAD FNGPDNEGFG 
LYQVTQKGGE RWSAARAYVE PLRGRSNFDI RTGALVEKIL IEEGRAVGVT IRCGRRRETL 
RARGGVVLSA GAFGSPQILM LSGIGPGAHL QEMGIAVARD HAGVGDNLQD HIDYVSSWET 
RSTDPFGDSF GGTWRMVKAI VEHRRRRTGI MTTCFAEAGG FWKSRPDLPA PDVQYHFVPA 
MLEDHGRTKV KGHGFSCHAC VLRPESRGTV RLASSDAAAA PTIDPGFLTD ERDMATLRAG 
VRMMHRIVAA PPLADYAGVD RHPVNLDDDA ALDALIRSRA DTVYHPVGTC RMGSDADAVV 
DPTLKLNGID GLWVADASIM PRLVSGNTNA PSIMIGERAA DFVKAALS