Gene Sala_0294 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0294
Symbol
ID	4082654
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	292085
End bp	294085
Gene Length	2001 bp
Protein Length	666 aa
Translation table	11
GC content	66%
IMG OID	638008652
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_615350
Protein GI	103485789
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.254174
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCAA CATTCAGTCC GGGGCAGCTC AAGTTCCTGA AGGCGCTGAC CGAGGCCTTG 
TTCGACGGCG CGGCGATGGC GATCACGCCC GATCAGGTCG TCGCCAATAT CGCCGAGCTG 
TTCGGCAAGG TCGGCGGCAC CAAATTGGAC GAGATGCGCG TCTCGCTCAT CGCCACCGAA 
ATCGCGCTCG GACCGCTGTT CGCCGAGGTC GATGTCGCGG CGCGCGTCGA GCGGATCGCC 
GACCGGCTGC GCGACAGCCG CATCGACCTG TTCCAGGACA TGGGGCGGCT GCGCGGCATC 
GTCTATGCCT GCTATTACGG CCACTGGCTG CCGGGCGATC AGGACGCCAA CGTCGCCAAC 
CCGGTCCACC GCCAGATCGG TTTCGCGCTC CCCCGGTTCC GCGCGCGCGG GCCGGGCGAC 
GTCCCCATCA CGCCCGTGCA GGGCCGCGAG ATCGACCCCG CGCATATATT GACCGCCGAT 
AGTCTCGACG ATGAATATGA CGTGATTGTC GTCGGTTCGG GCGCGGGCGG CGCGGTCGCG 
GGCTATAATA TCGCGGCGCA GGGCTATCGG GTGCTGATCG TCGAGGCGGG GCCCTTCTAC 
CCCAGCCACG CGATCACCCA CCACGAACTC GACATGATCG CGAATCTTTA CAAGCATGGC 
GCGGTGCAGA CGACGACCAA CCGCGATTTC GTCGTTTTCC AGGGGCGGTG CGTCGGCGGA 
TCGTCGACGA TCAACAACGG CATCTGCCTG CGCGTCAACG AGCCCGGCCG CACCCACCCC 
GACGCAGAGG ATGTGCTCGC CAAATGGGCG ACCATCGGCG CGCCGATCGA CCCCGCGGCC 
TTTCACGCCA GCTATGACGC GGTGCAGGCG ATGCTCGGCA TCGCGCGCAT CGAATCCCGC 
AGCGGACGGC ACAACGGCCC GCACCTCATC AATGGCTGGC GCGCCTATGC CAACGCCTCG 
TCCGATCCCA AAGACAAGCG CGCGATCGCC GACTGGTTCG ACAAGAATTT CGGCCCGCCG 
AACACCCCGA ATGCCTGCGC CTATTGCGGC TATTGCAATT CGGGCTGCGC CTATGGCCGC 
CGCATGGGCG TCGCGCAGAC CTATCTGCCC CAGGCGTGCC GCGATCATGG CGCGCGCATC 
CTGCCGCGCA CCAAGGTCCA GCAGATCCTC TGGCAGACCG CGATCGACGG GCGACGCGAG 
GCCGAGGCGG TCAGGCTCGT CCTGCCCGAC GGAGCGAACC GCCTCGTCCG CGCGCGCGTC 
GGCGTCGTTG TCGCCGCGGG CACGATCGCC TCGTCGAAAC TGCTGGCACG CAGCGACATT 
GACGGCACGG GTTATCAGGT GTCGCTGAAC GTCGCCTCGC CCGTCGTCGC GCTGATGCCG 
CCGGGCGTCG GCGGCGATGC GTGGGACGAG GACCAGATGT CGAGCTATGT CGATTGCGGC 
GACTTTCTGC TCGAAAGCCA TTTCCAGCCG CCGATGTCGA TGGCCTCGCT GATGCCCGGC 
TGGTTCGCCG ATCACGCCGA CCGCATGAAG AATTACGGTC GCGTCCATTC GGCGGGCATT 
CTTTTTCCCG CCGACCGGCG TGGGCAGATC GTCGACGGCA AGCTCCGGTT CCGGCTCGAT 
TCAACCGACG ACCTGCCGCT GCTCCGCCGC GCGATGGCGA CGCTGACCAA GGTGCATTTC 
GCCGCCGGGG CGATCGAATG CTATCCCGCG CTGGCGAAAG GACAGACGGT GACGCCGGAT 
ATGGACATCG ACGCCTTTTT CGAGGCGGCG ATTCGCGAAC AGGACGATGT AACTCTGTCG 
AGCAGCCACC CGCACGGCGG CAATGCGATG AACGAGGATT CGCAGCACGG CGTCGTCGAC 
CTGGATTGCC GCGTCCACGG CACCACAAAT GTGCTCGTCA CCGACGCCAG CGTCTTTCCC 
AGCTGCATCC GCGTCAACGC CCAATGGACC ACGATGGCAA TGGCGCATTA TGCGACGGCG 
CGCGGCGATC CCTTCCGGTG A

Protein sequence

MTATFSPGQL KFLKALTEAL FDGAAMAITP DQVVANIAEL FGKVGGTKLD EMRVSLIATE 
IALGPLFAEV DVAARVERIA DRLRDSRIDL FQDMGRLRGI VYACYYGHWL PGDQDANVAN 
PVHRQIGFAL PRFRARGPGD VPITPVQGRE IDPAHILTAD SLDDEYDVIV VGSGAGGAVA 
GYNIAAQGYR VLIVEAGPFY PSHAITHHEL DMIANLYKHG AVQTTTNRDF VVFQGRCVGG 
SSTINNGICL RVNEPGRTHP DAEDVLAKWA TIGAPIDPAA FHASYDAVQA MLGIARIESR 
SGRHNGPHLI NGWRAYANAS SDPKDKRAIA DWFDKNFGPP NTPNACAYCG YCNSGCAYGR 
RMGVAQTYLP QACRDHGARI LPRTKVQQIL WQTAIDGRRE AEAVRLVLPD GANRLVRARV 
GVVVAAGTIA SSKLLARSDI DGTGYQVSLN VASPVVALMP PGVGGDAWDE DQMSSYVDCG 
DFLLESHFQP PMSMASLMPG WFADHADRMK NYGRVHSAGI LFPADRRGQI VDGKLRFRLD 
STDDLPLLRR AMATLTKVHF AAGAIECYPA LAKGQTVTPD MDIDAFFEAA IREQDDVTLS 
SSHPHGGNAM NEDSQHGVVD LDCRVHGTTN VLVTDASVFP SCIRVNAQWT TMAMAHYATA 
RGDPFR