Gene Bind_3801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_3801
Symbol
ID	6198019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010580
Strand	+
Start bp	110490
End bp	112127
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	59%
IMG OID	641703934
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_001831086
Protein GI	182676939
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.382943
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTCCG ATCAGAATGT TTCTGCCGAT GTCGTGATCG TCGGCTCCGG TGTCGCGGGC 
AGCTCCATTG CTAATGAATT GGCGCGGGCC GGAATTTCCG TCATCGTTCT TGAAGCTGGC 
CCCCGCGTGG ACCGTCAGCA TTTCGTTGAG AACTTTCGTA ACCTTGAGAA CAAGCCGTCC 
TATCAGGGGC CGTTCCCGTC CACACCCTGG GCTCCGCATC CGCCGAACCA GATGACGCCC 
AACCAATACC TGCATACGAC GGGTCCAAAT GCCGAGGCCT ATCAGCAGGT CTATCTTCGA 
ATGATCGGCG GTACGACGTG GCACTGGGCC GGATGTGCCT GGCGCTTTCT CCCCTCCGAT 
TTCGAACTCA AGACCCGTTA CGGGCAGGGG CGCGACTGGG CGCTGAAATA CGATGACCTC 
GAGCCGTTCT ATTACCAGGC TGAGGTTATG ATGGGTGTCT GCGGACCGGA CCCTAAGATT 
GAGGATCTTG GCTCTCCGCG TAAGCAGCCC TACCCCATGT CGGCGCTGCC CATTTCCTAC 
GCCGCGCAGC AGTTCCGCAA GCTCATCAGC AAGCAGACGC CATGGCGCAT CGTGCATGAG 
CCACAGGCCC GCAATACGCA GCCCTATGAC GGGCGTCCCA CCTGCGAAGG CCATAACAAC 
TGCATGCCGA TCTGCCCGAT CGGAGCCATG TATAACGGCA GCTATTCCGT CTATCACGCA 
GAGGCCGCCG GGGCGACGTT CATCCCCAAT GCTGTCGCCT ACAGGATCGA GCGTGATGCC 
GCCAACAGGA AAGTGACGGC GGTTCACTAT TACGATCCGG ATAAAGGGTC GCACCGCGTC 
GCGGGAAAGT ATTTCGTCAT TGCCGCGCAC TGCATCGAGA CGGCGAAGCT GCTTCTCGTC 
TCGGCGGATG ACAAGAGCCC AGACGGTGTT GCGAATAGCT CGAGCCATGT CGGCCGGAAC 
ATGATGGACC ATACCGGGGT GCAAGTCACG TTCATCAGTG GCGATAAAGC GCTCTGGCCC 
GGTCGTGGCC CGCTTTTGAC GAACGTGATC GACACCTTTC GCGACGGCGA TTGGCGTGGG 
GAGCACGGCG CCTATCTGGT GCATATGGTG GACGATAACC AAGTGGACCT CGCGACGCAG 
CTCGCGATCT CCAAGGGGTA TGTCGGACAC GATCTGGAAG AACAGATCCG CTATCTGGCC 
TCCCATACCG TTCGTCTGTT CAGCCATAAC GAGGCCTTGC CGGATCCCGA CAACCGCCTG 
ACCCTCAGCA AGACGCACAA GGACGCGCTC GGTATCCCGC ATCCGGAAGT CTATTATAAG 
CTGCCAGACT ATACGGTGCG AAGCTGCGAG CATACGCGTG GTGTGTTCAG GCAACTCATC 
GGTCTTATGC ACGGAACCGA TGAGCAATGG ACGCCGGGAT ATTTCCCGCA GGACCATCCC 
TCTGGAAGTA CCATCATGGG CGCGGACCCC AGGGATTCCG TGGTGGATGG CCATTGCCGG 
ACGCACGACC ATGAGAATCT GTTCATCGCA AGCTCGTCTG TCTTCTCAAC GGTCGGGACG 
GGCAACATCA CCCTGACAGT AGCCGCCCTC GCGCTTCGTG TTGCTGATAT GCTGAAAAGA 
GAACTACGCC ATGCCTGA

Protein sequence

MSSDQNVSAD VVIVGSGVAG SSIANELARA GISVIVLEAG PRVDRQHFVE NFRNLENKPS 
YQGPFPSTPW APHPPNQMTP NQYLHTTGPN AEAYQQVYLR MIGGTTWHWA GCAWRFLPSD 
FELKTRYGQG RDWALKYDDL EPFYYQAEVM MGVCGPDPKI EDLGSPRKQP YPMSALPISY 
AAQQFRKLIS KQTPWRIVHE PQARNTQPYD GRPTCEGHNN CMPICPIGAM YNGSYSVYHA 
EAAGATFIPN AVAYRIERDA ANRKVTAVHY YDPDKGSHRV AGKYFVIAAH CIETAKLLLV 
SADDKSPDGV ANSSSHVGRN MMDHTGVQVT FISGDKALWP GRGPLLTNVI DTFRDGDWRG 
EHGAYLVHMV DDNQVDLATQ LAISKGYVGH DLEEQIRYLA SHTVRLFSHN EALPDPDNRL 
TLSKTHKDAL GIPHPEVYYK LPDYTVRSCE HTRGVFRQLI GLMHGTDEQW TPGYFPQDHP 
SGSTIMGADP RDSVVDGHCR THDHENLFIA SSSVFSTVGT GNITLTVAAL ALRVADMLKR 
ELRHA