Gene Bcep18194_A4369 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_A4369
Symbol
ID	3749568
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007510
Strand	-
Start bp	1323038
End bp	1324708
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	69%
IMG OID	637762658
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_368609
Protein GI	78065840
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.535677
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACCG ATTCGTACGA CTACGTGATC GTCGGCGCCG GCTCGGCCGG TTGCGCACTC 
GCCTACCGGC TCGGCGAGGA TCCGAACGTC CGCATCCTCG TGATCGAGGC CGGCGAACAG 
GATCGCTCGC CGTACATCAA GGTGCCGCTG ACGTGGGGCC AGATTCTGAA GAACCGGCTG 
TTCGACTGGG GCTATTTCAC CGAGCCGGAA GCCGGCATGG ACGGTCGCCG GATCGAGTGC 
GCGCGCGGCA AGGTGGTGGG CGGCTCGTCG TCGATCAACG GCATGGCCTA CGCACGCGGC 
GCGCGGGAAG ACTACGAAGG CTGGGCCGAC GAGTTCGGCC TGACCGACTG GTCCTACGAC 
GCGGTGCTGC CGTACTTCAA GCGCTCCGAA TCGTGGGAGC GCGGCGAATC GGCGTTGCGC 
GGCGGTCGCG GCCCGCTGAC CGTGATCAAG CTCGACTATC GCGACCCGCT GGTCGGCGGC 
TTTCTCGACG CGACGCGTGC GTGCGGCTAT CCGGAAAACG ACGACTACAA CGGCGCATCC 
GTCGAAGGCT TCGGGCCGAT GCAGGCCACC ATCCGCAACG GCCTGCGCTG CAGCGCCGCG 
GTCGCCTATC TGCGCCCGGC GCTCGCGCGC GGCAACGTCA CGCTGGTGAC CGGGGCCCTC 
GCGAAACGGA TCGTGCTCGA TACCGACAGC GGTACGCCGC GCGCCATCGC GATCGAGTAT 
CGCCGTGGCG AGTCCGACTA CCGCGCCGAT GCACGCCGCG AAGTCATCCT CTGCGGCGGC 
GTGATCAATT CGCCGCAGCT GCTGATGCTC TCCGGCATCG GCGCGGCCGA CAGCCTGCGC 
ACGCACGGCA TCGCGTCGAA AGTCGAATTG CCCGGCGTGG GCGCCAACCT GCATGACCAC 
ATCGTGTTCG ACCTGCGCTG GAGCCGCAAG GAACCGGGGC CGCTGCACCG GATGATGCGT 
GCCGACCGTA TCGCGTTCGA CGTCGCGCGC ACGCTGGCAG GCGGCAACGG CTTCTCGAGT 
GCGATCCCCG CCGCCGCGCT CGGGCTGGTC CGCAGCCAGC CTCACCTGCC GCTGCCGGAC 
GTGCAGCTGA TCCTCGCGGC CGGCGCGATG AACGCCGCGC CGTACTTCGA GCCGTTCAAG 
CACGCGTATG CCGATTCGTT CGCGATCAAG GGCATTTTCC TCACGCCCGA AAGCCGCGGC 
CGCGTGTCGC TGAAGTCGGC CGATCCGGCC CAGCACGCGC GGATCGAGCA AAACTTCCTC 
GCCACCGAGC ACGATCGCGT CGCAGCGCGC GAGATGTTCC GGCGCATGCG GGAAATCGGC 
GCGCAGGCCG GGCTGCGCCC GTTCATCGAC GCAGAGATCG CACCGGGCCC GCAGGTCCAG 
AGCGACGCAG ACGTCGACGC CTTCATTCGT CGTGTCGCGA TCACCCTTCA TCACCCGGTC 
GGCACGTGCC GCATGGGTCG CGACGACGAT CCGGCGGCCG TGGTCGATAC GCAGATGCGC 
GTGCGCGGCG TCGCCGGATT GCGGGTGGTC GACGGCTCGT CGATCCCGCG CATCATCCGC 
GGGCCGACCA ACGCGCTGAT CATGACGATG GCCGAACGCG CAGCCGATTT CATGACCGGG 
AAAGCCATGC CCGTGCCGCA GGCGCAGGTT CGCGCCACCG CACCGATGTA G

Protein sequence

MKTDSYDYVI VGAGSAGCAL AYRLGEDPNV RILVIEAGEQ DRSPYIKVPL TWGQILKNRL 
FDWGYFTEPE AGMDGRRIEC ARGKVVGGSS SINGMAYARG AREDYEGWAD EFGLTDWSYD 
AVLPYFKRSE SWERGESALR GGRGPLTVIK LDYRDPLVGG FLDATRACGY PENDDYNGAS 
VEGFGPMQAT IRNGLRCSAA VAYLRPALAR GNVTLVTGAL AKRIVLDTDS GTPRAIAIEY 
RRGESDYRAD ARREVILCGG VINSPQLLML SGIGAADSLR THGIASKVEL PGVGANLHDH 
IVFDLRWSRK EPGPLHRMMR ADRIAFDVAR TLAGGNGFSS AIPAAALGLV RSQPHLPLPD 
VQLILAAGAM NAAPYFEPFK HAYADSFAIK GIFLTPESRG RVSLKSADPA QHARIEQNFL 
ATEHDRVAAR EMFRRMREIG AQAGLRPFID AEIAPGPQVQ SDADVDAFIR RVAITLHHPV 
GTCRMGRDDD PAAVVDTQMR VRGVAGLRVV DGSSIPRIIR GPTNALIMTM AERAADFMTG 
KAMPVPQAQV RATAPM