Gene BURPS668_0216 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_0216
Symbol
ID	4885370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	206607
End bp	208250
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	69%
IMG OID	640126144
Product	GMC family oxidoreductase
Protein accession	YP_001057269
Protein GI	126440292
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0487725
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGTACG ACTACATCAT CGTCGGAGGC GGCTCGGGGG GCGCGAGTCT CGCGGGGCGT 
CTCGCCGACG CGTGCCCGGA CGCGACGATC GCGCTGATCG AGGCGGGCGG CCACACCGAA 
CGCAATCTGC TCGTCAACAT GCCGGTGGGG ATCGCCGCGC TCGTGCCGTT CAAGCTCGGC 
ACGAACTACG GCTACGAAAC GGTGCCGCAG CCCGGCCTCG GCGGGCGCCG CGGCTATCAG 
CCCCGCGGCC GCGGGCTCGG CGGCTCGAGC GCGATCAACG CGATGATCTA CACGCGCGGC 
CATCCGCTCG ATTATGACGA ATGGGAGCAG CTCGGCTGCA CCGGCTGGGG CTGGCGCGAC 
GTGCTGCCGT ATTTCCGGCG CGCCGAAGGC AACGCGCGCG GCGCGAACGA ATGGCACGGC 
GCCGACGGCC CGCTCACGGT ATCCGATCTG CGCTTTCGTA ATCCGTTCTC CGAACGATTC 
ATCGCGGCCG CGCATGAGGC CGGCTATCCG CTGAACGACG ATTTCAACGG CGAGCATCAG 
GAGGGCGTGG GCTTCTACCA GGTCACGCAT CGCGACGGCT CGCGCTGCAG CGTCGCGCGC 
GCCTACGTGT ACGGCCGCAC GCGGCCGAAC CTGCACGTGA TCGTCGACGC GACGGTGCTG 
CGCGTCGTGT TCGACGGCAA GCGCGCGACG GGCGTCGAGT TCGCGCGCGC CGGGCGCACC 
GAGCAGCTTG CCGCGCGCGC GGAAGTGATT CTGTCCGCCG GCGCGTTCAA TACGCCGCAA 
TTGCTGATGT GCTCGGGCGT CGGCCCCGCC GCGCAACTGC GCCGGCACGG CGTCGCGCTC 
GTGCACGATG CGCCCGACGT CGGCGAGAAC CTGATCGATC ACATCGATTT CATCATCAAC 
AAGCGCGTGA ATTCGTCGGA GCTCGTCGGC ATCTGCATGC GCGGCATCGC GAAGATGACG 
CCCGCGCTGT TCAGCTATCT GTCCGGGCGT CGCGGAATGA TGACGAGCAA TGTCGCGGAG 
GCGGGCGGCT TCATCAAGAG CGAACCGGGG CTCGATCGTC CCGATCTGCA ATTGCATTTC 
TGCACCGCGC TCGTCGACGA TCACAACCGC AACATGCACT GGGGCTTCGG CTATTCGCTG 
CACGTGTGCG CGCTGCGGCC GAAGAGCCGC GGCAACGTCG CGCTCGCAAG CGGCGACGCG 
CGCGTCGCGC CGCTCATCGA TCCGCGCTTC TTCAGCGACG AACGCGATCT CGACCTGCTC 
GTGACGGGCG CGAAGGCGAT GCGCAGAATC CTCTGCGCCG CGCCGCTCGC GTCGCAGGGC 
GGGCGCGAGC TGTATACCGA TCCGGGCGAT ACCGATGCGC AATTGCGCGC GGCGATCGTC 
GCGCATGCGG ACACGATCTA CCACCCGGTC GGCACGTGCC GGATGGGCAC CGATGCGCGC 
GCGGTCGTCG ATCCGCAATT GCGCGTGAAA GGGGTGGACG GGCTGCGGGT GGTCGATGCT 
TCGGTGATGC CGACGCTCAT CGGCGGCAAC ACGAACGCGC CGACCGTGAT GATCGCCGAG 
CGCGCGGCCG ATTTCATCGT GGCCGCGCGC AACGGCCAGG CCGCGCCCAT GCGCGAGCGA 
ATCGCGGCGA CGCACGGCGG CTGA

Protein sequence

MQYDYIIVGG GSGGASLAGR LADACPDATI ALIEAGGHTE RNLLVNMPVG IAALVPFKLG 
TNYGYETVPQ PGLGGRRGYQ PRGRGLGGSS AINAMIYTRG HPLDYDEWEQ LGCTGWGWRD 
VLPYFRRAEG NARGANEWHG ADGPLTVSDL RFRNPFSERF IAAAHEAGYP LNDDFNGEHQ 
EGVGFYQVTH RDGSRCSVAR AYVYGRTRPN LHVIVDATVL RVVFDGKRAT GVEFARAGRT 
EQLAARAEVI LSAGAFNTPQ LLMCSGVGPA AQLRRHGVAL VHDAPDVGEN LIDHIDFIIN 
KRVNSSELVG ICMRGIAKMT PALFSYLSGR RGMMTSNVAE AGGFIKSEPG LDRPDLQLHF 
CTALVDDHNR NMHWGFGYSL HVCALRPKSR GNVALASGDA RVAPLIDPRF FSDERDLDLL 
VTGAKAMRRI LCAAPLASQG GRELYTDPGD TDAQLRAAIV AHADTIYHPV GTCRMGTDAR 
AVVDPQLRVK GVDGLRVVDA SVMPTLIGGN TNAPTVMIAE RAADFIVAAR NGQAAPMRER 
IAATHGG