Gene BURPS668_1646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1646
Symbol
ID	4885485
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	1613302
End bp	1614450
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	72%
IMG OID	640127574
Product	putative NAD-dependent 4-hydroxybutyrate dehydrogenase
Protein accession	YP_001058687
Protein GI	126439095
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.627044
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCCTACA TCTATTATCT GACGCACATC CATCTCGGCG ACGACGCGCT CGCGATGCTC 
GGCGCCGAGT GCGCGCGCAG CGGCATCGCG CGGCCGCTCA TCGTGACGGA CAAGGGCGTG 
GCGGCGGCGG GGCTCGTCGA TCGCGCGCTC GAGGCACTCG GCCTCGGCGC GCTGCCCGTG 
TTCGACGACA CGCCGTCGAA TCCGACCGAA GCCGCCGTGC TCGCCGCCGC GCAGCGTTAT 
CGCGACGAGG GCTGCGACGG GCTCGTCGCG GTCGGCGGCG GCTCGGCGAT CGATCTCGCC 
AAAGGCGTCG CGATCGCGGC GACGCATCCG GCGCCGCTCA CCCGATACGC GACGATCGAA 
GGCGGCAGCG AGCGGATCAC CGCGGCCGCC GCGCCGCTCA TCGCGGTGCC GACGACCTCG 
GGCACCGGCA GCGAGGTCGC GCGCGGCGCG ATCCTGATCC TCGCCGACGG CCGCAAGCTC 
GGCTTCCATT CGTGGCACCT GCTGCCGAAG GCGGCGATCT GCGACCCGTC GCTCACGCTC 
GGCCTGCCGC CCGGGCTCAC CGCCGCGACC GGCATGGACG CGATCGCGCA CTGCATCGAG 
ACCTTCCTCG CGCCGGCGTT CAATCCGCCC GCCGACGGCA TCGCGCTCGA CGGCCTCGAG 
CGCGCGTGGG CGCATATCGA GCGCGCGACG CACGACGGCG GCGATCGCGC CGCGCGCCTC 
GCGATGATGA GCGCGTCGAT GCAGGGCGCG ATGGCGTTCC AGAAGGGGCT CGGCTGCGTG 
CACTCGCTGT CGCATCCGTT GGGCGGCGTG AAGGTCGACG GCAAGACTTC GCTGCATCAC 
GGCACGCTGA ACGCGGTCGT GCTGCCCGCG GTGCTGCGCT TCAACGAAAG CGCGCCGAGC 
GTCGTCGCCG AGCGCCGCTA TGCGCGGATG CGCCGCGTGA TGAACCTGCC CGAGCGCGCG 
GATCTGTCGC AGGCGCTGCA CGACATGACC GCGCGTCTCG GCCTGCCGAC GGGGCTGCGG 
CAAATGGGCG TCGACGAGCA AGCGTTCGAC CACGTGATCG AGGGCGCGCT CGCCGATCAT 
TGCCACAAGA CGAACCCGCG TATCGCGTCG GCCGACGATT ACCGGCGCAT GCTCGTCGAA 
TCGCTGTGA

Protein sequence

MAYIYYLTHI HLGDDALAML GAECARSGIA RPLIVTDKGV AAAGLVDRAL EALGLGALPV 
FDDTPSNPTE AAVLAAAQRY RDEGCDGLVA VGGGSAIDLA KGVAIAATHP APLTRYATIE 
GGSERITAAA APLIAVPTTS GTGSEVARGA ILILADGRKL GFHSWHLLPK AAICDPSLTL 
GLPPGLTAAT GMDAIAHCIE TFLAPAFNPP ADGIALDGLE RAWAHIERAT HDGGDRAARL 
AMMSASMQGA MAFQKGLGCV HSLSHPLGGV KVDGKTSLHH GTLNAVVLPA VLRFNESAPS 
VVAERRYARM RRVMNLPERA DLSQALHDMT ARLGLPTGLR QMGVDEQAFD HVIEGALADH 
CHKTNPRIAS ADDYRRMLVE SL