Gene BURPS1106A_1668 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1668
Symbol
ID	4901523
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	1621791
End bp	1622939
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	72%
IMG OID	640134898
Product	NAD-dependent 4-hydroxybutyrate dehydrogenase
Protein accession	YP_001065939
Protein GI	126454540
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCCTACA TCTATTATCT GACGCACATC CATCTCGGCG ACGACGCGCT CGCGATGCTC 
GGCGCCGAGT GCGCGCGCAG CGGCATCGCG CGGCCGCTCG TCGTGACGGA CAAGGGCGTG 
GCGGCGGCGG GGCTCGTCGA TCGCGCGCTC GAGGCACTCG GCCTCGGCGC GCTGCCCGTG 
TTCGACGACA CGCCGTCGAA TCCGACCGAA GCCGCCGTGC TCGCCGCCGC GCAGCGTTAT 
CGCGACGAGG GCTGCGACGG GCTCGTCGCG GTCGGCGGCG GCTCGGCGAT CGATCTCGCC 
AAAGGCGTCG CGATCGCGGC GACGCATCCG GCGCCGCTCA CCCGATACGC GACGATCGAA 
GGCGGCAGCG AGCGGATCAC CGCGGCCGCC GCGCCGCTCA TCGCGGTGCC GACGACCTCG 
GGCACCGGCA GCGAGGTCGC GCGCGGCGCG ATCCTGATCC TCGCCGACGG CCGCAAGCTC 
GGCTTCCATT CGTGGCACCT GCTGCCGAAG GCGGCGATCT GCGACCCGTC GCTCACGCTC 
GGCCTGCCGC CCGGGCTCAC CGCCGCGACC GGCATGGACG CGATCGCGCA CTGCATCGAG 
ACCTTCCTCG CGCCGGCGTT CAATCCGCCC GCCGACGGCA TCGCGCTCGA CGGCCTCGAG 
CGCGCGTGGG CGCATATCGA GCGCGCGACG CACGACGGCG GCGATCGCGC CGCGCGCCTC 
GCGATGATGA GCGCGTCGAT GCAGGGCGCG ATGGCGTTCC AGAAGGGGCT CGGCTGCGTG 
CACTCGCTGT CGCATCCGTT GGGCGGCGTG AAGGTCGACG GCAAGACTTC GCTGCATCAC 
GGCACGCTGA ACGCGGTCGT GCTGCCCGCG GTGCTGCGCT TCAACGAAAG CGCGCCGAGC 
GTCGTCGCCG AGCGCCGCTA TGCGCGGATG CGCCGCGTGA TGAACCTGCC CGAGCGCGCG 
GATCTGTCGC AGGCGCTGCA CGACATGACC GCGCGTCTCG GCCTGCCGAC GGGGCTGCGG 
CAAATGGGCG TCGACGAGCA AGCGTTCGAC CACGTGATCG AGGGCGCGCT CGCCGATCAT 
TGCCACAAGA CGAACCCGCG TATCGCGTCG GCCGACGATT ACCGGCGCAT GCTCGTCGAA 
TCGCTGTGA

Protein sequence

MAYIYYLTHI HLGDDALAML GAECARSGIA RPLVVTDKGV AAAGLVDRAL EALGLGALPV 
FDDTPSNPTE AAVLAAAQRY RDEGCDGLVA VGGGSAIDLA KGVAIAATHP APLTRYATIE 
GGSERITAAA APLIAVPTTS GTGSEVARGA ILILADGRKL GFHSWHLLPK AAICDPSLTL 
GLPPGLTAAT GMDAIAHCIE TFLAPAFNPP ADGIALDGLE RAWAHIERAT HDGGDRAARL 
AMMSASMQGA MAFQKGLGCV HSLSHPLGGV KVDGKTSLHH GTLNAVVLPA VLRFNESAPS 
VVAERRYARM RRVMNLPERA DLSQALHDMT ARLGLPTGLR QMGVDEQAFD HVIEGALADH 
CHKTNPRIAS ADDYRRMLVE SL