Gene BURPS668_1911 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1911
Symbol
ID	4884010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	1872733
End bp	1873824
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	69%
IMG OID	640127839
Product	zinc-binding dehydrogenase family oxidoreductase
Protein accession	YP_001058946
Protein GI	126439608
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.197112
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGAATC GAAACGACGA AACGCAGCAG ATGACGGCGA TCGTCTGCCA CGCCCCCGAG 
GACTACCGCG TCGAGCGCGT CGCGAAGCCG CGCGCGAACG CGCGCGAGCT CGTGATCCGC 
ATCGGCGCGT GCGGCATCTG CGCGAGCGAC TGCAAGTGCC ACGCCGGCGC GAAGATGTTC 
TGGGGCGGGC CGAGCCCGTG GGTCAAGGCA CCCGTGATTC CCGGCCACGA GTTCTTCGGC 
TACGTCGAGG CGCTGGGCGA GGGCGCGGCC GAGCACTTCG GCGTCGCGCT CGGCGATCGC 
GTGATCGCCG AGCAGATCGT GCCGTGCGGC ACGTGCCGCT ATTGCAAGTC GGGCCAGTAC 
TGGATGTGCG AGGTCCATCA CATCTTCGGC TTTCAGCGCG AGGTCGCCGA CGGCGGGATG 
GCCGAGTACA TGCGCATACC GTCGGGCGCG ATCGTCCACC CGGTCCCGCT CGGCATCTCG 
CTCGAGGACG CGGCGATCAT CGAGCCGCTC GCGTGCGCGA TCCACACGGT CAATCGCGGC 
GACATCCAGC TCGACGACGT CGTCGTGATC GCGGGCGCGG GCCCGCTCGG CCTGATGATG 
ACGCAGGTCG CGAAGCTGAA GACGCCCAGG CGGCTCGTCG TCGTCGATCC CGTCGAAGCG 
CGGCGCGCGC TCGCGCGCGC ATACGGCGCC GACGTGACGA TCGATCCGGC CCGCGAGGAC 
GCGCCCGCGA TCGTGCGCGC GCTGACGGGG GGCTACGGCT GCGACGTCTA CATCGAGACG 
ACCGGCGTGC CGGCGGGCGT CACGCAGGGC ATGGCGCTGA TCCGCAAGCT CGGCCGCTTC 
GTCGAGTTCT CGGTGTTCGG CAAGGATACG GCGCTCGACT GGTCGATCAT CGGCGATCGC 
AAGGAGCTCG ATGTGCGCGG CGCGCATCTC GGCCCGTATT GCTATCCTGT CGCGATCGAT 
CTGCTCGCGC GCGGGCTCGT CACGTCGAAG GGCATCGTCA CGCACGGCTT CTCGCTCGAC 
GAATGGGACG AGGCGATCCG GGTCGCGAAC TCGCTCGACT CGATCAAGGT GCTGATGAAG 
CCGCGCGGCT GA

Protein sequence

MTNRNDETQQ MTAIVCHAPE DYRVERVAKP RANARELVIR IGACGICASD CKCHAGAKMF 
WGGPSPWVKA PVIPGHEFFG YVEALGEGAA EHFGVALGDR VIAEQIVPCG TCRYCKSGQY 
WMCEVHHIFG FQREVADGGM AEYMRIPSGA IVHPVPLGIS LEDAAIIEPL ACAIHTVNRG 
DIQLDDVVVI AGAGPLGLMM TQVAKLKTPR RLVVVDPVEA RRALARAYGA DVTIDPARED 
APAIVRALTG GYGCDVYIET TGVPAGVTQG MALIRKLGRF VEFSVFGKDT ALDWSIIGDR 
KELDVRGAHL GPYCYPVAID LLARGLVTSK GIVTHGFSLD EWDEAIRVAN SLDSIKVLMK 
PRG