Gene BURPS668_A0459 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A0459
Symbol
ID	4888048
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	419751
End bp	420887
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	69%
IMG OID	640130400
Product	zinc-binding dehydrogenase family oxidoreductase
Protein accession	YP_001061465
Protein GI	126442691
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.479531
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCACAGA CAGCCGAAGC GCCGCCGCAA CGCGCGGCCG AGCGCGGCGA GACGCCCGCG 
CTGCCCGCCA CGATGCGCGC CGTGGTTTGC CACGGCCCGC GAGACTACCG CCTCGAGCAG 
GTGCCGGTGC CGAAGCCGGG GCCGGACGAG ATCCTGACCC AGGTGGAGCG CGTGGGCATC 
TGCATGGGCG ACATCAAGAC GTTTCGCGGC GCGCCGTCGT TCTGGGGCGA CGCGGTGCAG 
CCGCGCTACG TGAAGCCGCC GATGATTCCC GGCCACGAAT TCGTGTGTCG CGTCGTCGCG 
CTCGGCCCCG GCGCCGAGCG GCGCGGCGTG AAGGCGGGCG ATCGCGTGAT CTCCGAGCAG 
ATCGTGCCGT GCTGGAGCTG CCGCTTCTGC GGCCACGGCC AGTACTGGAT GTGCCAGAAG 
CACGATCTGT ACGGATTCCA GAACAACGTG CACGGCGCGA TGGCCGAATA CATGATCTTC 
ACGAAGGAGG CGATCGTGCA CCGCGTGCCC GATTCGATCC CGACCGACGA GGCGATCCTG 
ATCGAGCCGC TGTCGTGCTC GCTGCACGCG GCCGATCGCG CGAACGTCGG CTTCGACGAC 
GTGGTCGTCG TCGCCGGCGC GGGCACGCTC GGGCTCGGCA TCATCGGCGC GGTGCGGCTG 
CGCCATCCGA AGCAGCTGAT CGTGCTCGAC ATGAAGCCCG AGCGCGCGGC GCTCGCGCGC 
CGGATGGGCG CGGACGACGT GTGGAACCCG GCCGAGGAGA ACGTGATCGA GAAGATCCGC 
GCGATCACGG GCGGCTACGG CTGCGATATC TACATCGAGG CGACCGGCCA CCATCGCGCG 
GTAGGCCAGG GGCTCGCGAT GCTGCGCAAG CTCGGGCGCT TCGTCGAGTT CAGCGTGTTC 
AACGACGAAG CGAGCGTCGA CTGGTCGATC ATCGGCGATC GCAAGGAGCT CGACGTGCTC 
GGCTCGCATC TCGGCCCGTA CATGTACCCG CGCGCGATCG AGTTCATCGC ATCGCGCAGG 
ATCGACGTGC GCGGCATCGT CACGCACACG TTCCCGCTGT CGCGCTTCGC CGACGCGTTC 
GCCGTGATGG AGCGCGGCGA GCAATCGTTG AAGGTCGTTC TGGATCCGCG AGGTTAA

Protein sequence

MPQTAEAPPQ RAAERGETPA LPATMRAVVC HGPRDYRLEQ VPVPKPGPDE ILTQVERVGI 
CMGDIKTFRG APSFWGDAVQ PRYVKPPMIP GHEFVCRVVA LGPGAERRGV KAGDRVISEQ 
IVPCWSCRFC GHGQYWMCQK HDLYGFQNNV HGAMAEYMIF TKEAIVHRVP DSIPTDEAIL 
IEPLSCSLHA ADRANVGFDD VVVVAGAGTL GLGIIGAVRL RHPKQLIVLD MKPERAALAR 
RMGADDVWNP AEENVIEKIR AITGGYGCDI YIEATGHHRA VGQGLAMLRK LGRFVEFSVF 
NDEASVDWSI IGDRKELDVL GSHLGPYMYP RAIEFIASRR IDVRGIVTHT FPLSRFADAF 
AVMERGEQSL KVVLDPRG