Gene BURPS1106A_2326 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2326
Symbol
ID	4900383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	2301943
End bp	2302941
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	72%
IMG OID	640135555
Product	zinc-binding dehydrogenase family oxidoreductase
Protein accession	YP_001066590
Protein GI	126454508
COG category	[R] General function prediction only
COG ID	[COG2130] Putative NADP-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0803814
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACAGG TCAACCGGCG GGTGCTGCTC GTGTCGCGCC CCGAACGCGA GGCGCGCGTC 
GAGAACTTCG AACTCGTCGA GACGCCGCTT GCGCCGCTCG CCGTAGGCGA GGTGCGCGTG 
CGCAATCATT TTCTGTCGAT CGATCCGTAC ATGCGCGGGC GGATGAACGC GGGGCGCTCG 
TACGCCGAGC CGCAACCGCT CGGCGAGGTG ATGGGCGGCG GCACCGCCGG CGAGGTCGTC 
GAGTCGCGCA ATCCGGCGTT CGCCCCCGGC GATCGCGTGA TCGGCGCGTA CGGCTGGCAG 
GAGTACGGCA CGTCGGCGGG CAAGGAACTG CGCAAGGTCG ACACGACGCG CGTGCCGCTG 
TCCGCGTATC TCGGAGCCGC CGGAATGCCC GGCGTGACCG CGTGGTACGG CCTGAACCGG 
ATCATCCGGC CGCGCGCGGG CGAGACGCTC GTCGTCAGCG CGGCGAGCGG CGCGGTCGGC 
AGCGTGGTCG GGCAGCTCGC GAAGCTCGCC GGGTGTCGCG CGGTCGGCAT CGCGGGCGGC 
GCGGACAAGT GCCGCTACGT CGTCGATACG CTCGGCTTCG ATGCGTGCGT CGACTACAAG 
GCGGGCCGGC TCGCCGACGA TCTCGCGGCC GCCGCGCCGG ACGGCGTCGA CGGCTGTTTC 
GAGAACGTCG GCGGCGCGGT GCTCGATGCG ACGCTCGCGC GGATGAACCC GTTCGGGCGC 
ATCGCGATGT GCGGGATGAT CGCCGCGTAC GACGGCGCGC CCGCGCCGCT CGCGAACCCG 
GCGCTGATCC TGCGCGAGCG GCTGCTCGTG CAGGGCTTCA TCGTGTCCGA GCACTTCGAC 
GTGTGGCCCG AGGCGCTCGC GCAGCTCGCG TCGCTCGTCG CGAACAGGCA GCTGCATTAT 
CGGGAGACGA TCGCGCAGGG CCTCGAGCGC GCGCCCGACG CGCTGCTCGG GCTGCTGAAA 
GGGCGCAATT TCGGCAAGCA GCTCGTCGCG CTCGTCTGA

Protein sequence

MSQVNRRVLL VSRPEREARV ENFELVETPL APLAVGEVRV RNHFLSIDPY MRGRMNAGRS 
YAEPQPLGEV MGGGTAGEVV ESRNPAFAPG DRVIGAYGWQ EYGTSAGKEL RKVDTTRVPL 
SAYLGAAGMP GVTAWYGLNR IIRPRAGETL VVSAASGAVG SVVGQLAKLA GCRAVGIAGG 
ADKCRYVVDT LGFDACVDYK AGRLADDLAA AAPDGVDGCF ENVGGAVLDA TLARMNPFGR 
IAMCGMIAAY DGAPAPLANP ALILRERLLV QGFIVSEHFD VWPEALAQLA SLVANRQLHY 
RETIAQGLER APDALLGLLK GRNFGKQLVA LV