Gene BURPS668_A1031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1031
Symbol
ID	4887539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	995649
End bp	996767
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	74%
IMG OID	640130971
Product	zinc-binding dehydrogenase family oxidoreductase
Protein accession	YP_001062030
Protein GI	126443569
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATCGAG CGATACCGCG CGCGGCGGGA TGGTCCGCGC CGGCGGCGCA GCGCTTGCCG 
TGCGCATGGG CGCGCGCCGT GGCCGGCGCA TCCGAGATCC GCGAGGCGCG GCGATCGCGC 
GAGCCCGCCG CGCCCGATGA GCAAGGAGCG TCGATGAAAG CTGCTGTCGT ACACCGCGCG 
GGCGAGCGCC CGACTTATGC CGAATTCGAG CCGCCGCGCG CGTTGCCCGG CCATCGCCTG 
ATCGACGTGA GCGCGTCCGC GTTGAGCCGG CTCGCGCAGG CGCGCGCGTC GGGCGCGCAT 
TATTCGTCGA CGGGCGGCTT TCCGTTCGTC GCGGGCGTCG ACGGCGTGGG GCGTCTGGAC 
GACGGACGGC GCGTGTACTT CTTCGGCCCG CCGGCGCCGT TCGGCGCGCT GGCCGAGCGT 
ACCCTCGTGC CAGCAGCGCA GTGCATCCCG TTGCCCGATT CGATCGACGA TGCGACGGCG 
GCGGCCATCG CGATTCCGGG CATGTCGTCG TGGGCGGCGT TGACCGAGCG CGCGCGGCTC 
GCCGCGGGCG AGACGGTGCT CGTGAACGGC GCGACGGGCG CGTCGGGGCG GCTCGCGGTG 
CGCATCGCGA AGCATCTCGG CGCCGCGAGC GTGATCGCGA CGGGGCGCAA CGCACACGCG 
CTCGATGCGC TGAGCTCCGC GGGCGCCGAC GCGACGATCT CGCTTGCGCA GGATGACGAA 
CAGGTGGCGC GCGCGTTCGA GGCGCACTTT CGCGCGGGCG TGGATGTCGT GCTCGATTAT 
CTGTGGGGCG CGAGTGCGCG CGCGGCCCTG CTCGCCGCGG CGAAGGCGCC GCAGCAGGCG 
CGCCCGGTGC GCTTCGTGCA GATCGGCACG ATCGGCGGTG CCGAACTGCC GTTGCCGGGC 
GCGGTGCTGC GCGCGAGCGC GATCACGCTG ATGGGCAGCG GGCTCGGCAG CATCGCGCTG 
CCGCGCCTGC TGAACGCGGC GAGGGCGGTG CTCGGCGCGG CGTGCGAGGC CCGGCTGCGG 
ATCGACACGC GAACCGTGCC GCTCGCGGAC GTCGACGCGC ATTGGGGCGA CACGGGCAGC 
ACGCTACGCC CGGTGTTCAC GATGCGCGCG CCGGGATGA

Protein sequence

MHRAIPRAAG WSAPAAQRLP CAWARAVAGA SEIREARRSR EPAAPDEQGA SMKAAVVHRA 
GERPTYAEFE PPRALPGHRL IDVSASALSR LAQARASGAH YSSTGGFPFV AGVDGVGRLD 
DGRRVYFFGP PAPFGALAER TLVPAAQCIP LPDSIDDATA AAIAIPGMSS WAALTERARL 
AAGETVLVNG ATGASGRLAV RIAKHLGAAS VIATGRNAHA LDALSSAGAD ATISLAQDDE 
QVARAFEAHF RAGVDVVLDY LWGASARAAL LAAAKAPQQA RPVRFVQIGT IGGAELPLPG 
AVLRASAITL MGSGLGSIAL PRLLNAARAV LGAACEARLR IDTRTVPLAD VDAHWGDTGS 
TLRPVFTMRA PG