Gene BURPS668_A2097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2097
Symbol
ID	4887514
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	2036147
End bp	2037178
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	70%
IMG OID	640132035
Product	putative dehydrogenase
Protein accession	YP_001063092
Protein GI	126445481
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGAGCG TCGTCGTCGA CCAGCCGCAT AGCATGGGCG TGCGCGAAAT GCCCACGCCC 
GAGCCCGCCG CGGGCGAAGT GCGCGTGCGC GTGCGCTATG CGGGCATCTG CGGATCGGAT 
CTGCACATCT TCCACGGCAA GAACCCGTTC GTCTCGTATC CGCGCGTCAT CGGGCACGAG 
TTCGTCGGGC GAATCGAATC GGTCGGCGCG GGCGTCGACG CGTCGCGCAT CGGCGAGATC 
GTCGCAGTCG ACCCGGTCAT CAGTTGCGGG CGCTGCCACG CATGCGCGAT CGGCCGGCGC 
AACGTGTGCC GCAGCCTGAC CGTGCTCGGC GTGCATCGCG ACGGCGGCTT CAGCGAGTAC 
GCCTGCGTGC CCGCCGCGAA CGCCCACCGG ATTGCGCCCG AGATCGCCGA CACGTGCGCT 
GCGATCGTCG AGCCGTTCGC GGTCGCCGCG AACGCGACCG CGCGCACCGG CGTGCTGCCG 
TCCGACGTCG CGCTGATCTA CGGCGCGGGC ACCGTCGGCC TCACGCTGCT GCAAGTGCTC 
AAGCACGTCT ACGGCATTCG CGCGTTCATC GCCGATCGCC TCGACGAGCG TCTCGCGCTC 
GCGCGCAAGT GCGGCGCGGC GGCCGACGAA GTCATCCACG CGGCAACGGA AACGGTGCCG 
GACGCGCTCG AGCGACGCGG CGTCGACGGC GGCCCGACGC TGATCTTCGA CGCGGTGTGC 
CATCCGTCGA TCCTCGAGGA GGCGGTGCGG CTCGCGGCGC CCGCCGCGCG CATCGGTGTG 
CTCGGCTTCT CGTCGGAGCC GTCGTCGATC GTGCAGGCCG AGCTGACGAA GAAGGAATTG 
ACGCTGTGCG CGTCGCGCCT GAACTGCGCG ATGTTCCCGC AGGTCATCGA ATGGATCGCC 
GACGGGCGCG TGCATCCGGA GCACATCGTC ACGCACACGC TCGATTTTCG CGATGTCGCG 
CGCGCGTTCG AGCTCGCCGA GCGCAACCCG CGCGAAAGCT GCAAGATCCT GCTGGATTTC 
GCCGCGCATT GA

Protein sequence

MLSVVVDQPH SMGVREMPTP EPAAGEVRVR VRYAGICGSD LHIFHGKNPF VSYPRVIGHE 
FVGRIESVGA GVDASRIGEI VAVDPVISCG RCHACAIGRR NVCRSLTVLG VHRDGGFSEY 
ACVPAANAHR IAPEIADTCA AIVEPFAVAA NATARTGVLP SDVALIYGAG TVGLTLLQVL 
KHVYGIRAFI ADRLDERLAL ARKCGAAADE VIHAATETVP DALERRGVDG GPTLIFDAVC 
HPSILEEAVR LAAPAARIGV LGFSSEPSSI VQAELTKKEL TLCASRLNCA MFPQVIEWIA 
DGRVHPEHIV THTLDFRDVA RAFELAERNP RESCKILLDF AAH