Gene BURPS668_2042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2042
Symbol
ID	4883819
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	2034745
End bp	2035992
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	66%
IMG OID	640127971
Product	EutG protein
Protein accession	YP_001059078
Protein GI	126439344
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.17622
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCGTG CATTTTCGTT TCCCGGCATT ACGGGCGGAT CAACACGAGA CGCACCGACA 
CAACCAGGAG ACGACATGAG TAATCTGAGC AGCGCGGAGC GCACCGACAG CTTCTTCATT 
CCCTGCGTGA CCCTGATCGG CCCGGGCTGC GCGCGCGAGA CGGGCGCGCG CGCCAAATCG 
CTGGGCGCGA AAAAGGCGCT CATCGTGACC GACGCGGGCT TGCACAAGAT GGGGGTGTCC 
GAGATCGTCG CGGGCCATAT CCGCGAAGCG GGGCTTCAGG CCGCGATCTT TCCCGGCGCG 
CAGCCCAATC CGACCGACGT CAACGTTCAC GACGGCGTTG AACTCTATCG GCGGGAAGGG 
TGCGATTTCA TCGTGTCGCT CGGCGGCGGC TCGTCGCACG ACTGCGCGAA GGGCATCGGG 
CTCGTCACCG CCGGCGGCGG ACATATCCGC GACTACGAAG GCATCGACAA ATCGACGGTG 
CCGATGACGC CGTTGATTTC GATCAACACG ACGGCGGGCA CGGCGGCGGA GATGACGCGC 
TTTTGCATCA TCACGAATTC CAGCAATCAC GTGAAGATGG CGATCGTCGA CTGGCGTTGC 
ACGCCGCTCA TCGCGATCGA CGACCCGAGC CTGATGGTGG CGATGCCGCC CGCGCTGACG 
GCCGCAACCG GCATGGACGC GCTCACGCAC GCGGTGGAGG CCTACGTTTC CACCGCCGCG 
ACGCCGATCA CCGACGCCTG CGCCGAAAAG GCGATCGCGT TGATCGGCGA ATGGCTGCCG 
AAGGCCGTCG CGAACGGCGA ATCGATGCAG GCGCGCGCGG CGATGTGCTA CGCGCAGTAC 
CTCGCCGGGA TGGCGTTCAA CAATGCGTCG CTCGGCTATG TGCACGCGAT GGCGCACCAG 
CTCGGCGGGT TCTACAACCT TCCGCACGGG GTCTGCAACG CGATCCTGCT GCCGCACGTG 
TGCGAGTTCA ACCTGATCGC CGCGCCCGAG CGTTTCGCCG CCATCGCGCC GCTGCTCGGC 
GTCAGGACGG CGGGCATGAG CACCCCCGAT GCCGCCCGCG CCGCCATTGC GGCGATCCGC 
GCGCTCTCGG CGTCGATCGG CATCCCGTCG GGCCTGGCCG CGCTCGGCGT GAAGGCTGAA 
GACCATGAGG TGATGGCCGG CAACGCGCAG AAAGATGCGT GCATGCTGAC CAATCCGCGC 
AAGGCGACGC TCGCGCAGGT CATCGCGATC TTCGCGGCGG CGATGTGA

Protein sequence

MDRAFSFPGI TGGSTRDAPT QPGDDMSNLS SAERTDSFFI PCVTLIGPGC ARETGARAKS 
LGAKKALIVT DAGLHKMGVS EIVAGHIREA GLQAAIFPGA QPNPTDVNVH DGVELYRREG 
CDFIVSLGGG SSHDCAKGIG LVTAGGGHIR DYEGIDKSTV PMTPLISINT TAGTAAEMTR 
FCIITNSSNH VKMAIVDWRC TPLIAIDDPS LMVAMPPALT AATGMDALTH AVEAYVSTAA 
TPITDACAEK AIALIGEWLP KAVANGESMQ ARAAMCYAQY LAGMAFNNAS LGYVHAMAHQ 
LGGFYNLPHG VCNAILLPHV CEFNLIAAPE RFAAIAPLLG VRTAGMSTPD AARAAIAAIR 
ALSASIGIPS GLAALGVKAE DHEVMAGNAQ KDACMLTNPR KATLAQVIAI FAAAM