Gene BURPS668_2051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2051
Symbol
ID	4883765
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	2041597
End bp	2042640
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	68%
IMG OID	640127979
Product	hypothetical protein
Protein accession	YP_001059086
Protein GI	126440868
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGGCGA CCGTTGACGA AGACGACATC GGCACGGCGA GCGGCCGCGA CGAAGGCGAC 
TGGGTGCCCA ACCGGTTTTG CTTGCGCAAC GCCTGGTTTC CCCTCGCGCA TACCTTCGAA 
ATCGGCGAGC GCGCGTCGCG CTGGCAGATC TACTCGCAGC CGTGCTATCT GTGGCGCGCA 
CGCGGGCGCA TCCATGCATC GCGCCGGCAT CCGGACCTGC CCGCCGCCCC CGCCATGCCC 
GCCGCGCCGG ACTCGCCGTT CGAGCCGCCC GAACGCTATC CGGTGGTCGA GCGATTCGGC 
TACGTATGGA TCTGGTACGG CGACCCGGAG CGCGCGAGCG ACGCGCTCGT GCCCGACGTG 
CCGTTCCTGC CGCGCGAAGG GGGGCTGCCC GAGCGCATGC AGGGCAACAT CCGGCTCGAC 
TGCTGCACGC CGCTGCTCGT CGAGAACCTG CTCGACCTGA CGCACGCGGA CTATCTGCAC 
GCGAACCTGC TCGGCGACGA GCAATCCGAA GAGGATCGCG TCGACGTGCG GTTCACGTCC 
GAGACGGTGA CGATGATCCG GCAGTGCACG AACAAATCGA TCGCGCCGAT CATGCGCTGG 
TTCGGCGGCG TGCGCGCGAA GTATCAGGAC GTTCACGTCG TGATCCACGT GCATGTGCGC 
AGCTCCGTCG CGGTCGCGTA CGGACGCTAC ATGCCGGGCA TCGATCTGCC GATCTTCCAC 
CCGTGCGTGC CGGAATCGCG CGACCGGTGC CGGCTCAGCT TCGCGTTGAA CATGACGCGA 
ACGCCGTGGC TGCTGCGCGC GCTGATGCCG CTCACGCCTT ACATCGTGCT GCCGCAGGAC 
AATCGCATGA TCGGCCCGCA AAGCACCCGC TACCGGGATG CCGGCGAGCG CCGCGATCTG 
TATTCGCGCT TCGACCGCGC GGGGCTGCGG TATCGGCTCC TGCTGCAGCA GCTCGCCCGG 
CGGCAGCGCG ACGGCGATTT CTCGTACGCC CCCGATGCGC TGCCCGGCCA GGACGCGCGC 
GGCATTCTCG GCATGCCGGA CTAG

Protein sequence

MMATVDEDDI GTASGRDEGD WVPNRFCLRN AWFPLAHTFE IGERASRWQI YSQPCYLWRA 
RGRIHASRRH PDLPAAPAMP AAPDSPFEPP ERYPVVERFG YVWIWYGDPE RASDALVPDV 
PFLPREGGLP ERMQGNIRLD CCTPLLVENL LDLTHADYLH ANLLGDEQSE EDRVDVRFTS 
ETVTMIRQCT NKSIAPIMRW FGGVRAKYQD VHVVIHVHVR SSVAVAYGRY MPGIDLPIFH 
PCVPESRDRC RLSFALNMTR TPWLLRALMP LTPYIVLPQD NRMIGPQSTR YRDAGERRDL 
YSRFDRAGLR YRLLLQQLAR RQRDGDFSYA PDALPGQDAR GILGMPD