Gene BURPS668_3578 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3578
Symbol
ID	4883420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	3507079
End bp	3508059
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	73%
IMG OID	640129506
Product	glycerophosphoryl diester phosphodiesterase family protein
Protein accession	YP_001060583
Protein GI	126441964
COG category	[C] Energy production and conversion
COG ID	[COG0584] Glycerophosphoryl diester phosphodiesterase
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.448018
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCAAC TGATCGACAC CCTCGGACGG CGCGCGGTGC TCATCGGCGT CGCGCTCGGC 
CTGGCCGCCT GCGCGGGCGG CGGCGGCCCG CCGGGCGAGG CGCCGGCGAC GCTGCCGCGC 
ATCGTCGCGC ATCGCGGCGG CGCGGCCGAT GCGCCGGAGA ACACACTCGA TGCGATCCGG 
GCGGCGGTCG CGAATCGGGC GGACGCGATT TGGCTGACCG TCCAACTGAG CCGCGACGGC 
GTGCCGGTGC TGTATCGGCC CGCCGATCTA TCGGCGCTCA CGCGCTCGAG CGGCCCGGTC 
GCCGGCCACA CGGCCGCGCA GCTCGCGCAG ATGAACGCCG GCTGGCAATT CCGCGATGCG 
GGCGGGCGGT ATCCGTATCG CGCGCGCCCG GTCGGCATTC CGACGTTGCG CGACGCGCTG 
CGCGCGATTC CGCCCGCGAT GCCGATCGTG CTCGACATGA AGGCGGTGCC CGCCGCGCCG 
CAGGCGAAGG CCGTCGCGGA CGTGCTGACG AGCGAGGCCG CGTGGCCGCG CGTGACGATC 
TATTCGACCG ATGCCGCTTA TCAGACCGCG TTCGCCTCGT ATCCGCAGGC ACGGCTCTTC 
GAATCGCGCG ATGCGACGCG CGGGCGGCTC GTCGACGTGC TGCTCGGCGG CGCGTGCGAA 
CGCGCGCCCG AGGCGCCTGC GACGGCGCCC ATATGGACCG GCTTCGAAAT GCATCGAAAC 
ATGACGGTGA GCGAGCGCTT CACGCTCGGC GAAGGCGTAT CGCCCGTGAA GGCGACGTTG 
TGGACGCCCG CGACCGTCGC GTGCTTCAGG CGGCGCGCGG ACGTGCGGAT TCTCGCGATC 
GCGGTGAACG ACGCCGACGA TTACCGCATG GCCGCGTGCC TCGGGCTCGA TGCGGTGCTC 
GCGGATTCGC CGCGCGAGAT GGCGGAAATC CGGTCGGCGC TGCGGGCGCG GCCGTTGCGG 
TGCGAGACGG GGGCGCGATA G

Protein sequence

MNQLIDTLGR RAVLIGVALG LAACAGGGGP PGEAPATLPR IVAHRGGAAD APENTLDAIR 
AAVANRADAI WLTVQLSRDG VPVLYRPADL SALTRSSGPV AGHTAAQLAQ MNAGWQFRDA 
GGRYPYRARP VGIPTLRDAL RAIPPAMPIV LDMKAVPAAP QAKAVADVLT SEAAWPRVTI 
YSTDAAYQTA FASYPQARLF ESRDATRGRL VDVLLGGACE RAPEAPATAP IWTGFEMHRN 
MTVSERFTLG EGVSPVKATL WTPATVACFR RRADVRILAI AVNDADDYRM AACLGLDAVL 
ADSPREMAEI RSALRARPLR CETGAR