Gene BURPS1106A_3835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3835
Symbol
ID	4900789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	3735596
End bp	3736873
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	70%
IMG OID	640137061
Product	GDSL-like lipase/acylhydrolase domain-containing protein
Protein accession	YP_001068056
Protein GI	126454674
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2755] Lysophospholipase L1 and related esterases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00947114
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGTCCC GACGCTGGCT TTCCGCTCTT TCGTGCTGTC TCGCTTTGGC TGCATCGCAA 
CCGGGGAGTG CCGCGCAAGC CGATGCGCCG GCGCGCTGGG TCGCGTCCTG GGCAACCGCA 
CTGCAGCCGA TCCCGGATCT TGCCGCGCTG CCGCCGTTGT ATCGCGCGCC GGAGGTCGCG 
GGGCGCACGG TCCGCCAGAT CGTCTATCCG ACGCTCGCGG GCAAGGCGGT TCGCATCCGC 
GTAAGCAATG CGTACGGCAA GACGCCGCTC GCGATCGGCG AGATGAACAT CGGCCGGTCG 
GCGGGCGGTG CGGCGGTTGC TGCGGGCAGC TCGACGGCGG TGACTTTCGG CGGCCGTCGC 
GAAACGGAAG TGCCGCCGGG GCAGGAGCGG GACAGCGATC CCGTCGCGTA CGACGTGAGG 
GCCGGCGAGC CGTACGCGCT CAGCCTGTAC CTGGGAAGCC GCCAGACGAT GACGGTCTGG 
CACCGCGTAT CGAATCAGGT CAATTACGTG TCGGCGCCGG GTAACCACAC GGGCGACGCC 
TCACCCGACG CGTTTCGCAC GCGCTTCACG CAATCCGCCT GGATCGCCGA GTTGGCGGTG 
GCGGCGCGGC AGCCGGGCGC GGCGGCGATC GCGGCCGTCG GCGATTCGAT CACCGATGGC 
CTGCGCTCGA GCCTGAACCG CAATCGCCGC TGGCCGGATG CGCTGGCGGC CCGGCTCGAG 
CGCGCGGGCG CAGGCGACAT CGGCGTGGCG AATCTCGGCA TCAGCGGCAA TCGGCTGCTG 
AGCGACTCGC GCTGCTACGG CATCGCGCTT GAGCGCCGCT TCGAGCGTGA CGTGCTGACG 
CGCGCGGGCG TGAAGGTCGC GGTGCTGCTG ATTGGCATCA ACGACATCAA TTTCGCTGCG 
ATGCCCGCCC GGTCCGGGCT CGACTGTGAT GCGCCGCATA CGCGGGTCGA CGCGCAAGCG 
TTGATCGCGG GCTACCGCCG CGTGATCGCG GCTGCGCACG CGCGAGGCGT TGCGGTATTC 
GGCGCGACGC TGACGCCGGC GTCGCTGCCG CCGGCGCGCG AAGCGATCCG TCGCGAAGTC 
AACGAATGGA TTCGAACCTC GGGCGCCTTC GACGGCGTCG TGGATTTCGA CGCCGCGCTG 
CGCGATCCGG CTAAGCCGTC GACATTGCTG CGTCGCTATA ACAGTGGCGA CGACATCCAC 
CCGAGCGACG CCGGCTATGC GGCGATGGCC GAGGCGGTGC CGCTGGAGCG ACTGGCGGCG 
GCGGCCGGGC GCCGCTGA

Protein sequence

MTSRRWLSAL SCCLALAASQ PGSAAQADAP ARWVASWATA LQPIPDLAAL PPLYRAPEVA 
GRTVRQIVYP TLAGKAVRIR VSNAYGKTPL AIGEMNIGRS AGGAAVAAGS STAVTFGGRR 
ETEVPPGQER DSDPVAYDVR AGEPYALSLY LGSRQTMTVW HRVSNQVNYV SAPGNHTGDA 
SPDAFRTRFT QSAWIAELAV AARQPGAAAI AAVGDSITDG LRSSLNRNRR WPDALAARLE 
RAGAGDIGVA NLGISGNRLL SDSRCYGIAL ERRFERDVLT RAGVKVAVLL IGINDINFAA 
MPARSGLDCD APHTRVDAQA LIAGYRRVIA AAHARGVAVF GATLTPASLP PAREAIRREV 
NEWIRTSGAF DGVVDFDAAL RDPAKPSTLL RRYNSGDDIH PSDAGYAAMA EAVPLERLAA 
AAGRR