Gene BURPS1106A_A1821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1821
Symbol
ID	4905007
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	1788072
End bp	1789061
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	69%
IMG OID	640144927
Product	putative serine O-acetyltransferase
Protein accession	YP_001075855
Protein GI	126457462
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1045] Serine acetyltransferase
TIGRFAM ID	[TIGR01172] serine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCGGTAT TCGACATCGA CGACATCGTT CAATCGCTTC AAACCGTGCG CCAGCGTTGG 
CGCGAAGTGC AGCGCCGCTC GCTCGAGCCG GGCGGGCGCG AATTGCCGGC GCGCGAGGCG 
CTTGCCGGCA TCGTCGAGAC GTTCAAGGGC GTGCTGTTTC CGATGCGCCT CGGGCCGCCC 
GATCTTCGGC AGGAGAGTGA AAATTTCTAT GTGAGCCACG CGCTCGACGA CGCATTGCAT 
GCGCTTCTCG CGCAGGCTCG GCTCGAATTG CGCTACAAGG GCCGACACGA TGCCGCCGCG 
CCCGCCGAAG CCGCGATCGA CGCGAAAGCC GATGCGGCGG TGCGCGCGTT CGCCGCGCGC 
CTGCCCGATA TCCGCGCGCT GCTCGACAGC GACGTGCTGG CCGCGTTTCA CGGCGATCCG 
GCCGCGGGCA GCGTCGACGA GGTGCTGCTT TGCTACCCCG GCGTGCTGGC GATGATCCAT 
CACCGGCTCG CGCACGCGCT GTATCGCCTC GAATTGCCGC TGCTCGCGCG CATCGTCGCC 
GAGCATGCGC ATGCGCAGAC GGGGATCGAC ATTCATCCCG GCGCGCAGAT CGGCGGCGGA 
TTCTTCATCG ATCACGGCAC GGGCGTCGTG ATCGGCGAGA CCGCGGTGAT CGGCGAGCGC 
GTGCGCGTCT ATCAGGCGGT CACGCTCGGC GCGAAGCGCT TTCCGAGGGA CGCGTCCGGG 
CATCTCGAAA AGGGACTCGC GCGCCACCCG ATCGTCGAGG ACGATGTCGT CGTCTATGCG 
GGCGCGACGA TTCTCGGCCG CGTGACGATC GGCAAGGGCG CGGTGATCGG CGGCAACGTG 
TGGATCACGC AGGACATCCC GCCCGGCAGC CATGTCACGC AAGCCGTCAC GCGCAGCGAT 
CCGGCGCGGC CGGCCGACGC GGCCGCCTCG TCGCCGCGGC CGGCCGGCGC GCACGACGCG 
ACGCTTTCTG CCGCGCAGGC GCTGCGATGA

Protein sequence

MAVFDIDDIV QSLQTVRQRW REVQRRSLEP GGRELPAREA LAGIVETFKG VLFPMRLGPP 
DLRQESENFY VSHALDDALH ALLAQARLEL RYKGRHDAAA PAEAAIDAKA DAAVRAFAAR 
LPDIRALLDS DVLAAFHGDP AAGSVDEVLL CYPGVLAMIH HRLAHALYRL ELPLLARIVA 
EHAHAQTGID IHPGAQIGGG FFIDHGTGVV IGETAVIGER VRVYQAVTLG AKRFPRDASG 
HLEKGLARHP IVEDDVVVYA GATILGRVTI GKGAVIGGNV WITQDIPPGS HVTQAVTRSD 
PARPADAAAS SPRPAGAHDA TLSAAQALR