Gene BURPS1106A_A1226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1226
Symbol
ID	4906193
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	1162711
End bp	1163916
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	72%
IMG OID	640144332
Product	Ser/Thr protein phosphatase family protein
Protein accession	YP_001075261
Protein GI	126456022
COG category	[R] General function prediction only
COG ID	[COG1408] Predicted phosphohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.795007
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGACGCG TTTCATCGTT TCTGCTGCGC CTGACGATCA TCGGCGTGCT GCTGCACGTG 
TACGTCGGCT TCCGTCTGCT GCCCGAGCTC GCCTCGCCCG CCGCGCGCTA CGCGGGCGCG 
CTGTGGCTCG TCGGGTCGTG CCTGCTGATT CCGCTCGGCA TGCTGTCGCG CGTGTTCGAG 
CGGCAGCCGC TCGGCGATCG CGTCGCCTGG GCCGGCCTCC TCGCGATGGG CTTCTTCTCG 
TCGCTGCTCG TGCTCACGCT CGCGCGCGAC GTGCTGCTCG CCTCGCTCGT CACCGTCGAC 
GCGCTCGCGC CCGGCGCGGT GTCGCTCGCG CAGTGGCGGA TACAGACGGC GGCCGGCGTG 
CCGCTCGCGG CGCTCGCGGT GAGCGTCGTC GGCTTCGTCA ATGCGCGACG CCGCGCACGC 
GTCGTCGACG TCGCGGTGCC GATCGACGAT CTGCCCGCCG CGCTCGACGG CTTCACGATC 
GTGCAGATCA GCGACATCCA TGTCGGCCCG ACGATCAAGC GCGGCTACGT CGAGGCGATC 
GTCGACGCGG TCAACCGGCT CGCGCCGGAT CTCGTCGCGG TGACGGGTGA CGTCGTCGAC 
GGCACGGTCG CGCAACTGGC CGGCCATGCG GCGCCGCTCG GGCGGCTGCG CGCGCGCCAC 
GGCGCATTCG TCGTGACGGG CAACCACGAG TACTATTCGG GCGCCGACGA GTGGATCGCC 
GAGTTCCGCC GCCTCGGCCT CGACGTGCTG CTCAACGAGC ATCGGACGCT CGACCACGGC 
GACGGCCGGC TCGTGATCGC GGGCGTCACC GATTACTCGG CGGGCCACTT CGATCCCGCG 
CATCGGAGCG ACCCGAGCGC GGCGCTCGCC GGCGCGCCCG CCGACGTGCG CATCCGCGTG 
CTGCTCGCGC ACCAGCCGCG CAGCGCAACC GCCGCGGCCG ATGCGGGCTT CACGCTGCAA 
CTGTCCGGGC ACACGCACGG CGGCCAGTTT TTCCCGTGGA ATTTCTTCGT GCGATTGCAG 
CAGCCGTTCA CCGCCGGGCT CGCGCGACTC GACGGCCTGT GGGTCTATAC GAGCCGCGGC 
ACCGGTTACT GGGGGCCGCC GAAACGGCTC GGCGCGCCGT CGGAAATCAC GCGCGTGCGG 
CTCGTGCGCG GCGAAGGGAA CCGAACGCGC GCGCCGGCGT CCGTCACGCT GAACGCTGAA 
CGCTGA

Protein sequence

MRRVSSFLLR LTIIGVLLHV YVGFRLLPEL ASPAARYAGA LWLVGSCLLI PLGMLSRVFE 
RQPLGDRVAW AGLLAMGFFS SLLVLTLARD VLLASLVTVD ALAPGAVSLA QWRIQTAAGV 
PLAALAVSVV GFVNARRRAR VVDVAVPIDD LPAALDGFTI VQISDIHVGP TIKRGYVEAI 
VDAVNRLAPD LVAVTGDVVD GTVAQLAGHA APLGRLRARH GAFVVTGNHE YYSGADEWIA 
EFRRLGLDVL LNEHRTLDHG DGRLVIAGVT DYSAGHFDPA HRSDPSAALA GAPADVRIRV 
LLAHQPRSAT AAADAGFTLQ LSGHTHGGQF FPWNFFVRLQ QPFTAGLARL DGLWVYTSRG 
TGYWGPPKRL GAPSEITRVR LVRGEGNRTR APASVTLNAE R