Gene BURPS1106A_0553 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0553
Symbol
ID	4901796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	520529
End bp	521536
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	74%
IMG OID	640133783
Product	SIS domain-containing protein
Protein accession	YP_001064836
Protein GI	126452572
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2222] Predicted phosphosugar isomerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.926392
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTAACG AGGCGCGCGA ATCGGCGCGC GTCGTCGCCG CGCAACTGGC GGACACGCGC 
CGCGTCGAGG CGCTCGCGCA GCACCTCGCC ACGCATGCGC CGCAAGTCGC GCTCACCGTC 
GCGCGCGGCA GCTCCGATCA CGCGGCGAGC TACTTCGCGA GCCTGACGAT GAGCCGCCTC 
GGCGTGCCCG TCGCGTCGCT GCCGATGTCG GTCGCCACGC TGCAGCAGGC GCCGCTGAAA 
GTGCGGGGCC AGCTCGCGCT CGCGTTCTCG CAATCGGGCA AGAGCCCGGA TCTCGTCAAC 
ACGATGGCCG CGCTGCGCGA GGCGGGCGCG CTGACGGTGG CCGCCGTCAA CGTGCTGCCG 
TCGCCGCTCG CGCACGCGTG CGAGCACCCG TTGCCGCTGC TCGCCGGCCC GGAGCTGTCG 
GTCGCCGCGA CGAAGAGCTA CATCGCGATG CTGTCGATTG CCGCGCAGCT CGTCGCGTTC 
TGGCAGCGCG ACGCCGCGCT CGCGTCCGCG CTGCGCGGCC TGCCCGACGC GCTCGAGCAG 
GCGGGCCGGC TCGACTGGTC GAGCGCCGTC GACGAACTGC GCGACGTCGA GCGGATGATC 
GTGATCGGCC GCGGGCTCGG TCTCGCGATC GCGCAGGAGG CGGCGCTCAA GCTGAAGGAG 
ACCTCGGGCA TCCAGGCCGA GGCGTTCTCG AGCGCCGAAG TGCGGCACGG CCCGATGGAG 
CTGATCGAGC GCGACTACCC GCTGCTCGTG TTCGCGCCGC CCGGGCCCGA GCAGGAGAGC 
CTGCTGCAGC TCGCGCGCGA CATGCGCGCG CGCGGCGCGC GCGTGCTGCT CGCCGCGCCG 
GCGGGTACGC CCGATGCGAC GCTGCCGCTC GCGCGCACCG CGCACGCGGC GCTCGATCCG 
ATCGCCGCGA TCCTCACGTT CTACGTGATG GCGGCCGGGC TCGCGCCCGC GCGCGGCCGC 
GATCCCGATG CGCCGCGCCA TCTGCACAAG ATCACCGAAA CACACTGA

Protein sequence

MLNEARESAR VVAAQLADTR RVEALAQHLA THAPQVALTV ARGSSDHAAS YFASLTMSRL 
GVPVASLPMS VATLQQAPLK VRGQLALAFS QSGKSPDLVN TMAALREAGA LTVAAVNVLP 
SPLAHACEHP LPLLAGPELS VAATKSYIAM LSIAAQLVAF WQRDAALASA LRGLPDALEQ 
AGRLDWSSAV DELRDVERMI VIGRGLGLAI AQEAALKLKE TSGIQAEAFS SAEVRHGPME 
LIERDYPLLV FAPPGPEQES LLQLARDMRA RGARVLLAAP AGTPDATLPL ARTAHAALDP 
IAAILTFYVM AAGLAPARGR DPDAPRHLHK ITETH