Gene BURPS668_A2843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2843
Symbol
ID	4886270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	2703800
End bp	2704972
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	67%
IMG OID	640132778
Product	Beta-glucosidase/6-phospho-beta- glucosidase/beta- galactosidase
Protein accession	YP_001063834
Protein GI	126444638
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.638259
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGTGA CACAATCCAT TAGTATTCCT ATCCATTACC CGGCCGCGAC GGCCGCATTG 
CTCTTGCTGC TGCTCACCGG TTGCGGCGGC GGCGGCGACC AGAGCAAGGT CAACGCCGCC 
GCCTCGCCCG CGAACAACCT CGTCGTGCCG GCGCCCGGCA CGGCGTCGCC CGGCACGCCC 
GCGCCCGCGC CCGCGCCCGG CGCGCCGGCG CCCGCCGAGA CGGCCTCGGT GCTGCCGTTC 
TTCGGCGTGA ACGGCCATTA CGTCGACGGC GGCGTCTACG CGTCGGTCCC GCTCGCCACG 
CAGGCAAGCC ACCTCGCCGG CCTCGGCATG AACGTCTACC GGCAGGACGT GTACATTCCG 
GATCACGTCG ACACGCTCGC GTCGACGGTC ATTCCCGGCC TCGGTTCCGG CATCACGGTC 
CTGCCGATGA TCCAGGCGCA TCCATGGGCC GATCCGTCGC TGAACGGCCA ACCGCCGACC 
GAAGCCAGCG CGTATGCGTA CGCCTACAAG CTGGCCGCCT ACGCGGCGAA GAAGCTCGCC 
GGCATTCCGA TGGTGGAGTT CGGCAACGAG TACGACATCG ATAGCCACAA CGCGCCGATC 
CAGGGCGACG GCATCAATGT TTCGGACTAC GACAATTCCA CGTTCCCCGT CTGGCGCGGC 
GCGCTCCGAG GCTCGCTCGA CGGCTGGCGC TCGGTCGACA CGAACCGCAC GACGAAGCTG 
ATCGCGAACG CAACGTCGGG GGCGCTGCAT TTCGGCTTCC TCGACGGCCT GATGACGGGC 
ACGCAGCCCG ACGGCACGAC CGGGCATCCG AAGATCACGC CCGACGTGAT CCAGTGGCAC 
TGGTATTCGA ACGGCGGCGA TTTCGAGAAC GCGCTCGGCA AGACCGGCCG ATACAACGTG 
CTTGCGCGGC TGAAGGACCG CTACAACCTG CCGATCGTCG TCACCGAGAT CGGCGTGAAC 
ACGGACAACT CCGACACGCA GATCGCCGCG TACATCGCAA AGACGATCCC CGAGCTGGTG 
GCGGCGAAAG CCGCGTACAA CGTCATCGGC TTCAACTGGT ATGAGCTTTA CGACGACCGC 
AGCGGCGCTT ACGGCTTGCT GACGAACAGC GCACAGGAAA AGCCCCGTTA CGGACTCATG 
CGCGCGGCGA TCGCCGGCGC CGTGCCGAAC TGA

Protein sequence

MSVTQSISIP IHYPAATAAL LLLLLTGCGG GGDQSKVNAA ASPANNLVVP APGTASPGTP 
APAPAPGAPA PAETASVLPF FGVNGHYVDG GVYASVPLAT QASHLAGLGM NVYRQDVYIP 
DHVDTLASTV IPGLGSGITV LPMIQAHPWA DPSLNGQPPT EASAYAYAYK LAAYAAKKLA 
GIPMVEFGNE YDIDSHNAPI QGDGINVSDY DNSTFPVWRG ALRGSLDGWR SVDTNRTTKL 
IANATSGALH FGFLDGLMTG TQPDGTTGHP KITPDVIQWH WYSNGGDFEN ALGKTGRYNV 
LARLKDRYNL PIVVTEIGVN TDNSDTQIAA YIAKTIPELV AAKAAYNVIG FNWYELYDDR 
SGAYGLLTNS AQEKPRYGLM RAAIAGAVPN