Gene BURPS1106A_3048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3048
Symbol
ID	4899418
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	2977346
End bp	2978464
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	66%
IMG OID	640136274
Product	carbohydrate ABC transporter ATP-binding protein
Protein accession	YP_001067287
Protein GI	126454160
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.061373
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAGCC TTTCCATCCG TGACGTGTAC AAGACCTACC CGAACGGCGT GCCCGTCCTG 
AAGGGCGTCG ACATCGACAT CGAGGACGGT CAGTTCCTGA TTCTCGTCGG CGGCTCGGGC 
TGCGGGAAGT CGACGCTGCT CAACATGATC GCGGGCCTCG AGACCGTGAC GAAGGGCGAG 
ATCCGGATCG GCGATAAGGT CGTCAACGAT CTGTCGCCGA AGGATCGCGA CATCGCGATG 
GTGTTCCAGT CGTACGCGCT CTATCCGTCG ATGACGGTGC GCGAGAACAT CTCGTTCGGG 
CTGAACATCC GCAAGGTGCC GAAGAACGAG CAGAAGCAGA TCGTCGATCG CGTCGCCGCG 
ATGCTGCAGA TCGAGCACCT GCTCGAGCGC AAGCCGGGGC AGCTCTCGGG CGGCCAGCGG 
CAGCGCGTCG CGATGGGCCG CGCGCTCGCG CGCGACCCGG CGCTGTTCCT GTTCGACGAG 
CCGCTGTCGA ACCTCGACGC GAAGTTGCGC ATCGAGATGC GCGCCGAGAT CAAGCTCTTG 
CATCAGCGCC TCGGCACGAC GATCGTCTAC GTGACGCACG ACCAGATCGA GGCGATGACG 
CTCGGCGACC GGATCGCGGT GATGAAGGAC GGTGTCGTTC AGCAGTTCGG CGCGCCGCAG 
GACATCTACG ATTCGCCGTC GAACCTGTTC GTCGCCGGCT TCATCGGCGC GCCGCCGATG 
AACTTCATCA ACGGCAAGCT CGTCGAGCAG GGCAGCGGCG TGGGCATCGA GCTCGATACG 
GGCGCGATGC GCGGCGTGCT GAACCTGCCG TTCGACGCGA AGCGGATGAA CGGCCACGTC 
GGCCGCGACG TGATCCTCGG CCTGCGGCCG GAGCGGATCA CCGATGCGCG TAGCGCGCAC 
AACGGCGAGG GCGCGCGCCT GCAGCCCGTC GACGTGACGG TCGACGTGAC CGAGCCGACG 
GGCCCCGACA CGCACGTGTT CGCCCAGGTC AACGGCAAGC GGATCGTGAG CCGCGTGCAT 
CCGGCCGCGA ACCCGCAGCC GCAGCAGAAG CTGTCGCTGT TGTTCGACGT ATCGAAGGCG 
GTGCTGTTCG ATCCGTCGAC GGAGGCGCGG ATCGCGTGA

Protein sequence

MASLSIRDVY KTYPNGVPVL KGVDIDIEDG QFLILVGGSG CGKSTLLNMI AGLETVTKGE 
IRIGDKVVND LSPKDRDIAM VFQSYALYPS MTVRENISFG LNIRKVPKNE QKQIVDRVAA 
MLQIEHLLER KPGQLSGGQR QRVAMGRALA RDPALFLFDE PLSNLDAKLR IEMRAEIKLL 
HQRLGTTIVY VTHDQIEAMT LGDRIAVMKD GVVQQFGAPQ DIYDSPSNLF VAGFIGAPPM 
NFINGKLVEQ GSGVGIELDT GAMRGVLNLP FDAKRMNGHV GRDVILGLRP ERITDARSAH 
NGEGARLQPV DVTVDVTEPT GPDTHVFAQV NGKRIVSRVH PAANPQPQQK LSLLFDVSKA 
VLFDPSTEAR IA