Gene BURPS1106A_A1426 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1426
Symbol
ID	4904347
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	1390276
End bp	1391286
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	70%
IMG OID	640144532
Product	putative carbohydrate ABC transporter, periplasmic sugar-binding protein
Protein accession	YP_001075460
Protein GI	126457631
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.134002
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGTTCG CCGTCGCGCT CGCGATCGGC GCCGCCCCCG CTTGCGCGTC GTCCGCCGCC 
GGCGCTGCGC CGCCCGGGCC GCGCGCGGGC CATGCGCCGC TGTCGCTCGC CGGCAAGCGG 
ATCGGCATCA CGGCGGCCGG CACCGATCAC TACTGGGATC TGCAGGCGTA CCAGGGCGCG 
GTAGACGAAG TGAAGCGCCT CGGCGGCACG CCGATCGCGC TCGACGCCGG CCGCAACGAC 
AGCCGCCAGA TCGCGCAGAT CCAGACGCTG ATCGCGCAAC AGCCCGATGC GATCATCGAG 
CAGCTCGGCA CCGCATCCGT GCTCGAGCCG TGGCTCAGGA AAATCCGGCA AGCGGGCATC 
CCGCTTTTCA CGATCGACAC CGCGTCGCCG TCGAGCCTGA ACGTCGTCAC GTCGGACAAT 
TTCGCGATCG GCTCGCAGCT CGCGCTGAAG CTCGTCAACG ATATCCGCGG CGAAGGCAAC 
GTCCTCGTGT TCAACGGCTT CTACGGCGTG CCCGTGTGCG CGATCCGCTA CGACCAGCTG 
AAAGCCGTGC TGAAGTGGTA TCCGAAGGTG AAGATCATCG AGCCCGAGCT GCGCGACGTG 
ATTCCGAACA CGGCGCAGAA CGCGTACGCG CAGATCAGCC AGTTGCTGCA GAAGTATCCG 
AAAGGCACGA TCTCGGCGAT CTGGGCCGCG TGGGACATTC CGCAGGTCGG CGCGACGCAG 
GCGGTCGACG CGGCCGGCCG ACGCGAGATC CGCACGTACG CGGTGGACGG CAGCCCCGAG 
GCGGTCGCGC TCGTGAGGAA TCCGACCTCG AGCGCGGCGG CCGTCGTCGC GCAGCAGCCG 
GCGCTGATCG GCCGCACCGC CGTGCGCAAC GTCGCGCGCT ATCTGGCGGG CGACCGATCG 
CTGCCCGCGT ACACGTTCGT GCCGTCGGTG CTCGTCACGA AGGACGACGC GGGTGTCGCG 
CGGCCTGCGC TCGGGCAGAC GCCGGCCGCC GCCGGGCTCG CGCGGCGATG A

Protein sequence

MLFAVALAIG AAPACASSAA GAAPPGPRAG HAPLSLAGKR IGITAAGTDH YWDLQAYQGA 
VDEVKRLGGT PIALDAGRND SRQIAQIQTL IAQQPDAIIE QLGTASVLEP WLRKIRQAGI 
PLFTIDTASP SSLNVVTSDN FAIGSQLALK LVNDIRGEGN VLVFNGFYGV PVCAIRYDQL 
KAVLKWYPKV KIIEPELRDV IPNTAQNAYA QISQLLQKYP KGTISAIWAA WDIPQVGATQ 
AVDAAGRREI RTYAVDGSPE AVALVRNPTS SAAAVVAQQP ALIGRTAVRN VARYLAGDRS 
LPAYTFVPSV LVTKDDAGVA RPALGQTPAA AGLARR