Gene BURPS1106A_1878 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1878
Symbol
ID	4899974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	1835273
End bp	1836319
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	70%
IMG OID	640135108
Product	ABC transporter substrate binding protein
Protein accession	YP_001066143
Protein GI	126452998
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.314195
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACGCG CATCGTCTCT CGGCCGACGC TCGCTCTCGC TTACCGCCGC GCTGGCCGTG 
CTGGTCGCGG CGCTCGCCGC CGCATCGTTG GTCGCCGCGC CCGCGGCGCG CGCCGAAGGG 
CGCATTCGGG TCGCCGAGCA GTTCGGCATC GTCTACCTGC TGCTGAACGT CGCGCGCGAT 
CGGCATCTGA TCGAGCAGGC GGGACGCGCC GAGGGCATCG CGATCGATGT CGACTGGGTC 
AAGCTCTCGG GCGGCGCGGC GATCAACGAT GCGCTCCTGT CCGGCTCGAT CGACATCGCG 
GGCGCGGGCG TCGGGCCGCT CCTGACGATC TGGGACCGCA CGCGCGGCCG GCAGAACGTG 
AAGGGTGTCG CGTCGCTCGG CAATTTGCCG TATTACCTCG TCAGCAACGA TCCGCGCGTG 
AAGACGATCG CCGATTTCAC CGCGCGCGAG CGCATCGCGG TGCCGGCGGT GACGGTATCG 
GTGCAATCGC GCCTGCTGCA GTTCGCGGCC GCCCAGCGTT GGGGCGATCG TGCGTACGAC 
CGGCTCGACA AGCTGACGCA GGCCGTCGCG CACCCGGACG CGGCGGCCGC GATCATCGCG 
GGCCGCACCG AGCTCACCGC GCACTTCGGC AATCCGCCGT TCCAGGAGCA GGAACTCGCG 
GCCAATCCGA ACGCGCACAT CGTGCTGAGT TCGTACGACG TGCTCGGCGG GCCGAGCTCG 
GCGACGGTGC TGTACGCGAC CGAGCGATTC CGCCGCGACA ATCCGAAGAC CTACCGCGCG 
TTCGTCGCCG CGCTCGGGCA GGCGGCGCGC TATGTGCAGA CGAACCCGGA GGGCGCGGTC 
GACGCGTATC TGCGCGTGAA CGGCTCGAAG GCCGATCGCG CGCTGCTGCT GAAAATCGTC 
AGGAATCCGC AGGTGCAGTT CAGGATCGCG CCGCAGAACA CGTTCGCGCT CGCGGCGTTC 
ATGCACCGCG TCGGCGCGAT CCGCCACGAG CCGAAGACGT GGCGCGACTA TTTCTTCGAC 
GATCCGGCGA CCGCGCAGGG CAGTTGA

Protein sequence

MTRASSLGRR SLSLTAALAV LVAALAAASL VAAPAARAEG RIRVAEQFGI VYLLLNVARD 
RHLIEQAGRA EGIAIDVDWV KLSGGAAIND ALLSGSIDIA GAGVGPLLTI WDRTRGRQNV 
KGVASLGNLP YYLVSNDPRV KTIADFTARE RIAVPAVTVS VQSRLLQFAA AQRWGDRAYD 
RLDKLTQAVA HPDAAAAIIA GRTELTAHFG NPPFQEQELA ANPNAHIVLS SYDVLGGPSS 
ATVLYATERF RRDNPKTYRA FVAALGQAAR YVQTNPEGAV DAYLRVNGSK ADRALLLKIV 
RNPQVQFRIA PQNTFALAAF MHRVGAIRHE PKTWRDYFFD DPATAQGS