Gene BURPS1710b_A0214 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A0214
Symbol
ID	3692175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	+
Start bp	323769
End bp	325139
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	68%
IMG OID	637730468
Product	L-arabinose ABC transporter, periplasmic L-arabinose-binding protein
Protein accession	YP_335373
Protein GI	76819353
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.532172
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTTTTCC CGCGACGCCC CGCCGCCTTC GACCTTCGCC CTTCGACCTT CGACCTTCGA 
CCTTCGACCT TCGACCTTCG ACCTCAGACT TCAGACCTTC GACGTCCGAC GTCCGACGTC 
GGACCTTCGA CCCCGACGCC CGACATCGGA CATCGGACAT CGGACATCGG ACATCGGACA 
TCCGGCATCC AAACTCGACA TCCGCCCCAC CCCTCGCCTC CCCACCGCCC GATCCCATTC 
TTTAGGAACC CCTCGCAATA TTTGGAAGCC CGCCGACGCG CCTCCTACAA TCAGCCGCAC 
GACATGCATG CCGTTGCGCG GCTCGCAAGG CCGCATCCAT ATCGAAAACG GAGCACGAAG 
GAGACGCTCA TGGGATTGCG CTGGCCCCAA GCCGCCCTCG TCTGCGCGAG CCTCGCCGCC 
GGTTTGTCGG CGGCGGCGCC CGCGCATGCG CAAGGCGCGG CCCCGGTGAA GATCGGCTTC 
GTCGTCAAGC AGCCCGACGA CCCGTGGTTT CAGGACGAAT GGCGCTTCGC CGAGCAGGCG 
GCGAAGGACA AGCACTTCAC GCTCGTGAAG ATCGCCGCGC CGAGCGGCGA GAAGGTGTCG 
ACCGCGCTCG ACAGCCTCGC CGCGCAAAAG GCGCAGGGTG TGATCATCTG CGCGCCCGAC 
GTGAAGCTCG GCCCCGGCAT CGCCGCGAAG GCGAGGCGCT ACGGGATGAA GCTGATGTCG 
GTCGACGATC AGCTCGTCGA CGGGCGCGGC GCGCCGCTCG CCGACGTGCC GCACATGGGC 
ATTTCCGCAT ACCGGATCGG CCGGCAGGTC GGCGACGCGA TCGCCGCCGA GGCGAAGCGG 
CGCGGCTGGA ATCCGGCCGA GGTCGGCGTG CTGCGCCTCG CGTACGACCA GTTGCCGACC 
GCGCGCGAGC GCACGACGGG CGCGGTCGAT GCGCTGAAGG CCGCGGGCTT CGCGGCGGCG 
AACGTCGTCG ACGCGCCGGA GATGACGGCC GATACCGAAG GCGCGTTCAA CGCCGCGAAC 
ATCGCGTTCA CCAAGCATCG GAACTTCAAG CACTGGGTGG CGTTCGGATC GAATGACGAC 
ACGACGGTCG GCGCGGTGCG CGCGGGCGAG GGGCGCGGCA TCGGGGCGGA CGACATGATC 
GCGGTCGGCA TCAACGGCAG CCAGGTCGCG CTGAACGAAT TCGCGAAACC GAAGCCGACG 
GGCTTTTTCG GCTCGATCCT GCTGAATCCG CGGCTGCACG GCTACGACAC GTCGGTCAAC 
ATGTACGACT GGATCACGCA GAACCGCGCG CCGCCGCCGG TCGTGCTGAC GTCCGGCACG 
CTGATCACGC GCGCGAACGA AAAGACGGCG CGCGCGCAGC TCGGGCTGTG A

Protein sequence

MLFPRRPAAF DLRPSTFDLR PSTFDLRPQT SDLRRPTSDV GPSTPTPDIG HRTSDIGHRT 
SGIQTRHPPH PSPPHRPIPF FRNPSQYLEA RRRASYNQPH DMHAVARLAR PHPYRKRSTK 
ETLMGLRWPQ AALVCASLAA GLSAAAPAHA QGAAPVKIGF VVKQPDDPWF QDEWRFAEQA 
AKDKHFTLVK IAAPSGEKVS TALDSLAAQK AQGVIICAPD VKLGPGIAAK ARRYGMKLMS 
VDDQLVDGRG APLADVPHMG ISAYRIGRQV GDAIAAEAKR RGWNPAEVGV LRLAYDQLPT 
ARERTTGAVD ALKAAGFAAA NVVDAPEMTA DTEGAFNAAN IAFTKHRNFK HWVAFGSNDD 
TTVGAVRAGE GRGIGADDMI AVGINGSQVA LNEFAKPKPT GFFGSILLNP RLHGYDTSVN 
MYDWITQNRA PPPVVLTSGT LITRANEKTA RAQLGL