Gene BURPS668_3067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3067
Symbol
ID	4883823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	3008433
End bp	3009740
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	64%
IMG OID	640128995
Product	putative amino acid ABC transporter, periplasmic amino acid-binding protein
Protein accession	YP_001060079
Protein GI	126438928
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID	[TIGR03407] urea ABC transporter, urea binding protein

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.656729
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGTC GCAGTCTTTT GAAGTTCGGA TCGATGGCAG GCGTCATGGC GCTCGCGGGG 
CAAAGCCCCG TCGCGCGCGC GGCGGATTCG GGCAAAGGCC CGATCAAGGT CGGCATCCTG 
CATTCGCTGT CGGGCACGAT GGCGATCTCC GAGACTTCGC TCAAGGACAC CGCGCTGATG 
ACGATCGCCG ACATCAACAA GAACGGCGGC GTGCTCGGGC GGCCGCTGCA GCCCGTCGTC 
GTCGATCCCG CGTCGAACTG GCCGCTGTTC GCCGAGAAGG CGCGCCAGTT GCTCACGCAG 
GAGAAGGTCG CATGCGTGTT CGGCTGCTGG ACGTCGGTGT CGCGCAAGTC GGTGCTGCCC 
GTGTTCGAGG AGCTGAACGG CCTGCTCTAC TACCCGGTGC AGTACGAGGG CGAGGAGATG 
TCGCGCAACG TGTTCTACAC GGGCGCCGCG CCGAACCAGC AGGCGATTCC GGCCGTCGAG 
TACATGATGA GCGCCGAAGG CGGCGGCGCG AAGCGCTTCT TCCTGCTCGG CACCGATTAC 
GTCTACCCGC GCACGACCAA CAAGATCCTG CGCGCGTTCC TGAAATCGAA GGGCGTGAAA 
GATTCCGATA TTCAGGAAGT CTACACACCG TTCGGGCACA GCGATTACCA GACGATCGTC 
GCGAACATCA AGACCTTCGC GCAAGGCGGC AAGACCACCG TGATCTCGAC GATCAACGGC 
GATTCGAACG TGCCGTTCTA CAAGGAGCTC GGCAATCAGG GGCTCAAGGC GACCGACGTG 
CCCGTCGTCG CGTTCTCGGT CGGCGAGGAG GAACTGCGCG GCATCGACAC GAAGCCGCTC 
GTCGGGCATC TGGCCGCGTG GAATTACTTC ATGTCGGTGA AGGGGCCGGC GAACGCGAAG 
TTCAAGGAGC AGTTCGCCGC GTGGGTGAAG TCGCAGAATC TGCCGGGCGG CGCGAAGCGC 
GTGACCAACG ATCCGATGGA GGCGACGTTC GTCGGCATCC ACATGTGGAA GCAGGCGGTC 
GAGAAGGCGA AGAGCACCGA TGTCGACCGC GTGCGCACGG CGATGATCGG CCAGAGCGTC 
GCCGCGCCGT CGGGCTTCAC ACTGACGATG GACGGCAACC ATCATCTGCA CAAGCCGGTG 
ATGATCGGCG AGATTCGCGG CGACGGCCAG TTCAACGTCG TCTGGAAAAC GAAGACGGCG 
ATTCGCGCGC AGCCGTGGAG CCCGTTCATC GCGGGCAACC AGGGCAAGCC GGACGTGGTC 
GGCTCGATTC CGGAGTTCCT GCGCCGCCGT CGCGCCGCGC TCGCCTGA

Protein sequence

MKRRSLLKFG SMAGVMALAG QSPVARAADS GKGPIKVGIL HSLSGTMAIS ETSLKDTALM 
TIADINKNGG VLGRPLQPVV VDPASNWPLF AEKARQLLTQ EKVACVFGCW TSVSRKSVLP 
VFEELNGLLY YPVQYEGEEM SRNVFYTGAA PNQQAIPAVE YMMSAEGGGA KRFFLLGTDY 
VYPRTTNKIL RAFLKSKGVK DSDIQEVYTP FGHSDYQTIV ANIKTFAQGG KTTVISTING 
DSNVPFYKEL GNQGLKATDV PVVAFSVGEE ELRGIDTKPL VGHLAAWNYF MSVKGPANAK 
FKEQFAAWVK SQNLPGGAKR VTNDPMEATF VGIHMWKQAV EKAKSTDVDR VRTAMIGQSV 
AAPSGFTLTM DGNHHLHKPV MIGEIRGDGQ FNVVWKTKTA IRAQPWSPFI AGNQGKPDVV 
GSIPEFLRRR RAALA