Gene Bcep18194_B1552 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_B1552
Symbol
ID	3753317
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007511
Strand	+
Start bp	1750684
End bp	1752375
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	67%
IMG OID	637766401
Product	extracellular solute-binding protein
Protein accession	YP_372310
Protein GI	78062402
COG category	[R] General function prediction only
COG ID	[COG4533] ABC-type uncharacterized transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.851364
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACTGA TCGACCAGTT TCATCGGCTT GGCGAGTTTC TCGACGAGCA GGGCGGCCAG 
CCCGGGTTGC CGGCGCTTGC GCGGGCATTG AACTGCACCG AGCGCAACGT GCGGAGCCTG 
CTGCGCAAGA TGGAGGCGCA AGGGTGGTTG CGGTGGGAGG CGGCGCGTGG CCGCGGCCAC 
TTCTCGAAGC TGACGATGCT GGTTGCCCCG CAGCATGCGG TGCTCGATCG CCTGTCCTGC 
CTGCTGGCGG ACGGTGAACT GGAGCAGGCG TTCGCGAGCC TCGGCGATGA GCAGCGCCAG 
CAATTGTTGA AGCGGCTTCC GGATTTCCTC GGAATCCATC CGGCCGGCTC TCACGGCCAT 
CGCTTGCGCA TTCCCCTCTA TCGGGCGGTG GACGAACTCG ATCCCTATCG GGTGATCAGC 
CGGCTGGAGG CCCATCTGGT GCGGCAGATA TTTTCACGAC TGACCGAATT CGACAGGCAC 
ACGCAGCGCG TCAGGCCGGC GCTGGCGCAT CACTGGGAGC CGGAAGAGGC AGGGCGGGTC 
TGGCACTTCT GGCTCAGGCC GAACGTCCGT TTCCACGATG GCAGGCTTCT GGAGCCGGAA 
GATGTGCGGT ACACCCTGCT GCGCATGCGC GACGAGCCGA GCCATTTCCA GCGCCTGTAC 
CGGCATCTGC TCGACGTGGA AATCGGCGAA GGGCGGCGGA TCGTATGTCG TCTCGGCGAC 
GTCGATCATC TCTGGCCGCA GCGCGTCGCG GCGGCCAACG CGTCGATCGT GCCACGCCGC 
CGGAACGCCG ACTTTGCGCG CATGCCGGTC GGCACGGGGC CGTTCAGGCT GACGCGCCAC 
AGCGACTACC GGATCACGTT GTCGGCATTC GGCGATCACT ATCGCGAGCG TGCGTTGCTC 
GACGAGCTGG ATCTCTGGTT CCTGCCATCG GCCGAGCAGC CGGACGGATT CGATCTCCGA 
TTCGGGTACT CCGCTTCTCA TGCGCCGGAG GAGAAGGGCA TCGTGCGCGT GCAGGCGGGC 
TGTACGTACC TGGTCTGCAA CGCCACGCGC GAAGCGTTCC GCGAGCGTGC CGACCGGCTG 
GCGCTGGCGG ATTGGCTCGC GCCAGCCCGC TTGTTCGGTC ACGACGATCC CGCGAGGCGG 
CCGGCGGCCG GGCTGCTGCC GGCGTGGCGG CATCGCGTCG CGACACCAGC CGCCGAACCC 
TTCGTGCCGC AATACACCGA GCTCACGCTG GTCACGGGGC AGACCGACGA TGAACGGGGC 
CTGGCCCGTG CAATCGAGGC CAGATTGCGC GACGCGAATA TCCGGCTGAG CGTGTTGGCG 
CTGCCTTATG CCGAGCTGAT CCGGCGCGAC TGGCGGGATT CGGCCGACCT GATGCTGGGC 
AGCGAGATCC TGCACGACGA CGAGGATTTC GGCTGCTTCG AATGGTTCGG GGCCGACAGC 
ATGTTCCGGC AATGGATGTC GGAACATGCC GCGCTCGAAC TGGACCGCCG GCTGCATGCG 
GTCCAGGCGC AAGCCGATCC GCGCGCGCGG ATGGCGGACT ATGAGGTCAT CGGCAAGGAA 
CTGGTCGATG CGGCGTGGTT GATCCCGATC TCGCACGAGC ACCAGCATGT CGAGCTGGCA 
TCGCATGTTG CCGGTGTCGA CGAGGCCGCG CCGCTGGGGT TCGTGTCGTT CGCCGAGCTG 
TGGGTGCGTT GA

Protein sequence

MRLIDQFHRL GEFLDEQGGQ PGLPALARAL NCTERNVRSL LRKMEAQGWL RWEAARGRGH 
FSKLTMLVAP QHAVLDRLSC LLADGELEQA FASLGDEQRQ QLLKRLPDFL GIHPAGSHGH 
RLRIPLYRAV DELDPYRVIS RLEAHLVRQI FSRLTEFDRH TQRVRPALAH HWEPEEAGRV 
WHFWLRPNVR FHDGRLLEPE DVRYTLLRMR DEPSHFQRLY RHLLDVEIGE GRRIVCRLGD 
VDHLWPQRVA AANASIVPRR RNADFARMPV GTGPFRLTRH SDYRITLSAF GDHYRERALL 
DELDLWFLPS AEQPDGFDLR FGYSASHAPE EKGIVRVQAG CTYLVCNATR EAFRERADRL 
ALADWLAPAR LFGHDDPARR PAAGLLPAWR HRVATPAAEP FVPQYTELTL VTGQTDDERG 
LARAIEARLR DANIRLSVLA LPYAELIRRD WRDSADLMLG SEILHDDEDF GCFEWFGADS 
MFRQWMSEHA ALELDRRLHA VQAQADPRAR MADYEVIGKE LVDAAWLIPI SHEHQHVELA 
SHVAGVDEAA PLGFVSFAEL WVR