Gene Bcep18194_A4685 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_A4685
Symbol
ID	3749890
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007510
Strand	-
Start bp	1679536
End bp	1680525
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	68%
IMG OID	637762979
Product	ABC transporter, substrate-binding protein, aliphatic sulphonates
Protein accession	YP_368924
Protein GI	78066155
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00029583
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.149517
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTCGA TGAACCGCCG CACATTTGCG CGCGTGATGC TGGCCGCCGG CCTGACTGCC 
GCCGGCGTCC GAACGCACGC CGAGAACGCA CCCGAGGTAT TGCGCATCGG CTACCAGAAG 
TCGTCGACGC TCATCACACT GCTCAAGACG CGCGGCGCGC TCGAGCAGGC ACTGGCACCG 
CTCGGCCTGC GCGTGTCGTG GCATGAATTC GCGAGCGGAT TGCCGCTGAC CGAAGCGCTC 
AACGTCGGCG CCGTCGATTT CAGTGCCGAC GTGGCCGATA CGGTTCCGGT CTTCGCGCAA 
GCCGCACGCG CGCGTTTCGT CTACGTCGCG CAGGAGGCGC CTTCGCCGAA GGCACAGGCG 
ATCGTCGTCA AGCAGGACAG CGCGCTGCGC ACGCTCGCCG ATCTCAAGGG CAAGCGCATT 
GCGGTCACGA AGGCGGCCGG CAGTCATTAC CTGCTGCTTG CCGCGCTCGC ACGCGCGAAG 
CTCGGGCCGG CCGATGCGGC GATCCACTAC CTGACACCCG CGGACGGCCG CGCGGCGTTC 
GAGCGTGGCA GCGTGGACGC CTGGATCACG TGGGACCCCT ATGTCGCGTC GGTCGACCGG 
AATCCCGACG TGCGAATTCT GGCCGACGGC AACGGACTCG CGTCGTATCA GCGCTACTAC 
CTCGCATCCA GCAGTTTCGC CGCCGCGCGG CCCGACGTCG TCCAGATCGT GTTCGACCAG 
CTGTCGCAGG CCGGCGCATG GCTGCGCGAT CACCCGCAGG AGGCCGCGAA TACGCTCGCG 
CCGATCTGGG GGCTCGACGC GGCGACGATC GCGCGCGCAA ACGCACGGCG CAGCTATGTC 
GTTCGTGCTG TGGTCGCGCA AAACTTCGGC GAACAGCAGA AGATCGCCGA CACGTTCCTC 
GCAGCCGGGC TACTGCCTGC CCGCGTCGAC ACGAGCCAGG CGCAGCGCTG GAATTTCGTT 
GCGAAACGTG CTGATCCGGT CGGCGCGTGA

Protein sequence

MTSMNRRTFA RVMLAAGLTA AGVRTHAENA PEVLRIGYQK SSTLITLLKT RGALEQALAP 
LGLRVSWHEF ASGLPLTEAL NVGAVDFSAD VADTVPVFAQ AARARFVYVA QEAPSPKAQA 
IVVKQDSALR TLADLKGKRI AVTKAAGSHY LLLAALARAK LGPADAAIHY LTPADGRAAF 
ERGSVDAWIT WDPYVASVDR NPDVRILADG NGLASYQRYY LASSSFAAAR PDVVQIVFDQ 
LSQAGAWLRD HPQEAANTLA PIWGLDAATI ARANARRSYV VRAVVAQNFG EQQKIADTFL 
AAGLLPARVD TSQAQRWNFV AKRADPVGA