Gene Bcep18194_B1152 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_B1152
Symbol
ID	3752917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007511
Strand	-
Start bp	1294575
End bp	1295555
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	67%
IMG OID	637766001
Product	ABC transporter, substrate-binding protein, aliphatic sulphonates
Protein accession	YP_371910
Protein GI	78062002
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.107849
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.542589
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCGTT TTACCCGCTG GATCGCCCGC ACCGCCGCCG TCACGCTCGT CGCGCTGTCC 
GCCACGCCGG CCTTCGCGCA AGGCGCCGCC GACAAGGTCG TGCGCATCGG CTACCAGAAA 
GCCGGCCTGC TGTCGGTCAT CAAGGCGCAA GGTTCGCTCG AAGCGCGGCT CAAGCCGCTC 
GGCTATGGCG TGCAGTGGTT CGAATTCCCG GCCGGCCCGC AACTGCTCGA GGCGCTGAAC 
GCGAACAGCA TCGACTTCGG CTATACGGGT GCGCCGCCGC CCGTGTTCGC GCAGGCGGCC 
GGCGTGCACT TCGTCTATGT CGGCGCGGAA CCGCCGGCAC CGCACAACGA AGCCGTGGTC 
GTGAAGGCCG ATTCGCCGAT CCGCTCGGTC GCCGGCTTGC GCGGCAAGAA GATCGCGTTG 
CAGAAGGGCT CGAGCGCGAA CTACCTGCTG CTCGAAGCAC TGAAGAAAGC CGGCGTGCGC 
TACGACGAAA TCCGCCCGGT GTACCTTGCG CCGGCCGACG CGCGCGCCGC GTTCGAGAGC 
GGCAACGTCG ATGCCTGGGT CGTCTGGGAT CCGTACTATG CAGCCGCGCA AAACGCGCTG 
AAGGTGCGCA CGCTGTCCGA CTACACGGGC CTCGCGGCGA CCAACAACTT CTACGAAGCG 
ACGCGAGACT TCGCGCAGCA GCATCCCGAC GTGGTCGGCG CGATCCTGAA GCAGGCGCGC 
GAGACGGGCC AGTGGGTCAA CACGCATCCG GCCGACACGG CCGCGCTGAT CGCACCGAAG 
GTCGGCCTGC CGCAGCCGCT CGTCGAAACG TGGATCAAGC GTGTCCCGTT CGGCGCGGTG 
CCGCTCGACG ACAAGATCGT CGCGGCCCAG CAAGGTGTCG CCGATGCGTT TTATGCAGCG 
AAGCTAATTC CGCAGAAGCT GAGCGTGGCC GACAACGCAT GGGTCGACAA AAGTGGGGCG 
AGTGCGCTCG CGGCGAAATA G

Protein sequence

MIRFTRWIAR TAAVTLVALS ATPAFAQGAA DKVVRIGYQK AGLLSVIKAQ GSLEARLKPL 
GYGVQWFEFP AGPQLLEALN ANSIDFGYTG APPPVFAQAA GVHFVYVGAE PPAPHNEAVV 
VKADSPIRSV AGLRGKKIAL QKGSSANYLL LEALKKAGVR YDEIRPVYLA PADARAAFES 
GNVDAWVVWD PYYAAAQNAL KVRTLSDYTG LAATNNFYEA TRDFAQQHPD VVGAILKQAR 
ETGQWVNTHP ADTAALIAPK VGLPQPLVET WIKRVPFGAV PLDDKIVAAQ QGVADAFYAA 
KLIPQKLSVA DNAWVDKSGA SALAAK