Gene Bcep18194_A4739 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_A4739
Symbol
ID	3749947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007510
Strand	+
Start bp	1729710
End bp	1730747
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	65%
IMG OID	637763036
Product	thiosulphate-binding protein
Protein accession	YP_368978
Protein GI	78066209
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0623695
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCAAGC GCAACACGGG GCTGGTGGGC GGAGTGGGCC GCCTGATCGC AACACTCGCG 
CTGGGCGCGG CGGCGGCGCT GGGCGTCGCG ACGCACGCGC AGGCCGATAC GACCTTCCTG 
AACGTGTCGT ACGACCCGAC GCGCGAGCTG TATCAGGACT TCAACCAGGC GTTTGGCAAG 
GAGTGGAAGG CGAAGACGGG CGAGACCGTC AACTTCAAGC AGTCGCACGG CGGTTCGGGC 
GCGCAGGCGC GCTCGGTGCT CGACGGCCTG CAGGCCGACG TCGTCACGCT GGCGCTGGCG 
TACGACATCG ACGCGCTCGC GAACAAGGGG CTCGTCAACA AGGACTGGCA GAAGCGCCTG 
CCCGACAACG CGTCGCCGTA CACGTCGACG ATCGTGTTCC TGGTGCGCAA GGGCAATCCG 
AAGGGGATCA AGGACTGGGA CGACCTGACC AAGCCGGGCA TCTCGATCGT CACGCCGAAT 
CCGAAGACGT CGGGCGGCGC GCGCTGGAAC TACCTGGCCG CATGGGCATA CGCGGTGCAC 
AAGCCGGGCG GCAACGAGCA GACGGCGAAG GAATTCGTCA CGAAGCTCTA CAAGAACGCA 
GGCGTGCTCG ATTCGGGCGC GCGCGGCGCG ACCACGAGCT TCGTGCAGCG CGGGATTGGC 
GACGTGCTGA TCGCCTGGGA AAACGAGGCA TTCCTGTCGG TCAAGGAATT CGGTACCGAC 
AAGTTCGAGA TCGTCGTGCC GTCGGTGAGC ATCCTGGCCG AGCCGCCCGT CGCGGTGGTG 
GACAAGGTGG TCGACAAGAA GGGTACGCGC AAGCTGGCCG ATGCCTACCT GAACTTCCTG 
TACAGCCCGC AGGGCCAGGA GATCGCGGCG CGCAACTACT ACCGGCCGCG CTCGAAAAAC 
GTGCCGGCGG AGCTGACGAA GCAGTTCCCG AAGCTGAAGC TGTACACGGT CGACGATACC 
TTCGGCGGCT GGACGAATGC GCAGAAGACG CATTTCGCGG ACGGCGGCGT GTTCGATTCG 
ATCTACAAGC CGCAGTAA

Protein sequence

MGKRNTGLVG GVGRLIATLA LGAAAALGVA THAQADTTFL NVSYDPTREL YQDFNQAFGK 
EWKAKTGETV NFKQSHGGSG AQARSVLDGL QADVVTLALA YDIDALANKG LVNKDWQKRL 
PDNASPYTST IVFLVRKGNP KGIKDWDDLT KPGISIVTPN PKTSGGARWN YLAAWAYAVH 
KPGGNEQTAK EFVTKLYKNA GVLDSGARGA TTSFVQRGIG DVLIAWENEA FLSVKEFGTD 
KFEIVVPSVS ILAEPPVAVV DKVVDKKGTR KLADAYLNFL YSPQGQEIAA RNYYRPRSKN 
VPAELTKQFP KLKLYTVDDT FGGWTNAQKT HFADGGVFDS IYKPQ