Gene Bphy_4149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bphy_4149
Symbol
ID	6245677
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia phymatum STM815
Kingdom	Bacteria
Replicon accession	NC_010623
Strand	+
Start bp	1139220
End bp	1140185
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	59%
IMG OID	642595909
Product	aliphatic sulfonate ABC transporter periplasmic ligand-binding protein
Protein accession	YP_001860316
Protein GI	186472974
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence [TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0138672
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCAAC ATCGCATGTT CACACGCCGA ACCTTCCTGG CAGGAACCGG CGCACTCCTG 
GCCTCGACCG CGTTTTCTTC ATTCGCCGAT AGCCGTGCAA AAGAAATTCG CATCGGATAT 
CAAAAGGCCG CAAGCACACT GGTGCTTTTG AAGGCACATG GAACGCTCGA AAAGCGCTTC 
GCCGCTCAGG GCGTCAGTGT GAAATGGACG GAATTTCCTG CTGGTCCGCA GTTGCTTGAA 
GGACTGAATG TCGGTTCGGT CGACTTCGGT TACGTTGGGG AGGCGCCTCC CGTCATCGCG 
CAAGCCGCTG GCGCCAATTT CGTGTACACC GCGTATGAAA TTCCAACGCC GCAAGCCGAA 
GGCATTCTTG TCCATCGCGA CGCACCGATT CAATCCGTTG CGGACCTGAA GGGGAAGCGC 
GTAGCGTTTA ACAAGGGCTC CGACGTTCAT TGGTTTCTCG TCGCCGCGTT ACAGAAAGCC 
GGCGTGAGCT ACCCCGATAT TCAGCCCGTT TTTCTGCCGC CCGCCGATGC GCGGGCGGCG 
TTCGAGCGCG GGGCAATCGA TGCATGGGCC ATTTGGGATC CGTTCCTCGA AGCAGCAAAG 
CGGCAATCGA ACGCGAGACT TTTGACCGAC GGTACGGGCA TCGTCAATCA CCACCAGTTC 
TTTCTCAGCG CGCGCTCTTT CGCGCAGCAA AACCGGGGGC TGCTCGATGC CGTCGTTACC 
GAAGTCGGGA AGGAAGGCGC GTGGGTTCGT GGACACTACG CAGAGGCGGC GGCACAGCTC 
GCGCCGATTC AGGGGCTCGA CGCGAATGTC ATCGAAGCGG GCCTGCGACA CTATGCTCAT 
GTCTACAAGC CGATCGATGC GGGTGTGCTG GCTGAACAGC AAAAGATCGC CGATGCGTTC 
ACTGAGCTTC GCATCATTCC GACGAAGATC GTGACGAAGG AAGCGGTGCT CGACGCGAAG 
GCTTGA

Protein sequence

MSQHRMFTRR TFLAGTGALL ASTAFSSFAD SRAKEIRIGY QKAASTLVLL KAHGTLEKRF 
AAQGVSVKWT EFPAGPQLLE GLNVGSVDFG YVGEAPPVIA QAAGANFVYT AYEIPTPQAE 
GILVHRDAPI QSVADLKGKR VAFNKGSDVH WFLVAALQKA GVSYPDIQPV FLPPADARAA 
FERGAIDAWA IWDPFLEAAK RQSNARLLTD GTGIVNHHQF FLSARSFAQQ NRGLLDAVVT 
EVGKEGAWVR GHYAEAAAQL APIQGLDANV IEAGLRHYAH VYKPIDAGVL AEQQKIADAF 
TELRIIPTKI VTKEAVLDAK A