Gene BamMC406_5092 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BamMC406_5092
Symbol
ID	6181515
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia ambifaria MC40-6
Kingdom	Bacteria
Replicon accession	NC_010552
Strand	-
Start bp	2259876
End bp	2261045
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	66%
IMG OID	641684844
Product	glycine betaine/L-proline ABC transporter, ATPase subunit
Protein accession	YP_001811754
Protein GI	172064103
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4175] ABC-type proline/glycine betaine transport system, ATPase component
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.571422
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGCCC CCAAGGTCGT GGTCGAAGGT CTGTGCAAGG TATTTGGAAG TAACCCGCAG 
CAGGCGCTCG ACATGCTCGC CGCCGGTGCA ACGAAAGACG ATGTGCTCAA GCGTACCGGT 
CAGGTCGTCG GCGTGCACAA CGTATCGTTC GACGTGCAGG AAGGCGAAAT ATTCGTGCTG 
ATGGGCCTGT CCGGCTCCGG CAAATCCACG TTGATCCGCC TCGTGAACCG GCTGGTCGAT 
CCCAGCGCCG GCAAGGTGCT GATCGACGGG CTCGACGTTG CGTCGGCACG CCGCTCGGAG 
CTGACCGCGC TGCGCCGCAA GGACATGAGC ATGGTGTTCC AGTCGTTCGC GCTGATGCCG 
CATCGCACCG TGGTGTCGAA CGCCGCGTTC GGCCTCGAGG TCGGCGGCGT CGGCAAGAAG 
GAGCGCGAAC GCCGGGCAAT GGACGTGCTC GAGCAGGTCG GTCTCGCACC GTTCGCACAC 
AAGCTGCCGT CCGAGCTGTC GGGCGGGATG CAGCAGCGCG TCGGCCTGGC CCGCGCGCTC 
GCCGTGAACC CGTCGCTGAT GATCATGGAC GAGGCGTTCT CCGCGCTCGA TCCGCTCAAG 
CGCCGCGAGA TGCAGGACGT GCTGCTGCAA CTGCAGAAGG AACAGCGCCG CACGATCATG 
TTCGTGTCGC ACGATCTGGA AGAGGCGCTG CGCATCGGCA ACCGCATCGC GATCATGGAA 
GGCGGCCGGC TCGTGCAGGT CGGCACGCCG CAGGACATCA TCGCGAACCC GGCCGACGAC 
TACGTGCGCG CATTCTTCGA CGGCATCGAC ACCAGCCGCT ACCTCACCGC CGGCGACCTG 
ATGCAGACGG GCGCCGTGCC GACCATGTCG AAGTTCGATG CGGCGAACGT CGCGGCGACG 
CTGAACGGCA GCGCCGAATA CGCGTTCGTG CTCGACGCCG CACGCAAGAT CCGCGGCTTC 
GTCACGCGCG ATGCGCTCGG TCAGGCCACG CCGTCCGTGC GGCCGATCGA AAGCATCCGG 
CGCGACGCGA CGCTCGATCA TGTCGTCGCG CGCGTGGTCG CAAGCCCGAA TGCACTGCCC 
GTCGTCGACG ACGACGGCTG TTACTGCGGT TCGGTCGACC GCGCACTCAT CCTGAAAGCC 
ATCACGCGTT CGCGAGGTTC CCATGTCTGA

Protein sequence

MDAPKVVVEG LCKVFGSNPQ QALDMLAAGA TKDDVLKRTG QVVGVHNVSF DVQEGEIFVL 
MGLSGSGKST LIRLVNRLVD PSAGKVLIDG LDVASARRSE LTALRRKDMS MVFQSFALMP 
HRTVVSNAAF GLEVGGVGKK ERERRAMDVL EQVGLAPFAH KLPSELSGGM QQRVGLARAL 
AVNPSLMIMD EAFSALDPLK RREMQDVLLQ LQKEQRRTIM FVSHDLEEAL RIGNRIAIME 
GGRLVQVGTP QDIIANPADD YVRAFFDGID TSRYLTAGDL MQTGAVPTMS KFDAANVAAT 
LNGSAEYAFV LDAARKIRGF VTRDALGQAT PSVRPIESIR RDATLDHVVA RVVASPNALP 
VVDDDGCYCG SVDRALILKA ITRSRGSHV