Gene BMASAVP1_A1967 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMASAVP1_A1967
Symbol
ID	4679254
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei SAVP1
Kingdom	Bacteria
Replicon accession	NC_008785
Strand	+
Start bp	1946544
End bp	1947737
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	73%
IMG OID	639846231
Product	major facilitator family transporter
Protein accession	YP_993284
Protein GI	121599325
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCATCA AGACATTGCG GCAAGAACCC GCGCTGGCGG GCGCGGCATC GCCCGCCGAT 
ACGCCCGCTT TCACGAGCGG CACGCTGGCC GCGCTCGTCG CGTTCGCGGC GATCACGCCG 
CTGCTGCTGC TCGTCGCGCC GGCCGTGGCC GGCCAGCTGG GCGCGCAGCT CGGGCTGTCG 
GCGTCGCGGA TCGGCACGTA CTTCTTCGTG GAGCTGGGCG CGTTCAGCGC CGCGACGCTG 
CCGTCGTACC TGTGGCTCGG CCGCATCGAC GCGCGGCGCA TCGCGTGGGG CGCGACCGCC 
GTGTTCTGCG CGGGCAATCT CGCGACCGCC GTATGGATGC CGGGCTTCGC GCCGCTACTC 
GCGCTGCGCG CGGCAACGGC GCTCGGCGGC GGCACGTTGA TGGTGCTCTG CATGACGAGC 
GCCGCGGCGA GCGGCAACAG CGATCGCGTC TACGGGCTCT GGATCGTCGG CCAGTTGATC 
GCGGGCGCGG CCGGTCTGTT CCTGCTGCCG CATCTGTTCG ATATGGTCGG ACTGCGCGCG 
CTGTACGCCG TGCTCGCCGC GCTCGCGCTG TGCGCCGCGC CGCTCGCGCG CCGCTTTCCG 
GCCGTGCCGC GCGTGCGGGC GCAGCACGCG CCGCGCGCGC GGGCGCAAGC GGCGCGCATG 
GCGGCGGCGC TTGCGATCGG CGGCGTGCTG ACGTTCTACG TCGCGATCGG CGGCGTGTGG 
ACCTTCGCGA GCAAAGCGGC GTCCGCCGTC GGCCTCGACG CGCAGACGAG CGGCAACGTG 
CTCGCGATCG CGAGCCTGAT GGGCATCGCG GGCGCGGCGC TCGCGTCATA TCTGGGCGGT 
CGTGCGGCGC GGCGCGCGAT GCTGCTCGCC GGATACGGCA TCCTCGCGGC GTCGCTCGTC 
GCGCTTGCCG CCGCGCCAAA CGCGAACGGC TACACGCTCG CGATCTTCGG TTTCAAGTTC 
GCATGGACGT TCGTCCTGCC GTTCATGCTC GCGAGCGTCG CGGCCGTCGA CGCGACGGGG 
CGCCTGATCG CGACGCTCAA TCTCGTGATC GGTTCGGGGC TCGCCGCCGG GCCGCTCGCC 
GCCGGACTGA TGCTCGACGG CGGCGGCACG CTGCGCGCGC TGTTCTCGAT CGCGGCCGCG 
GTCTCGCTCG TCTCGCTCGC GGCCATGCTG CGGGTCGAGC GCGACGCGCG CTGA

Protein sequence

MTIKTLRQEP ALAGAASPAD TPAFTSGTLA ALVAFAAITP LLLLVAPAVA GQLGAQLGLS 
ASRIGTYFFV ELGAFSAATL PSYLWLGRID ARRIAWGATA VFCAGNLATA VWMPGFAPLL 
ALRAATALGG GTLMVLCMTS AAASGNSDRV YGLWIVGQLI AGAAGLFLLP HLFDMVGLRA 
LYAVLAALAL CAAPLARRFP AVPRVRAQHA PRARAQAARM AAALAIGGVL TFYVAIGGVW 
TFASKAASAV GLDAQTSGNV LAIASLMGIA GAALASYLGG RAARRAMLLA GYGILAASLV 
ALAAAPNANG YTLAIFGFKF AWTFVLPFML ASVAAVDATG RLIATLNLVI GSGLAAGPLA 
AGLMLDGGGT LRALFSIAAA VSLVSLAAML RVERDAR