Gene BMASAVP1_A1917 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMASAVP1_A1917
Symbol
ID	4679206
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei SAVP1
Kingdom	Bacteria
Replicon accession	NC_008785
Strand	-
Start bp	1897932
End bp	1898951
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	69%
IMG OID	639846181
Product	hypothetical protein
Protein accession	YP_993236
Protein GI	121600762
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCTAC TGAAGAAGTG CGCCGCGCTC GCGGCGCTCG CCGTCGTATT GCTGGGCGTC 
GCGTGCGCGG GCGGCGCCTA TTACTGGGCC ACTCGGCCGC TCGCGCTCGC CGCGCCGATC 
CTCGATGTGA CGATCAAGCC CCGCAGCAGC GTGCGCAGCG TCGCGCAGCA ACTCGTGCAC 
GGCGGCGTGG GCGTCGAGCC GCGCCTGTTC GTCGCGATGA CGCGCGTGCT GTTCCTGTCG 
AGCCGGCTCA AGTCCGGCAA TTACGAATTC AAGACGGGCG TGAGCCCTTA CGAGGTGTTG 
CAGAAGGTCG CGCGCGGGGA CGTGAACGAA TATGTCGTGA CCGTGATCGA GGGCTGGACG 
TTCCGGCGCA TGCGCGCGGA GCTCGACGCG AATGCGGCGC TCGCGCATGC GAGCGCGGGG 
ATGAGCGACG CGGCGCTGCT GCGCGCGATC GGCGCGCCCG CCGAAGTCGT CGCGCGCGGC 
ACCGGCGAGG GGCTGTTCTT TCCGGATACC TATCTGTTCG ACAAGGGCAC GAGCGACCTG 
AACGTGTATC GGCGCGCGTA CCGGCTGATG CAGGCGCGCC TGGCCGACGC GTGGACCGCC 
CGTCGGCCCG GCCTGCCGTT CAAGACCCCT TACGAGGCGC TGACGGTCGC GTCGCTCGTC 
GAGAAGGAGA CGGGGCACGC GTCCGACCGT GCGTTCGTGT CGGGCGTGTT CGCGAATCGC 
CTGCGGGCCG GGATGCCGCT GCAGACCGAT CCCTCGGTGA TCTACGGAAT GGGCGACGCG 
TACACGGGGC GGCTGCGCAA GCGCGATCTG CAGACCGACA CTCCGTACAA TACCTACACG 
CGCCGCGGGC TGCCCCCGAC GCCGATCGCG CTGCCGGGCG AGGCGGCGCT CTACGCCGCG 
GTGAACCCGG CGGCGACGTC CGCGCTCTAT TTCGTCGCGA GGGGCGACGG CACGAGCGTC 
TTCTCGGACA CGCTCGGGGA TCACAACAAG GCCGTGGACA AATACATACG AGGTCAATGA

Protein sequence

MSLLKKCAAL AALAVVLLGV ACAGGAYYWA TRPLALAAPI LDVTIKPRSS VRSVAQQLVH 
GGVGVEPRLF VAMTRVLFLS SRLKSGNYEF KTGVSPYEVL QKVARGDVNE YVVTVIEGWT 
FRRMRAELDA NAALAHASAG MSDAALLRAI GAPAEVVARG TGEGLFFPDT YLFDKGTSDL 
NVYRRAYRLM QARLADAWTA RRPGLPFKTP YEALTVASLV EKETGHASDR AFVSGVFANR 
LRAGMPLQTD PSVIYGMGDA YTGRLRKRDL QTDTPYNTYT RRGLPPTPIA LPGEAALYAA 
VNPAATSALY FVARGDGTSV FSDTLGDHNK AVDKYIRGQ