Gene BMASAVP1_A0521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMASAVP1_A0521
Symbol
ID	4680969
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei SAVP1
Kingdom	Bacteria
Replicon accession	NC_008785
Strand	+
Start bp	523839
End bp	524960
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	61%
IMG OID	639844798
Product	capsular polysaccharide biosynthesis/export periplasmic protein
Protein accession	YP_991870
Protein GI	121598506
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.21613
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCGCGG TCACGCTCGC CGGTTGCTCA AGTATCCCTA CGTCGGGGGC CAGTGGCGCG 
CAAATCGCGC GGGCTGCGCA GAGTCCATCC GGAATTCAGA TCGTCGATGT GACCGAGGAT 
GTCGCGCGCC AGCTGTTTGC TGATCGAAAC ACGGCGGACT TCGTGACGGC GCTGGGCGGC 
GGTGCGTCGT TCCGGCAACA GTTGGGCGTC GGCGATACGA TTCAGGTGTC CATCTGGGAG 
GCGCCACCCG CCACGCTTTT TGGCGCGGCT CAGTCGGAAG GGAGTTCGGG GCCGGCGAAC 
GCGCGCGTGA CGGTGCTGCC CGATCAAGCC ATCGATGGCG ACGGCAATGT CAATATTCCG 
TTTGCGGGCC AGGTCAAGGC GGCCGGCCGC TCGCCCACGC AGTTGGCGCG TGAGATTGCC 
GCGCGGCTGA AGAGCATGGC GCACGATCCG CAAGTGCTCG TGAAGCTTTC ACGCAACGAG 
ACGTCATATG TGACGGTCGT GGGCGATGTG GCGGAAAACG CTCGCATGGC TCTGACCGCT 
CGGGGCGAGC GCCTGCTTGA TGCATTGGCG AGCGCAGGCG GGGCGAAGCA CCCGGTTGAC 
AAGGTTACGA TCCAGATAAC GCGCGGCAAG ACGGTGGCCT CGTTGCCGCT CGACATGGTT 
ATTCGTGATC CGCGGCAGAA TGTCCCGCTG CATGCGGGCG ACGTGGTCAC TGTCCTGTTT 
CAGCCGTATA GCTTTACGGT GCTCGGCGCG ACGGGCAAGA ATGACGAAAT CAATTTTGAA 
GCGAAGGGCA TCACGCTTGC GCAGGCCCTG GCGCGTGCTG GCGGCTTGCA GGATTCGCGC 
GCCGATGCAA AGGGCGTATT CATCTTCCGA CTTGAAGACG CCAACGCGCT GAAATGGCCG 
ACGGCTCCCG TGCGTACGAC TGCGGACGGA AAGGTGCCTG TCGTGTATCG CGTGAATCTT 
CGCGATCCGA ATTCGTTTTT CGTGGCTCAG AGCTTCAGGG TCGACAACAA CGATCTGTTG 
TACGTTTCGA ATGCGCCGAT TGCCGAACTT CAAAAATTCT TGAATGTCGT GTTCTCCGTT 
GCGTATCCGG TGATTACCGG CGTTCAGACA GTCAGGTACT GA

Protein sequence

MGAVTLAGCS SIPTSGASGA QIARAAQSPS GIQIVDVTED VARQLFADRN TADFVTALGG 
GASFRQQLGV GDTIQVSIWE APPATLFGAA QSEGSSGPAN ARVTVLPDQA IDGDGNVNIP 
FAGQVKAAGR SPTQLAREIA ARLKSMAHDP QVLVKLSRNE TSYVTVVGDV AENARMALTA 
RGERLLDALA SAGGAKHPVD KVTIQITRGK TVASLPLDMV IRDPRQNVPL HAGDVVTVLF 
QPYSFTVLGA TGKNDEINFE AKGITLAQAL ARAGGLQDSR ADAKGVFIFR LEDANALKWP 
TAPVRTTADG KVPVVYRVNL RDPNSFFVAQ SFRVDNNDLL YVSNAPIAEL QKFLNVVFSV 
AYPVITGVQT VRY