Gene BMASAVP1_1609 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMASAVP1_1609
Symbol
ID	4677655
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei SAVP1
Kingdom	Bacteria
Replicon accession	NC_008784
Strand	+
Start bp	1574206
End bp	1575252
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	61%
IMG OID	639844124
Product	YD repeat-containing protein
Protein accession	YP_991203
Protein GI	121597339
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3209] Rhs family protein
TIGRFAM ID	[TIGR01643] YD repeat (two copies)

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGGCGTG CGAGCGCGAT GATCGATCCG GCGGGGCGGA CGACGGCTTG GGAATATGAC 
GCGTATGGCA GTTTGCTTGT GCAGACGTTG CCGGATGGCA GCGCAGTCAG AACGGAATTT 
GACCTCGATC ACCGACCGGT CTGCATGACG TTGATAGGCG GCCGGCAGTG GGGCTACGAG 
TGGAATACGT TCGGTAATCT GCTCGCGCAG AGCGATCCAT CGGGGGCGAT ATCTCGCTAT 
ACCTATGACG AGTACGGCCA GCTTGTTGAG CATACTGGGC CGCGTGGTGC GAGCACACGG 
TTCGATTATC ACCCGGACGG CAATCTCGCG GCGCAGATCG ATGCGTTGGG GCATCGCACG 
CAGTATCGGT ACGATGCGCG CGGCTACCTC GGCGAAGCAA TCGATGCGCT CGGACAGCAA 
AGCCAATACG AGTACGACCG CAACGGCCAT CTGACGCGCG CAATCGAGCC GGGCGGGCGT 
GAGATTCACT GTGCGTACGA CGCCGATGGA AATCTGTCTC GCCATCGTGA CCCCATGGGC 
CACGTGACGC AGATGGAGTA CTCGGCGCTC GGACAGGTCA GCAGACGGCT CGCGCCCGAC 
GGCACCACCG TTGAATACCG CTACGACACG GAAGAACAAC TGATCGGCGT CGTGAACGAA 
CGCAGCGAAC TATACGCGCT CGAACGCGAT GCGCTGGGGC GGATCGTCGT GGAGACGGAC 
TACTGGGGGC AAGCGCGACG CTATCGGTAT GGCGCGGCGG GTGAACTGCT TTGTAGCACT 
GATCCTCTGG GGCAGACAGT CGAATACCGA TACGATTGGC TGGGGCGCAT CGTTCAGAAG 
CGCGTGCCTC ATCCGGAGCA GGATGAGGCT CTTCAGATCG ACAGCTTTGC ATACGATCGG 
CACGGGGACT TGGTGCTCGC GGAGAATCCG TCTTGTCGCG TCGAGTTCGA TTACGATGCA 
GCGGGCCGCA TGATCGAGGA GCGACAGGGT GACGACTTCA CGATTGCCAG TGATTATGAC 
GAAGCCGTGA CCTGCCCCCT TCGATAG

Protein sequence

MGRASAMIDP AGRTTAWEYD AYGSLLVQTL PDGSAVRTEF DLDHRPVCMT LIGGRQWGYE 
WNTFGNLLAQ SDPSGAISRY TYDEYGQLVE HTGPRGASTR FDYHPDGNLA AQIDALGHRT 
QYRYDARGYL GEAIDALGQQ SQYEYDRNGH LTRAIEPGGR EIHCAYDADG NLSRHRDPMG 
HVTQMEYSAL GQVSRRLAPD GTTVEYRYDT EEQLIGVVNE RSELYALERD ALGRIVVETD 
YWGQARRYRY GAAGELLCST DPLGQTVEYR YDWLGRIVQK RVPHPEQDEA LQIDSFAYDR 
HGDLVLAENP SCRVEFDYDA AGRMIEERQG DDFTIASDYD EAVTCPLR