Gene BMASAVP1_A3057 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMASAVP1_A3057
Symbol
ID	4678856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei SAVP1
Kingdom	Bacteria
Replicon accession	NC_008785
Strand	+
Start bp	3032316
End bp	3033506
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	71%
IMG OID	639847315
Product	hypothetical protein
Protein accession	YP_994351
Protein GI	121601017
COG category	[S] Function unknown
COG ID	[COG1565] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.797312
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCCGA AAGCTCACGA ACCCGCTAGT TTACCCGTTC CCGGCCCCGA CGCGCTCGCG 
CAGTCCGACG CGCTCGCCGC GTCGCTGCGC GCCGAAATCG CCGCGGCGGG CGGATGGATC 
CCGTTTTCCC GCTACATGGA GCGCGTGCTG TATGCGCCGG GCCTGGGTTA CTACAGCGGC 
GGCGCGCAGA AATTCGGCCG GCGCGGCGAC GACGGCAGCG ATTTCGTGAC CGCGCCCGAG 
CTGTCGCCGC TCTTCGCGCA GACGCTCGCG CGCCCCGTCG CGCAGGCGCT CGCCGCGAGC 
GGCACGCGGC GGGTGATGGA ATTCGGCGCG GGCACGGGCC AGCTCGCGGC GGGGCTGCTG 
AACGCGCTCG CCGCGCTCGG CGTCGAGCTC GACGAATATG CGATCGTCGA TTTGTCCGGC 
GAGCTGCGCG CGCGCCAGCG CGAGACGCTC GACGAACAGG CGTCCGGCGC CGCCGCGCGC 
GTGCGCTGGC TCGACGCGCT GCCCGAGCGC TTCGAGGGCG TGATCGTCGG CAACGAAGTG 
CTCGACGCGA TGCCGGTGCA ACTCGTCGCG AAGCATGCGC ACGGCTGGTG CGAGCGCGGC 
GTGTCGCTCG GCGATGCGGG CGCGTTCGCG TTCGCCGATC GGCCGCTCGC GCGCGCCGAG 
GACGCGGCGC GGCTCGCGGC GCTCGACGCC GACGAAGGTT ACGTGACCGA GACGCACGAC 
GCGGCGGCGG CGTTCGTCGG CACGGTCTGC GCGATGCTCG CGCGCGGCGC CGCGTTGTTC 
ATCGACTACG GTTTTCCGCG CCACGAGTAC TATCACCGGC AGCGCGCGCA GGGCACGCTG 
ATGTGCCATT ACCGGCACCG CGCGCACGGC GATCCGTTCG TCTATCCGGG GCTGCAGGAC 
ATCACCGCGC ACGTCGAATT CAGCGCCGTC TACGAGGCGG GCGTCGGCGC GGGCGCTGAG 
CTGCTCGGCT ACACGTCGCA GGCGCGCTTT CTGCTGAACG CGGGCATCAC CGACGTGCTC 
GCCGAGATCG ACCCGTCCGA CGCGCAACGC TTCCTGCCCG CCGCGAACGC GGTGCAGAAG 
CTGATTTCCG AGGCGGAGAT GGGCGAGCTC TTCAAGGTGA TCGCGTTCTC GCGCGGCATC 
GACGGCACGC TCGACGCGTT CGCGCGCGGC GATCGTTCGC ACACGCTGTA G

Protein sequence

MNPKAHEPAS LPVPGPDALA QSDALAASLR AEIAAAGGWI PFSRYMERVL YAPGLGYYSG 
GAQKFGRRGD DGSDFVTAPE LSPLFAQTLA RPVAQALAAS GTRRVMEFGA GTGQLAAGLL 
NALAALGVEL DEYAIVDLSG ELRARQRETL DEQASGAAAR VRWLDALPER FEGVIVGNEV 
LDAMPVQLVA KHAHGWCERG VSLGDAGAFA FADRPLARAE DAARLAALDA DEGYVTETHD 
AAAAFVGTVC AMLARGAALF IDYGFPRHEY YHRQRAQGTL MCHYRHRAHG DPFVYPGLQD 
ITAHVEFSAV YEAGVGAGAE LLGYTSQARF LLNAGITDVL AEIDPSDAQR FLPAANAVQK 
LISEAEMGEL FKVIAFSRGI DGTLDAFARG DRSHTL