Gene BMASAVP1_A2974 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMASAVP1_A2974
Symbol
ID	4679294
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei SAVP1
Kingdom	Bacteria
Replicon accession	NC_008785
Strand	+
Start bp	2955532
End bp	2956680
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	73%
IMG OID	639847232
Product	GumN family protein
Protein accession	YP_994268
Protein GI	121600066
COG category	[S] Function unknown
COG ID	[COG3735] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.562874
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTGAGG CAGTGGCGGC GCGCGAAGCC GCGCGCCGCT CGCGTAACGG CGTGCGGCGC 
GCGGCGACGC ACGCCGCACG CGCGCCCCGG CGCTGGCGCG CGCGCTCGCT CGCGAGCGCC 
GTGCTCGCCG GCGCGTGCGC GACGGGCGGG CTCGCATGGC CGCCCGCCGG CGCGCTGGCG 
GCGGGCAGCG TCGCGGCCGC GCCGCTGCCG CAGGCGCCGA TTCCCGCGCC CGGCATGTCG 
CTGCCGGGCT TTCACGCGCC GCCGCCGTCG ACGTCGAACG GCACGGTCGC GAGCGGCGCG 
GTACGCACGC AGCCCGCGCG GATGCCGTTC TACGTCGCGA CGAAGGGCAA GGTCACGATC 
TACGTGCTCG GCACGCTGCA CGTCGGCGAC CCCGCCGACT ATCCGGCGAA CCAGCCGTTT 
CGCCGGCCGA TCCTCGCGGC GCTCGCCGCG TCGCCGACGC TCGCGCTCGA ACTGTCGCCG 
GACGACCTGC TCGAATCGCA GGACGACGTA TCGAAGTACG GCGTGTGCAA CTACGCGTGC 
CTGCCGCGGC TGTTGCCGCC GCCTCTCTGG CAAAAGCTCG CGAACCGCCT GCGCGGCAAT 
CCGGCCGCGC TCGCCGGCAT CCGCAACATG CGGCCCTGGC TCGCGTCGCT CGTCGTCGAG 
ACGTACGATT CGCTGTCGGC CGGCTTGCAG ACCGAATACG GCACCGAGGC GCAACTGCAG 
AACGTGTTCC TGCGCAAGAA GGGCGGCAAG GTGGTCGGGC TCGAGACGCT CGCCGAGCAG 
ATGCGCGCGT TCACGGGGCT CACGCTCGCG CAGCAGCGGG AGATGCTCGC GCAGGACATG 
GTGCAGACGC CCGCGCAGAA CGCGGCCGAC GTGCGCGCGC TGCATCGCCT CTGGCGCATC 
GGCGACGCGG ACGCGATCGC CGCCTGGGCG AACGCGAAGA CGGAGCGGCT CGCACGCGCG 
CGGTCGATCG CCGATTCGAT CGACAACAAG ATCGTCCATG AGCGCAACCG CCGCTTCGTC 
GCGCGGATGA CGGCGATCGC CGCGCCGAAC CGGCCGCTGT TCGTCGCGAT CGGCTCGTTG 
CACCTGGGCG GCCCGAAGGG CGTGCTCGAA CTGCTTCGGC AGCAGGGCTA TCGCGTCGAC 
GCCGGGTGA

Protein sequence

MPEAVAAREA ARRSRNGVRR AATHAARAPR RWRARSLASA VLAGACATGG LAWPPAGALA 
AGSVAAAPLP QAPIPAPGMS LPGFHAPPPS TSNGTVASGA VRTQPARMPF YVATKGKVTI 
YVLGTLHVGD PADYPANQPF RRPILAALAA SPTLALELSP DDLLESQDDV SKYGVCNYAC 
LPRLLPPPLW QKLANRLRGN PAALAGIRNM RPWLASLVVE TYDSLSAGLQ TEYGTEAQLQ 
NVFLRKKGGK VVGLETLAEQ MRAFTGLTLA QQREMLAQDM VQTPAQNAAD VRALHRLWRI 
GDADAIAAWA NAKTERLARA RSIADSIDNK IVHERNRRFV ARMTAIAAPN RPLFVAIGSL 
HLGGPKGVLE LLRQQGYRVD AG