Gene BMASAVP1_A1941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMASAVP1_A1941
Symbol
ID	4678719
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei SAVP1
Kingdom	Bacteria
Replicon accession	NC_008785
Strand	+
Start bp	1922491
End bp	1924086
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	77%
IMG OID	639846204
Product	putative carbohydrate kinase
Protein accession	YP_993259
Protein GI	121601232
COG category	[G] Carbohydrate transport and metabolism [S] Function unknown
COG ID	[COG0062] Uncharacterized conserved protein [COG0063] Predicted sugar kinase
TIGRFAM ID	[TIGR00196] yjeF C-terminal region, hydroxyethylthiazole kinase-related [TIGR00197] yjeF N-terminal region

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCCTGC CTGCCGCCTC CCCGCTGCCC CGTTCGCTCG AACCGTTCGA TGCGCCGCCG 
ATTCATGCGA GCGCGCCGCT CCTGAGCGTC GCCGAGCTGC GCGACATCGA AACCGCGGCG 
GCCGCCGCGC TGCCGCCCCA CACGCTGATG GAGCGCGCGG GCAAATCGGC CGCGCAGTGG 
CTCGCCGCGC GGCTCGTGAG CGACCCGCGG CCCGTGTGGT TCGCGGTCGG CCCGGGCAAC 
AACGGCGGCG ACGCGCTCGT CGCCGCGGCC GAGCTGCGCC GGCTCGGCTT CGCGGCCGAC 
GCCTGGATGC CGATCGAGGT GAAGCCTGAC GACGCGCGCT GGGCGCTCGA GCGCGCGCGC 
GCGGCGAACG TGCCGATCGA CGAGGCGGCG CCCGAATCGT TCGACGGCTA CGGCTGGCTC 
GTCGACGGGC TGTTCGGCAT CGGCCTCGCA CGGCCGCTCG ACGGCGCGTT CGCCGCGATC 
GCGCAGCGCA TCGCGGCGCG CGCGCGGCAC ACCGGCCGCG TGCTCGCGCT CGACGTGCCG 
AGCGGCCTCG ACAGCGACAC CGGCGCGCGC GTCGGCGGCG GGACCGCCGT CACGGCCACC 
TGCACGCTGT CGTTCATCGC CGCGAAGCCC GGCCTCTATA CCGGCGACGG GCGCGACCTC 
GCGGGCGAAA TCCATGTCGC GCCCCTCGAT CTCGGCGAGC CGCCCGCGCC CGCGATCCGG 
CTGAACGCGC CCGAGCTCTT CGAGGCGCGC CTGCCCGAGC GCGCGTTCGC ATCGCACAAG 
GGCACGTACG GCAGCCTCGG GATCGTCGGC GGAGACACGG GCATGTGCGG CGCGCCGATC 
CTCGCCGCGC GCGCGGCGCT CTTCGCCGGC GCGGGCAAGG TCCATGTCGG CTTCGTCGGC 
ACGGGCGCGC CGCCGTACGA TCCGCCGTAT CCGGAGCTGA TGCTGCATCC GGCCGACGCG 
CTGCCGAGCG CGTCGCTCAC CGCGCTCGCG ATCGGCTGCG GGCTCGGCGC GAGCGAGCGC 
GCCGCGCGCG TGCTCGCGGC GCTGCTGCCG CTCGATGCGC CGAAGCTCAT CGACGCCGAC 
GCGCTGAATC TGATCGCGAC GACGCCCGCG CTCGCGGCGA CGCTCGCCGC GCGCGGCCGC 
ACAGGCGACG CCGCCGTCCT CACGCCGCAT CCGCTCGAGG CCGCGCGCCT GCTCGCCACC 
GACGCGGCCG ACGTCCAGCG CGACCGCGTC GCCGCCGCGC GCGCGCTCTG CGCGCGCTTC 
TCGGCGGTCG TCGTGCTGAA AGGGTCCGGC ACCGTGATCG CGGCGCCGGA CGGCCGCCTC 
GCGATCAATC CGACCGGCAA CGCGGCGCTC GCCACCGGCG GCACGGGCGA CGTGCTGGGC 
GGCCTGATCG GCGCGTTTCT TGCGCAGCGG ATGCCGCGCT ACGAAGCGGC GCTCGCGGGC 
GTCTACCTGC ACGGGCTCGC CGCCGAGCGG CTGTGCGCGG CGGGCGCGGG CCCGGCCGGC 
CTCGCCGCGG GCGAACTCGC GCCCGCCGTG CGCGCGCTCG TCAATCGGCT GTTTTATACG 
CGGCCCGCCG CGCCGGACGA AGCGCCGCTA TACTGA

Protein sequence

MILPAASPLP RSLEPFDAPP IHASAPLLSV AELRDIETAA AAALPPHTLM ERAGKSAAQW 
LAARLVSDPR PVWFAVGPGN NGGDALVAAA ELRRLGFAAD AWMPIEVKPD DARWALERAR 
AANVPIDEAA PESFDGYGWL VDGLFGIGLA RPLDGAFAAI AQRIAARARH TGRVLALDVP 
SGLDSDTGAR VGGGTAVTAT CTLSFIAAKP GLYTGDGRDL AGEIHVAPLD LGEPPAPAIR 
LNAPELFEAR LPERAFASHK GTYGSLGIVG GDTGMCGAPI LAARAALFAG AGKVHVGFVG 
TGAPPYDPPY PELMLHPADA LPSASLTALA IGCGLGASER AARVLAALLP LDAPKLIDAD 
ALNLIATTPA LAATLAARGR TGDAAVLTPH PLEAARLLAT DAADVQRDRV AAARALCARF 
SAVVVLKGSG TVIAAPDGRL AINPTGNAAL ATGGTGDVLG GLIGAFLAQR MPRYEAALAG 
VYLHGLAAER LCAAGAGPAG LAAGELAPAV RALVNRLFYT RPAAPDEAPL Y