Gene BMASAVP1_A2980 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMASAVP1_A2980
Symbol
ID	4679073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei SAVP1
Kingdom	Bacteria
Replicon accession	NC_008785
Strand	-
Start bp	2961855
End bp	2962970
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	73%
IMG OID	639847238
Product	allophanate hydrolase, subunit 2
Protein accession	YP_994274
Protein GI	121598968
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1984] Allophanate hydrolase subunit 2
TIGRFAM ID	[TIGR00724] biotin-dependent carboxylase uncharacterized domain

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.409998
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTCAC GCCAAGCAAC GGGCGGCATC GAAGTGCTGC GCGCCGGACC GCTGTCGACG 
ATCCAGGATC TCGGCCGCCG CGGCTATCGC CATCTGGGCG TCGCGCAAAG CGGCGCGCTG 
GACTCGCTCG CGCTCGAAGT CGGCAATCGC CTCGTCGGCA ACCGGCCGGA CGCCGCCGCG 
ATCGAAATCA CGCTCGGCCC CGCGTCGTTT CGCTTCCCGC GCGCGACGCG CATCGCGATC 
ACCGGCACCG AGTTCGGCGC GACGCTCGAC GGCGCGCCGA TCTATTCGTG GTGGAGCGTG 
CCCGTCGCGG CCGGCCAGAC GCTCTCGCTG CCCGTCGCCA AGCGCGGGAT GCGCGGCTAT 
CTGTGCATCG CGGGCGGCAT CGACGTGCTG CCGATGCTCG GCTCGCGCAG CACCGATCTC 
GCGTCGCGCT TCGGCGGCCT CGGCGGGCGC GTGCTGCGCG ACGGCGACCG GCTGCCCACC 
GGCGCGCCGC CGGCGGGCGC GCCCGCGTGC GTCGCGCCCG ATGCGCCCGA GTTCGGCGTG 
AAGGCGCCCG CGTGGTGCGC GTTCGCGCGC GTCGACGAAG CGCCGCGCCG CCACAAGCAC 
GCGCATGCCG TGTGGGCGAT GCCCGTGCGC GTGCTGCCGG GCCCGCAGTA CGCGAGCTTC 
ACGGCGGCGG CGAAGCACGC GTTCTGGGAC GAGGAATGGA TCGTCACGCC GAACAGCAAC 
CGGATGGGCT ACCGGCTCGC GGGCGTGAAG CTCGAGCGCG CCGAATCGGC CGACCTGCTG 
TCGCACGCGG TGCTGCCGGG CACGATCCAG GTGCCGGGCA ACGGCCAGCC GATCGTGCTG 
ATGAACGACG CGCAGACGAC AGGCGGCTAT CCGCGGATCG GGGCCGTGAT CCGGGCCGAT 
CTCTGGAAGC TCGCGCAGGC GCGGCTGAAC CTGCCGATCC GCTTCGTCCG CGTGACGGAC 
AAGGCCGCGC GCGACGCGCT CGCCGCCGAG CGCGCGTACC TGCGGCAGAT CGACATCGCG 
ATCGAGATGC GCGAGGAAGC GCTGCAGCGC GCGCTCGCCG CGCGCGGCGG CCGCATGATT 
CCGGAAGATC GGACGCCGCC GCGCGGCCGG TCGTGA

Protein sequence

MNSRQATGGI EVLRAGPLST IQDLGRRGYR HLGVAQSGAL DSLALEVGNR LVGNRPDAAA 
IEITLGPASF RFPRATRIAI TGTEFGATLD GAPIYSWWSV PVAAGQTLSL PVAKRGMRGY 
LCIAGGIDVL PMLGSRSTDL ASRFGGLGGR VLRDGDRLPT GAPPAGAPAC VAPDAPEFGV 
KAPAWCAFAR VDEAPRRHKH AHAVWAMPVR VLPGPQYASF TAAAKHAFWD EEWIVTPNSN 
RMGYRLAGVK LERAESADLL SHAVLPGTIQ VPGNGQPIVL MNDAQTTGGY PRIGAVIRAD 
LWKLAQARLN LPIRFVRVTD KAARDALAAE RAYLRQIDIA IEMREEALQR ALAARGGRMI 
PEDRTPPRGR S