Gene BMASAVP1_A3208 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMASAVP1_A3208
Symbol
ID	4681796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei SAVP1
Kingdom	Bacteria
Replicon accession	NC_008785
Strand	+
Start bp	3172786
End bp	3174018
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	68%
IMG OID	639847464
Product	deoxyguanosinetriphosphate triphosphohydrolase-like protein
Protein accession	YP_994491
Protein GI	121601283
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.00852958
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGAAA TACCCGGCGG CGGCATCCCG CGCGAAACCC GCGACGCGCG CGTCTCGAAT 
GCGGGCGACG GGCAGGCGAT TCCCGTCGCC GCGCCGACCA CCGCAGCGCT CGAAGCGCAT 
CTCGCGCCGT ACGCGGCGCA CGCGTCGCGC TCGCGCGGGC GGCGCCATCC GGAGCCGCCG 
CCCGCGGCGC GCACCGAATT CCAGCGCGAT CGCGACCGCA TCGTGCACTC CACCGCATTC 
AGGCGCCTCG AATACAAGAC GCAAGTCTTC GTGAATCATG AAGGCGACCT GTTCCGCACG 
CGTCTCACGC ACAGCCTCGA GGTCGCGCAG ATCGCCCGGT CCGTCGCGCG CAACCTGCGC 
CTGAACGAAG ACCTCGTCGA GGCGATCTCG CTCGCGCACG ACCTCGGCCA TACGCCGTTC 
GGCCACGCCG GGCAGGACGC GCTCAACGCG TGCATGCGCG ACTACGGCGG CTTCGAGCAC 
AATCTGCAGA GCCTCGCCGT CGTCGACGAG CTCGAAGAGC ATTACGGCGC GTTCAATGGG 
CTGAACCTGT GCTTCGAGAC GCGCGAAGGC ATCCTCAAGC ACTGCTCGCG CGAGAACGCG 
CGCAAGCTCG GCGAGCTCGG CGAGCGATTC CTGCAAGGCC GCCAGCCGTC GCTCGAAGCG 
CAGCTCACGA ACATCGCGGA CGAAATCGCG TACAACAATC ACGACGTCGA CGACGGCCTG 
CGCTCGGGCC TCATCACGAT CGAGCAGCTC GCCGAGGTCG AGCTGTGGCA GCGCCATTAC 
GAAGCGGCGC TCGCCGAGTA TCCGCATCTC GAGGGCCGCC GGCTCGTGCA CGAGACGGTG 
CGCCGGATCA TCAACACGCT GATCGTCGAT CTGATCGACG CGACGACGCG CAATCTCGCG 
CGCCACGGGC CGACCTCGCT CGACGACGTG CGCGCGGCGC CGCCCCTCGT CGCGCACGGC 
GAGCCGATCG CCACGCAGGC GGCGGCGCTC AAGCGTTTCC TGTACAAGAA CCTGTATCGC 
CACTACCGCG TGATGCGCAT GGCGAGCAAG GCGCAGCGGG TCGTCACCGG CCTCTTCAAC 
GCGTTCACGG GCGACCCGCG CCTCTTGCCG CCCGACTATC AGGCGGCCGA CGCCGCGCAT 
CAGCCGCGGC TCGTCGCGCA TTACATCGCC GGCATGACCG ATCGTTTCGC ACTGAAAGAG 
TATCAACGCT TGTTTGTCAT GGACGAAAAC TAA

Protein sequence

MSEIPGGGIP RETRDARVSN AGDGQAIPVA APTTAALEAH LAPYAAHASR SRGRRHPEPP 
PAARTEFQRD RDRIVHSTAF RRLEYKTQVF VNHEGDLFRT RLTHSLEVAQ IARSVARNLR 
LNEDLVEAIS LAHDLGHTPF GHAGQDALNA CMRDYGGFEH NLQSLAVVDE LEEHYGAFNG 
LNLCFETREG ILKHCSRENA RKLGELGERF LQGRQPSLEA QLTNIADEIA YNNHDVDDGL 
RSGLITIEQL AEVELWQRHY EAALAEYPHL EGRRLVHETV RRIINTLIVD LIDATTRNLA 
RHGPTSLDDV RAAPPLVAHG EPIATQAAAL KRFLYKNLYR HYRVMRMASK AQRVVTGLFN 
AFTGDPRLLP PDYQAADAAH QPRLVAHYIA GMTDRFALKE YQRLFVMDEN