Gene BMASAVP1_A1004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMASAVP1_A1004
Symbol
ID	4679806
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei SAVP1
Kingdom	Bacteria
Replicon accession	NC_008785
Strand	+
Start bp	985207
End bp	986661
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	70%
IMG OID	639845278
Product	GntR family transcriptional regulator
Protein accession	YP_992344
Protein GI	121599547
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.315502
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCACCG TCCCGCTTGC GCAGATCCCC GCGCCGCACG ATACCGCGAC GCTCACGCTC 
GTCGATCAGC TCGTGCAATG GGCGCGCCGC CGGATCGACG AGCGCGTGTT CCGGCCCGGC 
ATGCGGATGC CGTCGATCCG CAAGCTCGCG CTCGACAAGA GCGTGTCGCG CTTCACGGTC 
GTCGAGGCGT ACGAGCGGCT CGTCGCGCAG GGCTATCTCG ATTCGCGGCG CGGCTCCGGC 
TTCTACGTGC GCGAGCGCGC GCCCGGGCAG CAGCCGGTGG GCGCATCGGG CGGCGCGCGC 
GCGCAGCCCG TGCACAACAC GATCGACGTC GTCTGGCTGC TGCGCAACAT GCTGCACACG 
GTCAGCCCGG AAAAGGGGCC GGGGCTCGGC TATCTGCCGA GCCGCTGGCT CGACGGCGAA 
CTGATCACGA GCGCGTTGCG CGCGCTCGGC CGGCAATCGG GCGCGCAGAT GCTCGGCTTC 
GGCAGCGCGC AGGGCTTCCT GCCGCTGCGG CAGCAACTGC AGACGCGCCT CGCCGAATTC 
GAGATCGGCG CGACGCCCGA TCAGCTCGTG CTCGTGTCCG GCATCACGCA GGCGATCGAT 
CTGATCGCGC GCCACTGCGT GCGCCCGGGC GACGCGGTGA TCGTCGGCGA TCCGGCCTGG 
TTCCAGATGT TCGGGCGCTT CGCGTCGCAG GGCGCGCAGC TCGTCGGGAT GCCGTACACG 
CCGGACGGCC CCGATCTCGA CGCGCTCGAG AACCTCGTGC AGATGTGGCG CCCGAAGATG 
CTCGTGATCA ACTCGGTGCT GCACAATCCG ACGGGCACGT CGCTGTCGGC CGCGCAGGCG 
TTCCGGATCC TGAAGCTCGC GGAGGCGTAC GATTTCCTCG TCGTCGAGGA CGACGTCTAC 
GGCGACCTGT GCCCGCCGAG CTATCCGGCG ACGCGCCTGG CGAGCCTCGA CCAGTTAAGG 
CGCGTGATCT TCCTCGGCAG CTTCTCGAAG ACGCTCGCCG CGAACCTGCG GGTCGGCTAC 
ATCGCGTGCG CGCCGGAACT CGCGAAGGCG CTGACGGATC AGAAAATGCT CGTCGGGATG 
ACGACGCCCG AGCTCAACGA GCGCGTGCTG TACAAGGTGC TCACGGAAGG GCACTACCGG 
CGCCACGTCG AGCGGTTGCG CGCGCGGCTC GACGGCGTGC GCGACAAGAC CGCGCGGATG 
CTCGAGCGCA CCGGCATGCG GCTCTTCACG ATGCCGGCGG CGGGGATGTT CCTGTGGGCC 
GACACGGGCG TCGATTCGGA CGCGCTCGCC GCGGCCGCGC ACGAGGAAGG TTTCCTGCTC 
ACGCCGGGGA GCCTCTTCTC GCCGCAGCAG TCGCCTTCGA CGTGGACGCG CTTTAACGTC 
GCGAACTGCG GCGATCCGGC GCTGCCCGCG TTCCTCGGCC GCTATCTCGA CAGCGTGAAC 
CGCCGCGCCT CTTGA

Protein sequence

MSTVPLAQIP APHDTATLTL VDQLVQWARR RIDERVFRPG MRMPSIRKLA LDKSVSRFTV 
VEAYERLVAQ GYLDSRRGSG FYVRERAPGQ QPVGASGGAR AQPVHNTIDV VWLLRNMLHT 
VSPEKGPGLG YLPSRWLDGE LITSALRALG RQSGAQMLGF GSAQGFLPLR QQLQTRLAEF 
EIGATPDQLV LVSGITQAID LIARHCVRPG DAVIVGDPAW FQMFGRFASQ GAQLVGMPYT 
PDGPDLDALE NLVQMWRPKM LVINSVLHNP TGTSLSAAQA FRILKLAEAY DFLVVEDDVY 
GDLCPPSYPA TRLASLDQLR RVIFLGSFSK TLAANLRVGY IACAPELAKA LTDQKMLVGM 
TTPELNERVL YKVLTEGHYR RHVERLRARL DGVRDKTARM LERTGMRLFT MPAAGMFLWA 
DTGVDSDALA AAAHEEGFLL TPGSLFSPQQ SPSTWTRFNV ANCGDPALPA FLGRYLDSVN 
RRAS