Gene BURPS1106A_A2709 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2709
Symbol	mprA
ID	4904771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2648489
End bp	2649982
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	70%
IMG OID	640145812
Product	serine metalloprotease
Protein accession	YP_001076739
Protein GI	126455665
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGATTCGTA CTGCTTCGTT CAAGGCGACC GTCCTGTGTG CCGCGCTGGC CGGCCTCGTT 
TCGGCCGCGC AAGCGGAAAC CGCGGCCGCG CCCCAGGTGC CGGGGCCCGC CGACGCGGTC 
AATCAGTTGA TCGTCAAGTT GCGCGCGGTG AAGACGCCGC CCGGTGCGAC GGCCGCGAAG 
GCCGAGCGCG CGGACGTTCA GGCCGTCATC GATCGCGTGC TCGCCGCGCG CAATGCGCGG 
GCGGCGGGGC GTGCGTTCGG CGCGGCCGCC GCATCCGCGC CCGGCAATCC GGACGACCCC 
GCCGCGGGCA TTCGCATCAA GCGCGACATG TCGGGCGGCG CGACCGTGCT GTCGCTGCAG 
CGCCACGTGT CGCTCGCGCA GGCCGAGGCG CTCGCGCGCG ACTTCGCGGC GGACGGCGCG 
ATCGAATATG CGGAGCCCGA TGCGCGGATG CATCCGTTCG TCGTGCCGAA CGATACGCGC 
TATTCGGAGC AATGGGGCTA CTTCAATCCG ACCGCCGGCG CGAATCTGCC GAAGGCTTGG 
GATCGCACGA CCGGCTCCGC GCGCGTCGTC GTCGCCGTCA TCGATACCGG CTACCGTCCG 
CATGCGGATC TCGCCGCGAA CCTGCTGCCG GGCTACGACT TCATCTCCGA TATCCCGAGC 
GCGAACGACG GCAATGGCCG CGACAGCGAC GCATCGGATC CCGGCGACTG GGTGAGCGCG 
CAGGAAGACG GCGATCCGAG CGGCCCATTC TATGGCTGCG GCGCGAGCGA CAGCTCATGG 
CACGGCACGC ACGTCGCGGG CACGATCGGC GCGGTGACGA ACAACGGCGT CGGCGTGGCG 
GGCATCTCGT GGGTCGGCAA GGTGCTGCCC GTGCGCGTGC TCGGCAAGTG CGGCGGGATG 
CTGAGCGACA TCGCCGACGG CATGCGCTGG GCGGCGGGCC TGCCGGTGCC GGGCGCGCCG 
TCGAATCCGA ACCCGGCGAA GGTGCTGAAC CTGAGCCTCG GCGGATACGG CCGCACATGC 
AGCTCGACGT ACCAGAACGC GATCAACGAA ATCACGTCGC GCGGCGCGAA CGTCGTTGTC 
GCCGCGGGCA ATAACGGCGG CTCGGTGTCG ACGACTCAGC CGGCGAATTG CCGGGGCGTG 
ATCGCGGTCG GCGCGATCGA CAGCCGCGGT GTGCGCGCGA GCTTCAGCAA CACCGGCGCC 
GCGGTGAAGA TCTCCGCGCC GGGCGTCGGC ATTCTGTCGA CGCTCAATGC GGGCAAGACC 
TCGCCGGGCG CGGACAGCTA CGCGAGCTAT AGCGGCACGA GCATGGCAAC GCCGCATGTC 
GCGGGCACGG TCGCGCTGAT GCTCGCCGTC AACTCGACGC TGTCGCCTTC GCAGATCTTG 
CAGCGGCTGC AATCGAGCGC GCGGCCGTTC TCGAGCGGAT CGAGCTGCTC GACGAGCACG 
TGCGGCGCAG GGCTGCTCGA CGCAGGCAAC GCGGTCGACG CCGCCGCGCA GTGA

Protein sequence

MIRTASFKAT VLCAALAGLV SAAQAETAAA PQVPGPADAV NQLIVKLRAV KTPPGATAAK 
AERADVQAVI DRVLAARNAR AAGRAFGAAA ASAPGNPDDP AAGIRIKRDM SGGATVLSLQ 
RHVSLAQAEA LARDFAADGA IEYAEPDARM HPFVVPNDTR YSEQWGYFNP TAGANLPKAW 
DRTTGSARVV VAVIDTGYRP HADLAANLLP GYDFISDIPS ANDGNGRDSD ASDPGDWVSA 
QEDGDPSGPF YGCGASDSSW HGTHVAGTIG AVTNNGVGVA GISWVGKVLP VRVLGKCGGM 
LSDIADGMRW AAGLPVPGAP SNPNPAKVLN LSLGGYGRTC SSTYQNAINE ITSRGANVVV 
AAGNNGGSVS TTQPANCRGV IAVGAIDSRG VRASFSNTGA AVKISAPGVG ILSTLNAGKT 
SPGADSYASY SGTSMATPHV AGTVALMLAV NSTLSPSQIL QRLQSSARPF SSGSSCSTST 
CGAGLLDAGN AVDAAAQ