Gene BURPS1710b_3598 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_3598
Symbol
ID	3689036
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	-
Start bp	3921166
End bp	3922980
Gene Length	1815 bp
Protein Length	604 aa
Translation table	11
GC content	72%
IMG OID	637730053
Product	peptidase, M24 family protein
Protein accession	YP_334963
Protein GI	76811283
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.979645
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGCCC GACTTCCCGA TCCGTCGCCC GTGCCGGCGC GTCTTGCCCT GTTGCGCGGC 
GCGATGACGC GCGAGGATCT GGCCGCCTAC GTGGTGCCGT CCGCCGATCC CCATTTGTCC 
GAGTATTTGC CCGAGCGCTG GCAGGCGCGC CAATGGCTGT CGGGCTTCAC CGGCTCGGTC 
GGCACGCTCG TCGTGACCGC CGATTTCGCC GGCCTCTGGG TCGACAGCCG CTATTGGATG 
CAGGCCGAGG CGCAACTCGC GGGCACGGGC GTCGCGTTGA TGAAGATGGT GGGCGGCCAG 
CAGACGCAGC CGCACGTCGA ATGGCTCGCC GAGCACGTGC CCGAGGGCAC GACGGTCGGC 
GTGGACGGCG CGGTGCTCGG CGTCGCGGCG GCGCGCGCGC TCACGTCGGC GCTCACCCCG 
CGCGGCATCG TGCTGCGCAC CGATCTCGAT CTGCTCGATG CGATCTGGCC GCAGCGCCCG 
TCGCTGCCGG GCGACGCGGT GTTCGAGCAC GCGGCGCCGC AGGCCGACAC CGCGCGCGCG 
GGCAAGCTCG CGCAGGTGCG CCGCGCGATG CACGAGCAAG GCGCGCAGTG GCACTTCGTG 
TCGACGCTCG ACGATCTCGC GTGGCTCTTC AACCTGCGCG GCGCCGACGT CAACTACAAC 
CCGGTGTTCG TCGCGCACGC GCTCGTCGGC CTCGAGCGCG CGACGCTGTT CGTCGCCGAC 
GGCAAGGTGT CGGCCGAGCT GGCGACGTCG CTCGCGCGGG ACGGCGTCGA CGTGAAGCCG 
TACGACGCCG CGGCCGCCGC GCTCGCCGCG CTGCCCGAGG GCGCGGGGCT GCTGATCGAT 
CCGCGTCGCG TCACGTACGG GCTGCTGCAG GCGGTGCCGC AGCAGGTGCG CGTGATCGAG 
GCGGTGAATC CGTCGACGTT CGCGAAATCG CGCAAGACGC CCGCCGAGAT CGAGCACGTG 
CGCGCGACGA TGGAGCACGA CGGCGCGGCG CTCGCCGAAT TCTTCGCATG GTTCGAGCGC 
GCGCTCGGCC GCGAGACGAT CACCGAGCTG ACCATCGACG AGCAGCTCAC GGCCGCGCGC 
GCGCGACGGC CGGGCTATGT GTCGCCGAGC TTCGCGACGA TCGCGGGCTT CAACGCGAAC 
GGCGCGATGC CGCATTACCG CGCGACGCGC GCCGCGCACG CGACGATCGA AGGCGACGGC 
CTGCTGCTCG TCGATTCGGG CGGCCAGTAT CTGAGCGGGA CGACGGACAT CACGCGGGTC 
GTGCCGGTCG GCGCGATCGG CGACGCGCAC CGGCGCGACT TCACGATCGT GCTGAAGGCG 
ATGATGGCGC TGTCGCGTGC GCGCTTTCCG CGCGGCATCC GCTCGCCGAT GCTCGACGCG 
ATCGCGCGCG CGCCGATGTG GGCGGCCGGG CTCGACTACG GGCACGGCAC GGGGCACGGC 
GTCGGCTATT TCCTGAACGT ACACGAAGGG CCGCAGGTGA TCTCGCACTA CGCGCCCGCC 
GAGCCGTACA CGGCGATGGA GGAGGGGATG ATCACGTCGA TCGAGCCCGG CGTGTACCGG 
CCCGGCAACT GGGGCGTGCG CATCGAGAAT CTCGTCGTGA ACCGCGCGGC GGGCCAGACC 
GAGTTCGGCG ATTTCCTCGA ATTCGAGACG CTCACGCTCT GCCCGATCGA TACGCGCTGC 
GTGCTGCCCG CGCTCCTCGA CGACGTCGAG CGCGCGTGGC TGAACGCGTA TCACGCGACG 
GTGCGCGAGC GGGTCGGCAA GCACGTGTCG GGCGACGCGA GGGCGTGGCT CGACGCGCGC 
ACGCAACCGA TCTGA

Protein sequence

MNARLPDPSP VPARLALLRG AMTREDLAAY VVPSADPHLS EYLPERWQAR QWLSGFTGSV 
GTLVVTADFA GLWVDSRYWM QAEAQLAGTG VALMKMVGGQ QTQPHVEWLA EHVPEGTTVG 
VDGAVLGVAA ARALTSALTP RGIVLRTDLD LLDAIWPQRP SLPGDAVFEH AAPQADTARA 
GKLAQVRRAM HEQGAQWHFV STLDDLAWLF NLRGADVNYN PVFVAHALVG LERATLFVAD 
GKVSAELATS LARDGVDVKP YDAAAAALAA LPEGAGLLID PRRVTYGLLQ AVPQQVRVIE 
AVNPSTFAKS RKTPAEIEHV RATMEHDGAA LAEFFAWFER ALGRETITEL TIDEQLTAAR 
ARRPGYVSPS FATIAGFNAN GAMPHYRATR AAHATIEGDG LLLVDSGGQY LSGTTDITRV 
VPVGAIGDAH RRDFTIVLKA MMALSRARFP RGIRSPMLDA IARAPMWAAG LDYGHGTGHG 
VGYFLNVHEG PQVISHYAPA EPYTAMEEGM ITSIEPGVYR PGNWGVRIEN LVVNRAAGQT 
EFGDFLEFET LTLCPIDTRC VLPALLDDVE RAWLNAYHAT VRERVGKHVS GDARAWLDAR 
TQPI