Gene BURPS1710b_A1728 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A1728
Symbol
ID	3694472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	+
Start bp	2107168
End bp	2108478
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	70%
IMG OID	637731981
Product	proline iminopeptidase
Protein accession	YP_336884
Protein GI	76818974
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID	[TIGR01249] proline iminopeptidase, Neisseria-type subfamily

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGCGCGG CGTTCGCCAC GCATGCGCGC GCGCGTCGAG CCGGCGCCCG CGCGCGCAAG 
CATTCATGCA TGCATCCATG CGGCGATGCA TTCGTGCGCG CCTTCGGCAG TCGACGCGCC 
ACGCCGCGCC GCGACGAACG GCGCGCGAGG CGGCCGGGCG GCGGCTCGGC CACCTCCGTG 
CAAGCGCGTC CCCGCGTTTT CCGGCGACTC GGCATAATGA AGCGTCGCTT TCGTCGCCGG 
CGCCGCATCG GCGCGAGCCA ACGCGGCCGG CGCATCGCAT GGGGCGCACG CATGCGCCGC 
GCGGCCGTTC CATTCATCGC GTTCGGCGAG GCACCCCCAG TCGTCTTCTT CCATTCAACC 
GGAGCGTCTC TCTTGTATCC ACCGATCGAA CCTTATGCAC ACGGCTTCCT CGATACCGGC 
GACGGCCATC GCGTGTACTG GGAGCTGTGC GGCAACCCCA ACGGCAAGCC GGCCGTCTTC 
CTGCACGGCG GCCCCGGCAG CGGCTGCAGC GCCGATCACC GTCGCCTCTT CGATCCCGCG 
CGCTACAACG TGCTGCTGTT CGACCAGCGC GGCTGCGGCC GCTCGACGCC GCACGCGAGC 
CTCGAGAACA ACACGACATG GCATCTCGTC GACGACATCG AGCGGCTGCG CGCGATGATC 
GGCGTCGAGC GCTGGCTCGT GTTCGGCGGC TCGTGGGGCA GCGCGCTCGC GCTCGCATAT 
GCGCAAACGC ACCCGGCGCG CGTGGCCGAG CTCGTCGTGC GCGGCATCTT CACGGTGCGC 
CGGTCCGAGC TGCTCTGGTA CTACCAGGAA GGCGCGTCGT GGCTGTTCCC GGATCTGTGG 
GAAGACTTCA TCGCGCCCAT TCCGAGCGCC GAGCGCGCGG ATCTGATCGC CGCGTATCGC 
CGCCGGCTGA CGGGCGACGA CGAGGCGGCC AAGCGCGAGG CCGCGCGCGC GTGGAGCGTC 
TGGGAGGGCC GGACGATCGC GCTGCTGCCG AACGCCGCGC ACGAAACGTA TTTCGGCGAC 
GCGCATTTCG CGCTCGCGTT CGCCCGCATC GAAAACCACT ACTTCGTTCA TCAAGGCTTC 
ATGGAAGACG GGCAGTTGCT GCGCGATGCG CATCGTCTCG CGGACATCCC GGGCGTGATC 
GTTCAGGGGC GCTACGACGT CGCGACGCCG GCGCGCACCG CGTGGGAACT CGCGAAGGCG 
TGGCCGCGCG CGTCGCTCGA GATCGTGCCC GACGCGGGGC ACGCATACGA CGAGCCGGGC 
ATTCTGCGCG CGCTGATCGC GGCGACCGAC CGCTTCGCGC GCGAGCGCTG A

Protein sequence

MRAAFATHAR ARRAGARARK HSCMHPCGDA FVRAFGSRRA TPRRDERRAR RPGGGSATSV 
QARPRVFRRL GIMKRRFRRR RRIGASQRGR RIAWGARMRR AAVPFIAFGE APPVVFFHST 
GASLLYPPIE PYAHGFLDTG DGHRVYWELC GNPNGKPAVF LHGGPGSGCS ADHRRLFDPA 
RYNVLLFDQR GCGRSTPHAS LENNTTWHLV DDIERLRAMI GVERWLVFGG SWGSALALAY 
AQTHPARVAE LVVRGIFTVR RSELLWYYQE GASWLFPDLW EDFIAPIPSA ERADLIAAYR 
RRLTGDDEAA KREAARAWSV WEGRTIALLP NAAHETYFGD AHFALAFARI ENHYFVHQGF 
MEDGQLLRDA HRLADIPGVI VQGRYDVATP ARTAWELAKA WPRASLEIVP DAGHAYDEPG 
ILRALIAATD RFARER