Gene BURPS668_A0845 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A0845
Symbol
ID	4888124
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	823829
End bp	824983
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	66%
IMG OID	640130785
Product	peptidase family protein
Protein accession	YP_001061844
Protein GI	126444104
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.292004
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTGGATCA CGCTCTCCGA GCCCGCCCTG CGCGAGCTGC GCGCGCTCGA TCCCGCCGTA 
ACGAGCCGCT ACAGCGCGGC GCTCGCCACC GGCGACGCGA AGCGCACCGA AACGATCCAC 
GTCGCGCAGG TCGACGATTC GCTGCTCGAA TCGCTGTCAC AGGCGATCCG CCGCGCGCGC 
GGCCACGGCC CGGGCTTTTT CGTGCATGCG ACGTTCGACG AAGCGCGCGC GTCGCTACAG 
CCGAGCGCGG CGAAGCAGGC GGCCGCGATC GATTACCCGA TCACCTACTC GCAACAGGTC 
CGCAACTGGA TCTCGCAACT GCAGGCGAGC AACATCGTCA GCACCATCGT CTCGCTGTCC 
GGCTTCACGA ACCGCTACTA CACGACGACG CACGGCGTGG CCGCGTCCGA CTGGATCGCG 
CAGCAATGGA AGCAGTTGGC CGGCTCGCGC ACCGACGTGA CGGTCGAGCA GTTCACGCAT 
GCCGGCTGGC CGCAGAAATC GGTGATCCTG ACGATCAAGG GCAGCGATCC GGCCGCGGGC 
GTCGTCGTGA TCGGCGGCCA TCTCGATTCG ACCGTCGGCC GCATGAGCGA GAACACGCGC 
GCGCCCGGCG CGGACGACGA CGCATCCGGC ATCGCAAGCC TCACCGAGGC GCTGCGCGTG 
CTGCTCGCGA ACCGCTACCA GCCGAAGCGC ACGCTCAAGT TCATCGGCTA CGCGGCGGAA 
GAGGCGGGCC TTCTCGGCTC GCAGGCGATC GCGAAGCAGT TCAGGGCGCA GAACGTGAAC 
GTCGTCGGCG CGTTCCAGCT CGACATGACG AACTACAAGG GAGATCCGAA GGATATCTAT 
CTGATCGGCG ACTACACGAA CGCGACACAG AACACGTACC TCGCGAACCT CGCGAAAGCG 
TATCTGCCCG AGCTCGCGGT CGGCACGTCG CAATGCGGCT ATGCGTGCTC CGATCACGCG 
TCGTGGAACG CGCAGGGCTA TCCGGCGTCG TTCCCGTTCG AAGCGGATCA GAACGACAAT 
CCGTACATCC ATTCCGCGTA TGACACGCTC GAGCGGTCGG ACTCGCAAGG CAACCACGCG 
CTGAAGTTCA GCAAGCTCGC GCTCGCATAC GCGGCGGAGC TGGGCGGCGG GCTGAGCGCG 
TCCGCGAAGC GGTAA

Protein sequence

MWITLSEPAL RELRALDPAV TSRYSAALAT GDAKRTETIH VAQVDDSLLE SLSQAIRRAR 
GHGPGFFVHA TFDEARASLQ PSAAKQAAAI DYPITYSQQV RNWISQLQAS NIVSTIVSLS 
GFTNRYYTTT HGVAASDWIA QQWKQLAGSR TDVTVEQFTH AGWPQKSVIL TIKGSDPAAG 
VVVIGGHLDS TVGRMSENTR APGADDDASG IASLTEALRV LLANRYQPKR TLKFIGYAAE 
EAGLLGSQAI AKQFRAQNVN VVGAFQLDMT NYKGDPKDIY LIGDYTNATQ NTYLANLAKA 
YLPELAVGTS QCGYACSDHA SWNAQGYPAS FPFEADQNDN PYIHSAYDTL ERSDSQGNHA 
LKFSKLALAY AAELGGGLSA SAKR