Gene BURPS668_A1849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1849
Symbol
ID	4888751
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	1803837
End bp	1805165
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	76%
IMG OID	640131787
Product	L-aminopeptidase/D-esterase
Protein accession	YP_001062844
Protein GI	126443833
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3191] L-aminopeptidase/D-esterase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCGCGC GCACATCGGG CCGGGCGGAT GCGGCTGAGG CGCTCGACGC CGCCGATGCC 
GCGCCGCACG TCGGCGCGCT GCCGGCCGGG CCGCTTCGCA GCATTGCCGA CGTCGCCGGC 
GTGACGGTCG GCCACGCGAC GCTCGACGCG CGCGGCGTGC AGACCGGCGT GAGCGTCGTG 
CGGCCGCACG CGGGCGACGT CTATCGCGAC AAGGTGCCCG CCGCGGCCGC GGTGATCAAC 
GGCTTCGGCA AGAGCATCGG GCTCGTGCAG GTCGACGAGC TCGGCGTGCT GGAGACGCCG 
CTCGCGCTGA CGAACACGTT CGGCGTCGGC GCGCTCGCGC AAGCGCAGAT CCGCGCGGCG 
ATCGATGCGA ATCCGCAGAT CGGCCGCGCG TGGCCGAGCG TCAATCCGCT CGTGTTCGAA 
TGCAACGACG GCTATCTGAA CGACCTGCAC GCGTTCGCGG TGACGCCCGC GCATTACGCG 
CAGGCGCTCG CCGATGCGCG GCGCGCGTTC GCGCGCGGCG CGGTGGGCGC GGGGCGGGGG 
ATGTCGTGCT TCGACCTGAA GGGCGGGATC GGCTCGGCGT CGCGCGTCGT ACGCGCGGCG 
GGCGAAGCGT GGACGGTGGG CGCGCTCGTG CTCGCGAACT TCGGGCGATT GCCGATGCTG 
ACGATCGCCG GCGTGCCGGT GGGGCGGATG ATCGCCGAGC GGGATGCGGG CGGCGCGCCC 
GGGGCGGCCG GCGGACAGGG CGCGGACGGC GCGCGGGATG ATGTCGCGGC GGCGGGCGCG 
AGGGGCGAGA GGGGCGAGAG GGGCGATGGG CCGCATGGGA CATACGGGGC GCACGGCCGC 
GAGAATGCCG GCACGGGCGG CGGTGCGGCC GGCGGCCTCG CGCCGCGCCG CGCGCGCGAC 
GCCGGCGCTT CCTCGCCGGA CGCAGCGCCG GACGCTGCGC CGCCCGAACA AGGCTCGATC 
ATCATGCTCG TCGCCACCGA TGCGCCGCTG TCGTCGCGGC AACTGAAGCG CGTCGCGCTG 
CGCGCGGCCG CGGGCCTCGC GCGCACGGGC TCGGTGTACG GCCACGGCAG CGGCGACATC 
GCGCTTGCGT TCTCGACCGC GTACACGGTG CCGCACGGCG CCGAGCGCGT CTCGCTGCCG 
GCGCTTGTCG CGGATGCGGC GCTCGATCCG CTGTTCGCCG CGGCGGCCGA CAGCGTCGAG 
CAGGCGATCG TCGACGCGCT GTGGCGCGCG ACGCGCGTCA CCGGCCGCGA CGGTCACACA 
CGGCGCGCGT TGCGCGACGC CGCGCCGGAA CTCGAACGAT GGTTGCGCGC GGCGCGCGCG 
GGAGCATGA

Protein sequence

MRARTSGRAD AAEALDAADA APHVGALPAG PLRSIADVAG VTVGHATLDA RGVQTGVSVV 
RPHAGDVYRD KVPAAAAVIN GFGKSIGLVQ VDELGVLETP LALTNTFGVG ALAQAQIRAA 
IDANPQIGRA WPSVNPLVFE CNDGYLNDLH AFAVTPAHYA QALADARRAF ARGAVGAGRG 
MSCFDLKGGI GSASRVVRAA GEAWTVGALV LANFGRLPML TIAGVPVGRM IAERDAGGAP 
GAAGGQGADG ARDDVAAAGA RGERGERGDG PHGTYGAHGR ENAGTGGGAA GGLAPRRARD 
AGASSPDAAP DAAPPEQGSI IMLVATDAPL SSRQLKRVAL RAAAGLARTG SVYGHGSGDI 
ALAFSTAYTV PHGAERVSLP ALVADAALDP LFAAAADSVE QAIVDALWRA TRVTGRDGHT 
RRALRDAAPE LERWLRAARA GA