Gene BURPS668_0373 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_0373
Symbol
ID	4885051
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	341575
End bp	343266
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	68%
IMG OID	640126301
Product	serine carboxypeptidase family protein
Protein accession	YP_001057426
Protein GI	126438747
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2939] Carboxypeptidase C (cathepsin A)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.250878
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATGGAG GGTATGGCGG CCTCGCGCGC CCGCGCGGCC GGATGCCGGC GACGGCCGCC 
GTTGCCGCCG CGTTGCTGCT CGCGCTCGGC GGGTGCGGCG ACGATCTGCA GAGCACCACG 
ACGCCCGCGC AGCTCAATCA ACCGTACACG GACACGACCG CGTATTCGCC GAAGGCGGGC 
GATGGGCTGC CGGCGTCGCA GGTATCCGAA CGCGCCGCGG TGATGAGCCA CCAGTGGACG 
GCGAACGGCG CGAGCGTCGA TTACCTGACG ACGACCGGCC ACCTGACGGC CACCGATCCG 
AACGGCAACG CGGAGGCGAC GATGTCGTAC GTCGCGTATA CGGCGCCGAG CCGCGACGGC 
TCGCCGCGGC CCGTCACGTT CTTCTACAAC GGGGGGCCGG GCTCGTCGTC GGTGTGGCTG 
CGGCTCGGCT CGTTCGCGCC GACGCGGGTC GCGACGCCCG ATCCGCTGAT GACGAACTGG 
CCGAATTTCC CGCTCGTCGA CAACCCGGAG AGCCTGATCG CGACCACCGA CATGGTGTTC 
ATCGATCCGC CGGGCACGGG CCTGTCGGAG GCGATCCAGC CGAACACGAA CCAGACGTTC 
TGGGGAGCGG ACGCCGACGT GAAGGTGATG CGCGATTTCA TTCGCCGCTA CCTGTCGGTC 
AACGGCCGCG GCGGCTCGCC GATCTATCTG TACGGCGAAT CGTACGGCAC GCCGCGCACG 
GACATGCTCG CGCTCGCGCT CGAATCGGCG GGCGTGCCGC TCACGGGCAT CGTGCTGCAG 
TCGTCGATCC TGAACTACAT GGCGGCCGCG GGCGACCAGG CGGTGGGCAC CTTCCCGTCG 
TACGCGCAGG TGGCCGCATA CTTCAACCAG GTGTCGCCGT CGCCGACGAA TCTGGGCGCG 
TACGCGCAGC GCATCGAGAA TTTCGTGACC GCGCAGTACG CGCCGATCGT GCATTACGCG 
ACGGCTTCGT CGCCGATCTC GCCGGACGCC GGCACGCTCG CCGCGTGGTC GTCGCAAACG 
GGCATGGCCA CCGCGTCGAT CGGCGCGTAC TTCCAGTATT TCTACGATAC GGAGCCGTCG 
CCCGGCCAGA CGACGCTCGT GCCCGGCTAC ACGATCGGCC GCTACGACGG CCGCGTGTCG 
CTGCCGAACG GCGACGCGCG CCTCGCGAGC GACGACGATC CGTCCGATAT CCTGATCTCG 
AAGCCGTTCA CGAGCGCGCT CGCGTCGCAG ATGCCGAACT ACCTCGGCTA CACCGCGCCG 
AACGCGACGT ATCAGACGCT CAATCCCGAC ATCATCGGCG TGTGGAACTT CAGCCACGCG 
GGCCAGCCGT ATCCGGACAC GATCCCGGAT CTGCTTGCCG CGCTGCAACT GAATCCGAAG 
CTGAAGGTGC TCGCGTCGAA CGGCTATCAT GATCTCGCGA CGCCGTACTT CGAAACGGAG 
AAGGAGCTCG CGCGGCTGCA GACGGTGTCC GGCCTCGCGC CGAATCTGCA GGTGACGTTC 
TACCAGGGCG GCCACATGAT CTATCTCGAC GACGTCGCGA GGCCGCAGAT GCAGGCGGAT 
CTCGTCGCGT TCTACCAGAA CCGGCCGGTG GCAAACGCGT TGACGCTCGC GGCGCTGCCG 
TCGCCGTGGC CCGACGAAAG CCCGGCGAAC ACGCCGACGG CGAAGATCGC GCGGGCCGCC 
GCGGCCCGCT GA

Protein sequence

MHGGYGGLAR PRGRMPATAA VAAALLLALG GCGDDLQSTT TPAQLNQPYT DTTAYSPKAG 
DGLPASQVSE RAAVMSHQWT ANGASVDYLT TTGHLTATDP NGNAEATMSY VAYTAPSRDG 
SPRPVTFFYN GGPGSSSVWL RLGSFAPTRV ATPDPLMTNW PNFPLVDNPE SLIATTDMVF 
IDPPGTGLSE AIQPNTNQTF WGADADVKVM RDFIRRYLSV NGRGGSPIYL YGESYGTPRT 
DMLALALESA GVPLTGIVLQ SSILNYMAAA GDQAVGTFPS YAQVAAYFNQ VSPSPTNLGA 
YAQRIENFVT AQYAPIVHYA TASSPISPDA GTLAAWSSQT GMATASIGAY FQYFYDTEPS 
PGQTTLVPGY TIGRYDGRVS LPNGDARLAS DDDPSDILIS KPFTSALASQ MPNYLGYTAP 
NATYQTLNPD IIGVWNFSHA GQPYPDTIPD LLAALQLNPK LKVLASNGYH DLATPYFETE 
KELARLQTVS GLAPNLQVTF YQGGHMIYLD DVARPQMQAD LVAFYQNRPV ANALTLAALP 
SPWPDESPAN TPTAKIARAA AAR