Gene BURPS1106A_3181 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3181
Symbol
ID	4903176
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	3096758
End bp	3098605
Gene Length	1848 bp
Protein Length	615 aa
Translation table	11
GC content	66%
IMG OID	640136407
Product	carboxypeptidase C
Protein accession	YP_001067419
Protein GI	126452334
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2939] Carboxypeptidase C (cathepsin A)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.961281
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATAC AGAAGTCCTT GAAAGACGGT TTCACGCTCG GATGGTGCAG GGCGGCACGG 
CCGGTTGCCG CTGCCGCGCT GGCCGCGCTG CTCGTCGCCG CGTGCGGCGG CGACGACGGC 
GGCGGCGGGA GCCCGTCGCT CGCGGCCGCG AACGTCGCGA ACACGAGCAC GCCGACGAAC 
GCGACGACGG CCGCCGATGC GACGACCAAT GCCGCGCTGC CGCCGGATCA GCCGTATATC 
GACAACGACG TCTATGGCAC CGGGCCGAAC GATTCGGTCA GCGACGCGAC GGAGGGCACC 
GCGGTCGTGC ACCGGCAGGT GAAGATCGGC GATCAGATCC TCACCTACAC GGCGACGGCC 
GGCCACCTCG TGACGATCGA TCCGATCACG TCGAAGCCGA ACGCGAAGAT GTTCTACGTC 
GCGTACACGC TCGACAATCC GAACCCGGGC AAGCCGCGCC CCGTCACGTT CTTCTACAAC 
GGCGGCCCGG GCTCGTCGTC GGTGTACCTG CTGCTGGGCT CGTTCGGGCC GAAGCGCCTG 
CAGTCGTCGT TCCCGAACTT CACGCCGCCC GCGCCGTACC GGCTGCGCGA CAACCCCGAG 
AGCCTGCTCG ACCGCTCCGA TCTCGTGTTC ATCAATCCGG TCGGCACCGG CTACTCGGCC 
GCGATCGCGC CGGCGAAGAA CAAGGATTTC TGGGGCGTCG ACCAGGACGC GCACTCGATC 
GACCGCTTCA TCCAGCGCTA CCTGACGAAG TACGCGCGCT GGAACTCGCC GAAGTTCCTG 
TTCGGCGAAT CGTACGGCAC GGCGCGCAGC GCGGTGACCG CGTGGGTGCT GCATGAGGAC 
GGCATCGAGC TGAACGGGAT CACGCTGCAG TCGTCGATTC TCGACTATGC GAACGCGGTG 
AGCGCGATCG GCATCTTCCC GACGCTCGCG GCCGATGCGT TCTACTGGAA CAAGACGACC 
ATCAGCCCGA AACCGGCCGA TCTGGACGCA TACATGGCGC AGGCGCGCAG CTATGCGGAC 
AACGTGCTCG CGCCGCTCGC GCAGGCGCCG AATCCGCAGG ACGGCGGCTT CGTCAACGTG 
CGGCTGAACC TGAACGTCGC GACCGCGCAG CAGATGGGCG CGTACATCGG CACCGATCCG 
ATCTCGCTGG TCCAGACGTT CGGCAATCCG GCCGCGCTCG GCAACGTGCC GTCGTCCAAC 
GACAACCCGC CGTACACGTT CTTCCTGACG CTCGTGCCGG GCATCCAGAT CGGCCAGTAC 
GACGGACGCG CGAACTACAC GGGCAAGGGC ATCGCGCCGT ACATCCTGCC GAACTCGGGC 
AGCAACGATC CGTCGATCAG CAACGTCGGC GGCGCGTACA CGGTGCTGTG GAACGACTAC 
ATCAACAACG ACCTGAAGTA TGTGTCGACG TCGTCGTTCG TCGATCTGAA CGACCAGGTG 
TTCAACAACT GGGACTTCAG CCACACGGAC CCGACGGGCG CGAACCGCGG CGGCGGCAAC 
ACGCTGTACA CGGCGGGCGA TCTCGCCGCG ACGATGAGCC TGAACCCGGA CCTGAAGGTG 
CTGTCGGCGA ACGGCTATTT CGACGCGGTG ACGCCGTTCC ACCAGACCGA GCTCACGCTC 
GCGCAGATGC CGCTCGATCC GTCGCTGAAG TCGGCGAACC TGACGATGAA ATACTATCCG 
TCGGGCCACA TGATCTATCT GAACGATCAC TCGCGGATCG CGATGAAGGC GGATCTGGCG 
ACGTTCTACG ACGGCATCCT CGCGGACCGC ACGGCGATGC GGCGCGTGCT GCTGCGCCAG 
CAGAAGGCGC TGCAGTTGAA GCAGCAGAAG CAACAGCAAG GGCAGTGA

Protein sequence

MKIQKSLKDG FTLGWCRAAR PVAAAALAAL LVAACGGDDG GGGSPSLAAA NVANTSTPTN 
ATTAADATTN AALPPDQPYI DNDVYGTGPN DSVSDATEGT AVVHRQVKIG DQILTYTATA 
GHLVTIDPIT SKPNAKMFYV AYTLDNPNPG KPRPVTFFYN GGPGSSSVYL LLGSFGPKRL 
QSSFPNFTPP APYRLRDNPE SLLDRSDLVF INPVGTGYSA AIAPAKNKDF WGVDQDAHSI 
DRFIQRYLTK YARWNSPKFL FGESYGTARS AVTAWVLHED GIELNGITLQ SSILDYANAV 
SAIGIFPTLA ADAFYWNKTT ISPKPADLDA YMAQARSYAD NVLAPLAQAP NPQDGGFVNV 
RLNLNVATAQ QMGAYIGTDP ISLVQTFGNP AALGNVPSSN DNPPYTFFLT LVPGIQIGQY 
DGRANYTGKG IAPYILPNSG SNDPSISNVG GAYTVLWNDY INNDLKYVST SSFVDLNDQV 
FNNWDFSHTD PTGANRGGGN TLYTAGDLAA TMSLNPDLKV LSANGYFDAV TPFHQTELTL 
AQMPLDPSLK SANLTMKYYP SGHMIYLNDH SRIAMKADLA TFYDGILADR TAMRRVLLRQ 
QKALQLKQQK QQQGQ