Gene BURPS1106A_0827 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0827
Symbol
ID	4899467
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	810246
End bp	812015
Gene Length	1770 bp
Protein Length	589 aa
Translation table	11
GC content	73%
IMG OID	640134057
Product	hypothetical protein
Protein accession	YP_001065108
Protein GI	126454072
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCAAG CTCCATCGAA CCATCACGCG GTGGCCGCCA GATCCTTGTC CATGCGCGTC 
AAATCGTCGT TTGCCGTCCT GCTGTGCGCG GCGCTCGCCT TGCCGCCCGG CGGCCACGCG 
CAGTCGCGCG GCGATGCGCC GCCGCTCGAA TCCGCGCGCG CCGCCGGCGC CGAGGACGCC 
GCGGCGCGCG CGCGCGATGC GCTGTCCACG GTGCCGTCCG GCATCGCGCC CGGCGTGTTC 
GGCATGTACG GCGGCGCGCA GAGCCGGCTT GCCGATCCGG CGTCGGGCAC GCCCAGTTTG 
CGCGCGCCGC TTCGCTCGTT GCAACTGCCC GATCTCGGCG ACGGCTCGGG CGGCTCGCTG 
ACGCCGCAAG CGGAGCGCCG GCTCGGCGAG CGCGTGATGC GCGAGGTGCG GCGCGATCCC 
GACTATCTCG ACGACTGGCT CGTGCGCGAC TACCTGAATT CCGTCGCGGC GAAGCTCTCC 
GCGGCCGCCG CCGCGCAGTT CATCGGCGGC TACATGCCCG ATTTCGAGCT GTTCGCGATG 
CGCGATCCGC AGATCAACGC GTTCTCGCTG CCGGGCGGTT TCATCGGCAT CAACAGCGGG 
CTCGTCGCGG CGACGCAGAC GGAGTCCGAA CTCGCGTCGG TGATTGGCCA CGAGATGGGG 
CATGTGCTGC AGCGGCACAT CGCGCGGATG ATCGGCGCGA GCGAGAAGAG CGGCTATGCG 
GCGCTCGCGA CGATGCTGTT CGGCGTGCTC GCGGGCATTC TCGCGCGCAG CGGCGATCTC 
GGCAGCGCGA TCGCGATGGG CGGCCAGGCG TTCGCGGTCG ACAGCCAGCT CAGGTTCTCG 
CGCTCGGCCG AGCGCGAGGC GGACCGCGTC GGCTTCCAGT TGCTCGCGGG CGCCGGCTAC 
GATCCGTACG GCATGCCGGG CTTCTTCGAG CGGCTCGAGC GTGCGTCGGT GGGCGACGCG 
GGCGTGCCCG CGTACGCGCG CACGCACCCG CTGACGGGCG AGCGGATCGC CGACATGGAC 
GACCGCGCGC GGCGCGCGCC GTACCGGCAG CCGCGGCAAT CGGCGGAATA CGGTTTCGTG 
CGCGCGCGCC TGCGGATGCT GCAGAACCGC GCGCCGACCG ATTACGCGAA CGAGGCAAGA 
CGAATGCGCG CGGAGCTCGA CGATCGCGTC GCGCCGAATG TCGCGGCGAA CTGGTATGGG 
ATCGCGCTCG GCGAGATGCT GGGCGGCCGC TACGATGACG CGGACCGCGC GCTCGCCGCA 
GCGCGCGATG CGTTCGCGCG CACGGCCGCG CGCGAGGGCG AGGCGGCGCG CACTTCGCCG 
AGCCTCGACG TGCTCGCCGC GGAGATCGCG CGTCGCGCCG GCCGCGGGGA CGACGCGGTG 
CGGCTCGCCG CCGCCGCGCA GGCGCGCTGG CCGGGTTCGC ACGCGGCTAT CGCCGCGCAT 
TTGCAGGCGC TTCTCGCCGC GCGGCGTTAC GGGCAGGCGC AGGCGCTCGC ACAAGCGGAG 
GCGAACGCGG CCCCCCGCCA GCCCGATTGG TGGAACTATC TCGCGCAGGC GAGCCTCGGC 
CGGGGCGATG CGCTCACGCA GCGCCGCGCG CTCGCGGAGA AGTTCGCGCT CGAAGGCGCG 
TGGCCGTCGG CGATCCGGCA ACTGCGCGAG GCGCGCGATC TCAAGTCGGC CGGTTTCTAC 
GAGCAATCGA TCATCAGCGC GCGGCTGCAC GAATTCGAGG CACGCTACAA GGAAGAGCGG 
GAAGAGGACA AGGACGATCG GCGCGGTTGA

Protein sequence

MTQAPSNHHA VAARSLSMRV KSSFAVLLCA ALALPPGGHA QSRGDAPPLE SARAAGAEDA 
AARARDALST VPSGIAPGVF GMYGGAQSRL ADPASGTPSL RAPLRSLQLP DLGDGSGGSL 
TPQAERRLGE RVMREVRRDP DYLDDWLVRD YLNSVAAKLS AAAAAQFIGG YMPDFELFAM 
RDPQINAFSL PGGFIGINSG LVAATQTESE LASVIGHEMG HVLQRHIARM IGASEKSGYA 
ALATMLFGVL AGILARSGDL GSAIAMGGQA FAVDSQLRFS RSAEREADRV GFQLLAGAGY 
DPYGMPGFFE RLERASVGDA GVPAYARTHP LTGERIADMD DRARRAPYRQ PRQSAEYGFV 
RARLRMLQNR APTDYANEAR RMRAELDDRV APNVAANWYG IALGEMLGGR YDDADRALAA 
ARDAFARTAA REGEAARTSP SLDVLAAEIA RRAGRGDDAV RLAAAAQARW PGSHAAIAAH 
LQALLAARRY GQAQALAQAE ANAAPRQPDW WNYLAQASLG RGDALTQRRA LAEKFALEGA 
WPSAIRQLRE ARDLKSAGFY EQSIISARLH EFEARYKEER EEDKDDRRG