Gene BURPS668_0238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_0238
Symbol
ID	4883764
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	227738
End bp	228718
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	67%
IMG OID	640126166
Product	ATP-dependent protease domain-containing protein
Protein accession	YP_001057291
Protein GI	126442180
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0466] ATP-dependent Lon protease, bacterial type
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0715483
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGACGG CGATGGTGAA ACAGGAACTG GCGGTGGCTT CGTTCAGCAC GGTCTACGAT 
ATCGAGCGAA TCGAGACGGC GCTGAACGAT CTGAACGAAG GCGCGAGCGA TGCATTGCGC 
GCGACCTACG AGAAGATGCT GAAGACGGGC AATCTGCGCT TTTGCGTGAA GCCGACGCGC 
ATGCCCGCGT TCGATTCGCT CGCGCAGGCG TTGCCGAACT TCGCCGAGCC GCTCGACGAC 
GTGCGCAAGC AGGTGGCGCT GTGCCTCGAA ACCGACGATC GCCTCGAATT GATGCCGATC 
CTGCTGCTCG GCGAGCCGGG CATCGGCAAG ACGCATTTCG CGAAGGCGCT CGCGAAGATG 
CTCGGGACCG CTTACCACTA CGTGCCGATG AGCTCGCTCA CGGCGGGCTG GGTGCTCTCG 
GGCGCGTCGT CGCAGTGGAA GAACGCGAAG CCGGGCAAGG TGTTCGACGC GCTCGTCAAC 
GGCTGCTATT CGAACCCGGT GATCGCGATC GACGAGATCG ACAAGGCGGG CAGCGACGCG 
CAGTACGATC CGCTCGGCGC GCTGTATGCG CTTCTCGAGC ACGACACCGC GAGCGCGTTC 
GTCGACGAAT TCGCCGAGGT GCCGATCGAC GCGGGCAACG TGATCTGGAT CGCGACCGCG 
AACGACGCGA GCGCGATTCC CGAGCCGATC ATGAACCGGA TGAACGTGTA CGAGATCGAG 
CCGCCCGATG CGTCGGGCGC GCGCCGCATC GCGCAGACGA TCTACGGCGA GATCCGCAAC 
GCGCACGCGT GGGGGCAGCG CTTTCCCGCC GCGCTCGGCG ACGACGCGCT CGACGTGCTC 
GCCGCGATGC CGCCGCGCAC GATGCGCCGC GTGCTGCTGC ATGCGTTCGG CGCGGCGCGG 
CTCGACGGGC GGGACGCGGT CGCGCCGCGC GACATCCGCA CCGACGAGAG CGCGGGGCGG 
CGCCGTCCGA TCGGCTTTTG A

Protein sequence

MTTAMVKQEL AVASFSTVYD IERIETALND LNEGASDALR ATYEKMLKTG NLRFCVKPTR 
MPAFDSLAQA LPNFAEPLDD VRKQVALCLE TDDRLELMPI LLLGEPGIGK THFAKALAKM 
LGTAYHYVPM SSLTAGWVLS GASSQWKNAK PGKVFDALVN GCYSNPVIAI DEIDKAGSDA 
QYDPLGALYA LLEHDTASAF VDEFAEVPID AGNVIWIATA NDASAIPEPI MNRMNVYEIE 
PPDASGARRI AQTIYGEIRN AHAWGQRFPA ALGDDALDVL AAMPPRTMRR VLLHAFGAAR 
LDGRDAVAPR DIRTDESAGR RRPIGF