Gene BURPS1710b_0433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_0433
Symbol	lon1
ID	3688198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	+
Start bp	445202
End bp	446182
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	67%
IMG OID	637726889
Product	ATP-dependent protease domain-containing protein
Protein accession	YP_331847
Protein GI	76809259
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0466] ATP-dependent Lon protease, bacterial type
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.216154
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGACGG CGATGGTGAA ACAGGAACTG GCGGTGGCTT CGTTCAGCAC GGTCTACGAT 
ATCGAGCGAA TCGAGACGGC GCTGAACGAT CTGAACGAAG GCGCGAGCGA TGCATTGCGC 
GCGACCTACG AGAAGATGCT GAAGACGGGC AATCTGCGCT TTTGCGTGAA GCCGACGCGC 
ATGCCCGCGT TCGATTCGCT CGCGCAGGCG TTGCCGAACT TCGCCGAGCC GCTCGACGAC 
GTGCGCAAGC AGGTGGCGCT GTGCCTCGAG ACCGACGATC GCCTCGAATT GATGCCGATC 
CTGCTGCTCG GCGAGCCGGG CATCGGCAAG ACGCATTTCG CGAAGGCGCT CGCGAAGATG 
CTCGGGACCG CTTACCACTA CGTGCCGATG AGCTCGCTCA CGGCGGGCTG GGTGCTCTCG 
GGCGCGTCGT CGCAGTGGAA GAACGCGAAG CCGGGCAAGG TGTTCGACGC GCTCGTCAAC 
GGCTGCTATT CGAACCCGGT GATCGCGATC GACGAGATCG ACAAGGCGGG CAGCGACGCG 
CAGTACGATC CGCTCGGCGC GCTGTATGCG CTTCTCGAGC ACGACACCGC GAGCGCGTTC 
GTCGACGAAT TCGCCGAGGT GCCGATCGAC GCGGGCAACG TGATCTGGAT CGCGACCGCG 
AACGACGCGA GCGCGATTCC CGAGCCGATC ATGAACCGGA TGAACGTGTA CGAGATCGAG 
CCGCCCGATG CGTCGGGCGC GCGCCGCATC GCGCAGACGA TCTACGGCGA GATCCGCAAC 
GCGCACGCGT GGGGGCAGCG CTTTCCCGCC GCGCTCGGCG ACGACGCGCT CGACGTGCTC 
GCCGCGATGC CGCCGCGCAC GATGCGCCGC GTGCTGCTGC ATGCGTTCGG CGCGGCGCGG 
CTCGACGGGC GGGACGCGGT CGCGCCGCGC GACATCCGCA CCGACGAGAG CGCGGGGCGG 
CGCCGTCCGA TCGGCTTTTG A

Protein sequence

MTTAMVKQEL AVASFSTVYD IERIETALND LNEGASDALR ATYEKMLKTG NLRFCVKPTR 
MPAFDSLAQA LPNFAEPLDD VRKQVALCLE TDDRLELMPI LLLGEPGIGK THFAKALAKM 
LGTAYHYVPM SSLTAGWVLS GASSQWKNAK PGKVFDALVN GCYSNPVIAI DEIDKAGSDA 
QYDPLGALYA LLEHDTASAF VDEFAEVPID AGNVIWIATA NDASAIPEPI MNRMNVYEIE 
PPDASGARRI AQTIYGEIRN AHAWGQRFPA ALGDDALDVL AAMPPRTMRR VLLHAFGAAR 
LDGRDAVAPR DIRTDESAGR RRPIGF