Gene Franean1_5272 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5272
Symbol	clpX
ID	5673606
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6341448
End bp	6342740
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	65%
IMG OID	641244127
Product	ATP-dependent protease ATP-binding subunit ClpX
Protein accession	YP_001509536
Protein GI	158317028
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1219] ATP-dependent protease Clp, ATPase subunit
TIGRFAM ID	[TIGR00382] endopeptidase Clp ATP-binding regulatory subunit (clpX)

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.308962
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.162196
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCACGCA TCGGTGATGG CGGTGACCTG CTCAAGTGCT CCTTCTGCGG TAAGTCTCAG 
AAGCAGGTGA AGAAGCTCAT CGCCGGCCCC GGCGTCTACA TCTGCGATGA GTGCATCGAT 
CTCTGCAACG AGATCATCGA GGAGGAGCTC TCCGAGTCCT CGGAGCTCAA GTGGGAGGAG 
CTCCCGAAGC CCCGGGAGAT CTACGAGTTC CTCGACGGGT ACGTGGTCGG CCAGGAGGCG 
GCGAAGAAGA CGCTGTCGGT GGCCGTCTAC AACCATTACA AGCGGGTGCA GGCGGGCGGT 
GCCTCCGGCG GTGACGCCGG CAAGGGCGAG GTGGAGCTCG CGAAGAGCAA CATCCTGCTG 
CTGGGCCCCA CGGGGTGCGG CAAGACCCTG CTGGCGCAGA CGCTGGCCCG GATGCTGAAC 
GTCCCGTTCG CCATCGCCGA CGCGACCGCG CTCACCGAGG CCGGATATGT CGGCGAGGAT 
GTCGAGAACA TTCTTCTCAA ACTCATCCAG GCCGCCGACT ACGACGTCAA GAAGGCCGAA 
ACCGGCATCA TCTACATCGA TGAGGTCGAC AAGATCGCCC GGAAGTCGGA GAACCCCAGC 
ATCACCCGGG ACGTCTCCGG CGAGGGCGTG CAGCAGGCGC TGCTGAAGAT TCTCGAGGGA 
ACGACGGCGA GTGTCCCGCC GCAGGGCGGC CGCAAGCACC CGCACCAGGA GTTCATTCAG 
ATCGACACGA CGAACGTCCT GTTCATCGTC GGTGGGGCTT TCGCCGGTCT GGACCGCATC 
ATCGAGTCGC GCATCGGCAA GAAGTCGCTG GGGTTCCGCG CGGTGCTGCA CGGCAAGGAC 
GACCCGGACG CCTCGAACGT CTTCGGTGAC ATCATGCCGG AGGACCTCCT CAAGTACGGA 
ATGATCCCGG AGTTCATCGG CCGGCTGCCG ATCATCACCA GCGTCTCCAA CCTCGACCGC 
GAGGCGCTAA TCCGGATCCT CACCGAGCCG AAGAACGCGC TCGTCCGCCA GTACAAGCGG 
CTGTTCGAGC TGGACGGCGT CGACCTCGAC TTCACCACCG ACGCACTCGA GGCCATCGCG 
GACCAGGCCA TCCTGCGCGG GACGGGCGCC CGCGGCCTGC GCGCGATCAT GGAAGAGGTC 
CTGCTCTCGG TGATGTACGA CATCCCGAGC CGTAAGGACG TCGCCCGCGC GGTGATCACC 
CGGGAGGTCG TGCTCGAGCA CGTCAACCCG ACCCTGGTGC CACGCGACGT CGCCGCGTCG 
AAGCGCGGCC CGCGCCAGGA GAAGTCCGCC TGA

Protein sequence

MARIGDGGDL LKCSFCGKSQ KQVKKLIAGP GVYICDECID LCNEIIEEEL SESSELKWEE 
LPKPREIYEF LDGYVVGQEA AKKTLSVAVY NHYKRVQAGG ASGGDAGKGE VELAKSNILL 
LGPTGCGKTL LAQTLARMLN VPFAIADATA LTEAGYVGED VENILLKLIQ AADYDVKKAE 
TGIIYIDEVD KIARKSENPS ITRDVSGEGV QQALLKILEG TTASVPPQGG RKHPHQEFIQ 
IDTTNVLFIV GGAFAGLDRI IESRIGKKSL GFRAVLHGKD DPDASNVFGD IMPEDLLKYG 
MIPEFIGRLP IITSVSNLDR EALIRILTEP KNALVRQYKR LFELDGVDLD FTTDALEAIA 
DQAILRGTGA RGLRAIMEEV LLSVMYDIPS RKDVARAVIT REVVLEHVNP TLVPRDVAAS 
KRGPRQEKSA