Gene Tery_0584 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_0584
Symbol	clpX
ID	4244610
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	936923
End bp	938272
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	42%
IMG OID	638105888
Product	ATP-dependent protease ATP-binding subunit ClpX
Protein accession	YP_720501
Protein GI	113474440
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1219] ATP-dependent protease Clp, ATPase subunit
TIGRFAM ID	[TIGR00382] endopeptidase Clp ATP-binding regulatory subunit (clpX)

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTAAAT ACGACTCCCA TCTAAAATGT TCATTCTGTG GCAAGTCTCA AGAGCAGGTT 
AGGAAATTGA TAGCTGGACC TGGAGTTTAT ATATGTGATG AATGTGTAGA GTTGTGCAAT 
GAGATTTTGG ATGAGGAGCT TTTTGACTCC AATGCTACAG GAGCACAACC ACCAATACCA 
CGTCCAGCAC CAGCACCCCA AAAACGAGGG ACTGGTACTA AGAGATTATC TATTAGTCAA 
ATACCTAAGC CTAGGGAAAT AAAGAATTAT CTGGATGCTC ATGTTATTGG TCAGGAGGAA 
GGTAAGAAGG TTTTATCAGT GGCAGTTTAT AACCACTATA AACGTCTGAG TTTTCTAGAG 
GCCAAAAAAA GTGGTAAGTC CTCTCAAGAT GAGGTGGAAT TACAAAAGTC TAATATTTTG 
TTGATTGGGC CCACAGGTTG TGGAAAAACG TTGTTGGCTC AAACTTTGGC GGATTTATTG 
GATGTGCCTT TTGCCGTGGC AGATGCGACG ACTTTAACTG AAGCTGGATA TGTTGGGGAG 
GACGTGGAGA ATATTTTGCT ACGACTTTTA CAAGTAGCAG ATTTAGAAGT GGATGAAGCA 
CAACGGGGAA TTATATATAT TGATGAGATT GATAAAATAG CTCGTAAGAG TGAGAACCCT 
TCTATAACAA GAGATGTTTC TGGGGAGGGT GTGCAGCAAG CCTTATTAAA GATGTTGGAG 
GGAACTGTTG CTAATGTTCC TCCACAAGGT GGTCGGAAAC ATCCCTATCA AGATTGTATT 
CAGATCGATA CGAGTAATAT TTTATTTATC TGTGGTGGTG CTTTTGTTGG TTTAGAAAAG 
ATAGTAGATC AAAGAATTGG TAAAAAGTCA ATGGGCTTTA TTCACCAGAG TGGGGACAGT 
TATCAGGTTA AGGAGAAAAA AGTTGTAGAT TTAATGAAGC AAATGGAACC AAATGATTTG 
GTGAAGTTTG GTTTGATCCC AGAATTGATT GGGCGAATAC CTATGGTGGC TGTCGTTGAA 
CCTCTCGATG AGGAGACTCT GATGGCAATT TTGACGAAAC CTCAGAATGC TCTGGTGAAG 
CAGTATCAAA AGCTGTTACG GATGGATAAT GTGAAGTTGG AGTTTGAGGA GGATGCTGTA 
CGGGCGATCG CGAAGGAAGC ATTTAGGAGA AAGACTGGGG CGCGAGCTTT GCGGGGTATT 
GTTGAGGAGT TGATGTTGGA TGTGATGTAT GAGCTACCAT CACGGAAGGA TGTGAGTCGT 
TGCACTATTA CTAAGGAAAT GGTGGAAAAG CGATCAACTG CAGAGTTGTT ATTGCATCCT 
TCGTCTTTGC CTAAACCGGA GTCAGCTTAA

Protein sequence

MSKYDSHLKC SFCGKSQEQV RKLIAGPGVY ICDECVELCN EILDEELFDS NATGAQPPIP 
RPAPAPQKRG TGTKRLSISQ IPKPREIKNY LDAHVIGQEE GKKVLSVAVY NHYKRLSFLE 
AKKSGKSSQD EVELQKSNIL LIGPTGCGKT LLAQTLADLL DVPFAVADAT TLTEAGYVGE 
DVENILLRLL QVADLEVDEA QRGIIYIDEI DKIARKSENP SITRDVSGEG VQQALLKMLE 
GTVANVPPQG GRKHPYQDCI QIDTSNILFI CGGAFVGLEK IVDQRIGKKS MGFIHQSGDS 
YQVKEKKVVD LMKQMEPNDL VKFGLIPELI GRIPMVAVVE PLDEETLMAI LTKPQNALVK 
QYQKLLRMDN VKLEFEEDAV RAIAKEAFRR KTGARALRGI VEELMLDVMY ELPSRKDVSR 
CTITKEMVEK RSTAELLLHP SSLPKPESA