Gene RSc1044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSc1044
Symbol
ID	1219853
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ralstonia solanacearum GMI1000
Kingdom	Bacteria
Replicon accession	NC_003295
Strand	+
Start bp	1098911
End bp	1100047
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	68%
IMG OID	637237407
Product	putative protease transmembrane protein
Protein accession	NP_519165
Protein GI	17545763
COG category	[O] Posttranslational modification, protein turnover, chaperones [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0616] Periplasmic serine proteases (ClpP class)
TIGRFAM ID	[TIGR00706] signal peptide peptidase SppA, 36K type

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.163907
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGATC CGACCCCGCC GAAATCGCCG GAAGAAGGCG CCGGCAAGCC CGATGAACTG 
GAATTCACGC ACCAGGCGGA CCATCCGCTG GAGGCCGAGC TGCGAGATGC CGCTGCCGGC 
AAGCCGGCGT CCAGGCCCGG TCTGTTCGGC CGCTTCCGAC ATGGCGAGAG CGGCGCGCCG 
CGCGCATCGG GCGCCCCCGC CGGCTGGGAG CGCGACGTAC TCGAGCGCGT CCTCCTGGCG 
GCGATCCGCG AGCAGCGCGC CGCCCGCCGC TGGCGCATCT TTTTCCGCTT CGTGACGCTG 
GGCATCATCG GCGGGCTGCT GTATCTGTTC GCCAGCTTCG AGGGCGAGAC CGTCAGCTCC 
GGCCGCCACA CCGCGCTGGT GACGCTCGAT GGCGAGATCG CCGCCAACAC CAACGCCAGC 
GCCGACAACA TCAACGCCTC GCTGGAAGCC GCGTTCGCCG ACGACAACAC CGCCGGGGTG 
ATCCTCAAGA TCAACTCGCC GGGCGGCTCG CCGGTGCAGG CCGGCATGAT CAACGACGAC 
ATCCGCCGCC TGCGCGCCAA GTACAAGAAC ATCCCGCTGT ATGTGGTGGT CGAGGAGATG 
TGCGCCTCGG GCGGCTACTA CGTGGCCGCC GCCGCCGACA AGATCTATGT CGACAAGGCC 
AGCATCGTCG GCTCGATCGG CGTGCTGATG GACGGCTTCG GCTTCACCGG CCTGATGGAC 
AAGCTGGGTG TGGAGCGGCG TCTGCTGACG GCCGGTACCA ACAAGGGCAT GCTCGACCCG 
TTCTCGCCGG TGGCCCCGCA GCAGCGGCAA TTCGCCCAGG CGATGCTCGA CGAGGTGCAC 
CAGCAGTTCA TCGATGTGGT CAAGCAGGGG CGCGGCAGCC GCCTGAAGGA CGATCCGCAG 
CTGTTCTCCG GCCTGTTCTG GACCGGTGCC AAGGCGGTCG ATCTGGGCTT GGCGGACGGC 
ATCGGCGGCA CCGATTTCGT CGCCCGCAAC ATCATCAAGG CGCCGGACTT GGTCGACTAC 
ACGGTCAAGG AGAACTTCGC CGAGCGCGTG GCACGCAAGT TCGGCACGGC CATGGGCGCA 
GGGGCCATCA AGGCGCTGGC CGCGACCGGC CAGCTCAAGC TCCTGATGAG GCAGTAG

Protein sequence

MTDPTPPKSP EEGAGKPDEL EFTHQADHPL EAELRDAAAG KPASRPGLFG RFRHGESGAP 
RASGAPAGWE RDVLERVLLA AIREQRAARR WRIFFRFVTL GIIGGLLYLF ASFEGETVSS 
GRHTALVTLD GEIAANTNAS ADNINASLEA AFADDNTAGV ILKINSPGGS PVQAGMINDD 
IRRLRAKYKN IPLYVVVEEM CASGGYYVAA AADKIYVDKA SIVGSIGVLM DGFGFTGLMD 
KLGVERRLLT AGTNKGMLDP FSPVAPQQRQ FAQAMLDEVH QQFIDVVKQG RGSRLKDDPQ 
LFSGLFWTGA KAVDLGLADG IGGTDFVARN IIKAPDLVDY TVKENFAERV ARKFGTAMGA 
GAIKALAATG QLKLLMRQ