Gene RS02031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RS02031
Symbol	RSp0056
ID	1222604
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ralstonia solanacearum GMI1000
Kingdom	Bacteria
Replicon accession	NC_003296
Strand	+
Start bp	63310
End bp	64281
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	60%
IMG OID	637239915
Product	putative dipeptidase protein
Protein accession	NP_521617
Protein GI	17548277
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2355] Zn-dependent dipeptidase, microsomal dipeptidase homolog
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.237279
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACGC TGCATCAAGA CAGCATCATC ATCGACGGTC TGAACATCTC GAAGTTTGAG 
CGACCGGTGT TTGAAGACAT GCGCCGCGGC GGCATCACGG CCGCCAACTG CACGGTATCG 
GTGTGGGAAA ACTTCACCAA GACCGTCGAC AACATCGGCG TGATGAAGCA GAAGATCCGC 
GAGAACGGTG AACTGCTGAC GCTGGTGCGC ACGACGGACG ACATCTTCCG CGCAAAGAAG 
GAAGGCAAGA CCGGGATCAT CCTCGGCTTC CAGAACGCGC ACGCGTTTGA AGACAACCTC 
GGCTACATCG AGGCGTTCCA CGACATGGGC GTGCGCGTCG TGCAGCTTTG CTACAACACG 
CAGAACCTGG TCGGCACGGG CTGCTACGAG CGCGACGGCG GCCTGTCGGA CTTCGGCCGC 
GAAGTGATTA CCGAGATGAA CCGCGTCGGC ATCATGGTCG ACCTGTCACA CGTGGGCGGC 
AACACGTCTT CGGAGGCGAT CACGTTTTCG AAGAAGCCGG TGTGCTATTC GCACTGCCTG 
CCATCGGGCC TGAAGGACCA CCCGCGCAAC AAGAGCGACG CGCAACTGAA GGAGATCGCC 
GATGCGGGTG GCTTCGTTGG TGTGACGATG TTCGCGCCGT TCCTCAAGCG CGGGATCGAA 
GCGACGATCG ACGACTACAT CGAGGCCATC GATTACGTCG TGAACCTGAT CGGCGAAGAC 
GCCGTCGGCA TCGGTACGGA TTTCACGCAG GACTTTGCGA AGGAATTCTT CGACATGCTG 
ACGCACGACA AGGGCCGCTA TCGCCAGCTG ACCAACTTCG GCAAGGTGAT CAACCCCGAC 
GGCATCCGCA CGATTGGCGA GTTCCCGAAC CTGACCGCCG CGATGGAGCG CCACGGCTGG 
AAGGAGACCC GCATCCGCAA GATCATGGGC GAGAACTGGG TGCGCGTGTT CAAGGACGTG 
TGGGGCGCAT AG

Protein sequence

MSTLHQDSII IDGLNISKFE RPVFEDMRRG GITAANCTVS VWENFTKTVD NIGVMKQKIR 
ENGELLTLVR TTDDIFRAKK EGKTGIILGF QNAHAFEDNL GYIEAFHDMG VRVVQLCYNT 
QNLVGTGCYE RDGGLSDFGR EVITEMNRVG IMVDLSHVGG NTSSEAITFS KKPVCYSHCL 
PSGLKDHPRN KSDAQLKEIA DAGGFVGVTM FAPFLKRGIE ATIDDYIEAI DYVVNLIGED 
AVGIGTDFTQ DFAKEFFDML THDKGRYRQL TNFGKVINPD GIRTIGEFPN LTAAMERHGW 
KETRIRKIMG ENWVRVFKDV WGA