Gene Rsph17029_3478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3478
Symbol
ID	4898690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	+
Start bp	555439
End bp	556617
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	68%
IMG OID	640114075
Product	peptidase M24
Protein accession	YP_001045343
Protein GI	126464230
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGTT ATTTTTCCCG ATCCGAGTAC GAGCGCCGCT GGCAGAAGGC CGAGGCGCTG 
ATGGCCGAGC GCGGCTTCGA GACGGCTGTC GTCTTCTCGC GCGGCGGCGG GACGACCGAC 
AATTGCGGCG ACGTGCTCTA TCTGGCGAAC CACTATTCGG TCAGCGGGGG CACCGATTCG 
ACGATCTGGT CGGCGCGGTC CTTCTCGGCG GTGATCCTGC GCCGCGGGCA GGAGCCCGAG 
CTGCATATCG ACGAGCCCGA GGGGCGCGCG GATCTCCTCG CCGTGGACCG GGTGGCCTGC 
CACAACCATC CGTTCATCGG CGTGGCCGAG GCATTAGTGG CAATGGGCGT CACCGGGCGC 
GTCGCGCTCT GCGGGACCCA GTTCATCCCG GTGAAATATT ACCAGCAGCT CGTGTCGCGG 
ACGCCGGGGA TCGAATGGGT CGAGGCCGAT GACCTGATCC GCAGCCTGCG CCGGATCAAG 
AGCGCGGAAG AGCTCGACTG CTACCGGATC GCGGGCGAGG CGGCGACCGA GGCCACCACG 
GTTCTGATGC AGGGCCTGCT GTCGGGACTG TCCGAGCGCG AGGCGGCCGG CGAGGCCGCC 
CGCGTGACCG TGGCGCGCGG CGGGCGGGTG CAGGCGATCG GCACCAACCA CGGCGACACG 
ATGCAGTATG ACTACCGCAA CCCGCTCACG GGCTCGAGCG CCGACACGCC GGCGGTGGGC 
GACATGGTGC GCGGCACGGT CCATGCGGCC TTCTTTCAGG GCTATTATCT CGATCCAGGC 
CGGACCGCGG TGCGCGGCAC CCCCACTGCC GATCAGCGAC GGCTGATCGA GGCCACCAAC 
GACATCGTCC AGCGGCTGAT CGGCATGATG CGCCCCGGCG CGCGTCTCCT TGATGTGGCG 
GCCGAGGGGG ACCGCATGAC ACAGGCCTTC GGCGGCGAGA TCTCTCCGCT GATGAAGAAC 
TTCCCCTTCT ACGGCCACGG GATCGGCCTC TCGTTCGAGC AGCCGCGGAT CTCGACCGCC 
ATGTCGCTGC CGGGCGATGT GGTCGAGGAG AACATGGTCT TCGGCGTCGA GGCCTTCCTC 
GCCCTCGAGG GCGTGGGGTC GGCCTTCTTC GAGGACATCG TGATCGTGAC GGCAGGCACC 
CCCGAACTCC TTACTCGCAC CCCCCATTAT TTCTGGTGA

Protein sequence

MSRYFSRSEY ERRWQKAEAL MAERGFETAV VFSRGGGTTD NCGDVLYLAN HYSVSGGTDS 
TIWSARSFSA VILRRGQEPE LHIDEPEGRA DLLAVDRVAC HNHPFIGVAE ALVAMGVTGR 
VALCGTQFIP VKYYQQLVSR TPGIEWVEAD DLIRSLRRIK SAEELDCYRI AGEAATEATT 
VLMQGLLSGL SEREAAGEAA RVTVARGGRV QAIGTNHGDT MQYDYRNPLT GSSADTPAVG 
DMVRGTVHAA FFQGYYLDPG RTAVRGTPTA DQRRLIEATN DIVQRLIGMM RPGARLLDVA 
AEGDRMTQAF GGEISPLMKN FPFYGHGIGL SFEQPRISTA MSLPGDVVEE NMVFGVEAFL 
ALEGVGSAFF EDIVIVTAGT PELLTRTPHY FW