Gene RSP_3747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_3747
Symbol
ID	3721506
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007494
Strand	+
Start bp	872050
End bp	873228
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	68%
IMG OID	640073417
Product	putative dipeptidase
Protein accession	YP_355254
Protein GI	77465751
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.93962
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCGTT ATTTTTCCCG ATCCGAGTAC GAGCGCCGCT GGCAGAAGGC CGAGGCGCTG 
ATGGCCGAGC GCGGCTTCGA GACGGCTGTC GTCTTCTCGC GCGGCGGCGG GACGACCGAC 
AATTGCGGCG ACGTGCTCTA TCTGGCGAAC CACTATTCGG TCAGCGGGGG CACCGATTCG 
ACGATCTGGT CGGCGCGGTC CTTCTCGGCG GTGATCCTGC GCCGCGGGCA GGAGCCCGAG 
CTGCATATCG ACGAGCCCGA GGGACGCGCG GATCTCCTCG CCGTGGACCG GGTGGCCTGC 
CACAACCATC CGTTCATCGG TGTGGCCGAA GCGCTGGTGG CGCGCGGCGT CACCGGGCGC 
GTCGCGCTCT GCGGGACCCA GTTCATCCCG GTGAAATATT ACCAGCAGCT CGTGTCGCGG 
ACGCCGGGGA TCGAATGGGT CGAGGCCGAT GACCTGATCC GCAGCCTGCG CCGGATCAAG 
AGCGCGGAAG AACTCGACTG CTACCGGATC GCGGGCGAGG CGGCGACCGA GGCCACCACG 
GTTCTGATGC AGGGCCTCCT GTCGGGGTTG TCCGAGCGCG AGGCGGCCGG CGAGGCCGCC 
CGCGTGACCG TGGCGCGCGG CGGGCGGGTG CAGGCGATCG GCACCAACCA CGGCGACACG 
ATGCAGTATG ACTACCGCAA CCCGCTCACG GGCTCGAGCG CCGACACGCC GGCGGTGGGC 
GACATGGTGC GCGGCACGGT CCATGCGGCC TTCTTCCAGG GCTATTATCT CGATCCCGGC 
CGCACCGCGG TGCGCGGCAC CCCCACTGCC GATCAGCGGC GGTTGATCGA GGCCACCAAC 
GACATCGTCC AGCGGCTGAT CGGCATGATG CGCCCCGGCG CGCGTCTCCT TGACGTGGCG 
GCCGAGGGGG ACCGGATGAC ACAGGCCTTC GGCGGCGAGA TCTCTCCGCT GATGAAGAAC 
TTCCCCTTCT ACGGCCACGG GATCGGCCTC TCGTTCGAGC AGCCGCGGAT CTCGACCGCC 
ATGTCGCTGC CGGGCGATGT GGTCGAGGAG AACATGGTCT TCGGCGTCGA GGCCTTCCTC 
GCCCTCGAGG GCGTGGGGTC GGCCTTCTTC GAGGACATCG TGATCGTGAC GGCAGGCACC 
CCCGAACTCC TCACCCGCAC CCCCCATTAT TTCTGGTGA

Protein sequence

MSRYFSRSEY ERRWQKAEAL MAERGFETAV VFSRGGGTTD NCGDVLYLAN HYSVSGGTDS 
TIWSARSFSA VILRRGQEPE LHIDEPEGRA DLLAVDRVAC HNHPFIGVAE ALVARGVTGR 
VALCGTQFIP VKYYQQLVSR TPGIEWVEAD DLIRSLRRIK SAEELDCYRI AGEAATEATT 
VLMQGLLSGL SEREAAGEAA RVTVARGGRV QAIGTNHGDT MQYDYRNPLT GSSADTPAVG 
DMVRGTVHAA FFQGYYLDPG RTAVRGTPTA DQRRLIEATN DIVQRLIGMM RPGARLLDVA 
AEGDRMTQAF GGEISPLMKN FPFYGHGIGL SFEQPRISTA MSLPGDVVEE NMVFGVEAFL 
ALEGVGSAFF EDIVIVTAGT PELLTRTPHY FW