Gene Rsph17029_0398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_0398
Symbol
ID	4896280
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	411333
End bp	412538
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	67%
IMG OID	640110982
Product	peptidase M24
Protein accession	YP_001042286
Protein GI	126461172
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACGTC CCGAAAACTA CCGTTTCCAC AATGGCGAGA AGGCCGCGCT GCCCTTCCCG 
CCCGAGGAAT ACGAGGCCCG GCTCGAGGGC CTGCGCGACC TGATGGAGCT GCATTCGCTC 
GACGCGGTCG TGCTGACCTC GATGCACAAC GTGGCCTACT ATTCCGGCTT CCTCTACCTG 
TCGTTCGGCC GCCCCTACGC CTGTGTGGTC ACTCCCACCG ACTGCGTCAC CGTCAGCGCG 
GGCATCGATG GGGGTCAGCC CTGGCGGCGG AGCGTGGGCG ACAACATCAC CTACACCGAC 
TGGCAGCGCG ACAATTTCTG GCGGACGGTC GCGCAGGTCA CCGGCACGGG CCGCGCCATC 
GGCTGCGAGG CGGACCATCT GACCATGGTG CAGGCCGAGA AGCTGAACGC CTTCCTTAGG 
CCCACGCGCG GCATGGACAT CGCCCCCGGC ACGATGGCGC AGCGGATGCT GAAATCTCCC 
GCAGAGATCG CGCTCATCCG ACACGGCGCG CAGGTGGCGG ATGTGGGCGG CTATGCCATC 
CGCGAGGCGA TCCGCGAGGG CGCGACCGAG CTCGAGATCG CCATGGTGGG GCGCGACGCA 
ATGGAGCGCG AAATTGCGGC CCGCTTCCCC GAGGCCGAAT ATCGTGACAG CTGGGTATGG 
TTCCAGTCGG GCCCGAACAC CGACGGTGCG CATAACCCGG TGACGAACCG GGCGCTCCGG 
CGCGGCGACA TCCTCTCGCT CAACTGCTTT CCGATGATCT CGGGCTATTA CACCGCGCTC 
GAACGCACGC TGTTTCTGGG CGAGGTGGAC GATGCCAGCC TGAAGATCTG GGAGGCGAAT 
GTCGCCGCCC ATGAATATGG CATCTCGCTG CTTCAGCCGG GGGCCTCCTG CGCCGACGTG 
ACGGCGAAGC TCAACGCGTT CCTCGAAGAG CGCGACCTCT TGCGCTACCG CACCTTCGGC 
TATGGCCATT CCTTCGGCCT GCTCTCGCAC TACTACGGCC GCGAGGCGGG GCTGGAACTG 
CGCGAGGATA TCGAGACGGT GCTCGAGCCC GGCATGGTGA TCTCGATGGA GCCGATGCTG 
ACGCTCGGCG CAGGCCAGCC CGGCGCGGGC GGCTACCGCG AGCACGACAT CCTCGTCATC 
ACCGAGGACG GGCCCGAGAA CATCACGGGC TATCCCTACG GCCCCGGCTT CAACGTGGTG 
GGCTGA

Protein sequence

MERPENYRFH NGEKAALPFP PEEYEARLEG LRDLMELHSL DAVVLTSMHN VAYYSGFLYL 
SFGRPYACVV TPTDCVTVSA GIDGGQPWRR SVGDNITYTD WQRDNFWRTV AQVTGTGRAI 
GCEADHLTMV QAEKLNAFLR PTRGMDIAPG TMAQRMLKSP AEIALIRHGA QVADVGGYAI 
REAIREGATE LEIAMVGRDA MEREIAARFP EAEYRDSWVW FQSGPNTDGA HNPVTNRALR 
RGDILSLNCF PMISGYYTAL ERTLFLGEVD DASLKIWEAN VAAHEYGISL LQPGASCADV 
TAKLNAFLEE RDLLRYRTFG YGHSFGLLSH YYGREAGLEL REDIETVLEP GMVISMEPML 
TLGAGQPGAG GYREHDILVI TEDGPENITG YPYGPGFNVV G