Gene Rsph17025_3072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_3072
Symbol
ID	5083159
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	3141845
End bp	3143641
Gene Length	1797 bp
Protein Length	598 aa
Translation table	11
GC content	70%
IMG OID	640484644
Product	peptidase M24
Protein accession	YP_001169261
Protein GI	146279102
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.782089
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCCAGA CGTTCCATGC GACTTCCTCC CCGGCCCAGG GGCCGGCCCG GCTTGCGGCG 
CTGCGCGCGG CGCTGACGGC CGACGGGCTG ACGGGGTTCA TCGTTCCACG CTCGGATGCC 
CATCAGGGCG AATATGTGGC CGCCCGGGAC GAGCGTCTCC AGTGGCTGAC GGGCTTTACC 
GGCTCGGCCG GCTTCTGCAT CGTGCTGCCC GACCTCGCGG GCGTCTTCAT CGACGGCCGC 
TACCGGGTTC AGGTGAAGCA TCAGGTGGAT CCCGGCCATT TCACGCCCGT TCCCTGGCCC 
GAGGTGCAGC CGGGTGACTG GCTGCGTGAA AATCTTTCCC AAGGCACGAT CGGCTTCGAT 
CCCTGGCTCC ATACGGCCGA TGAGATCTCG CGGCTCGAGG CGGCGCTGGC GGGCTCCGAC 
ATCAGCCTGC GCGCGGTGGA GAACCCGCTC GACCGGCTCT GGGCCGACCA GCCCGAGGCG 
CCGATGGGGC GCGCCTTTGC CCATCCCGAC GCCCTCGCAG GCGAGACGGG CGAGGCCAAG 
CGCCAACGCC TCGCGGCTGC GCTTGGCCTC GCCGGGCGCA AGGCCGCGGT CCTGACGCTG 
CCGGACTCGA TCTGCTGGCT GCTGAACATC CGGGGCGCCG ATGTGCCGCG CAATCCGGTG 
CTGCACGCCT TTGCCGTGCT GCATGACGAC GCCCGCGTGA CGCTCTTTGC CGACGCCGCG 
AAGTTCGACG AGGCAACCCT CGCGCATCTG GGCCAGGGTG TGACCCTGCG CCCGCCGCAG 
GCCTTCGTGC CGGCCCTGCG CACACTCGGC GGCCCGGTGC AGGTGGATCG CAAGACCGCC 
CCGCTGGCCG TGACGCTCGA GCTGCAGGAT GCCGGGATCG AGGTGGCCGA CGGCGACGAT 
CCCTGCCGGC TGCCAAAGGC CTGCAAGACC CCGGCCGAGA TTGCCGGCAT GCGCGACGCC 
CACCTGCGCG ACGGGGCCGC GATGGTCGAG TTCCTCTGCT GGCTCGACGC CGAGGCGCCA 
AAGGGCGGCC TCACGGAAAT CGCCGTGGTG ACCGCGCTCG AGGGCTTCCG CCGGGCAACC 
AACGCGCTCC ACGACATCAG CTTCGACACG ATCTGCGGCG CAGGCCCCAA CGGCGCGATC 
ATGCATTACC GCGTGACCGA GGGCTCGAAC CGCCCCGTGC AGCGGGACGA GCTGTTGCTC 
GTCGATTCGG GTGCGCAATA TGCCGATGGC ACGACCGACA TCACCCGCAC CATTGCCGTG 
GGCGACCCCG GCGAGGAGGC GCGCGAGTGC TACACGCGGG TGCTGCAGGG CCTGATAGCC 
ATCAGCCGCG CGCGCTGGCC GAAAGGTCTC GCCGGGCGCG ACCTTGATGC GCTGGCGCGT 
TACCCGCTGT GGCTTGCGGG ACAGGACTAC GATCATGGCA CCGGCCACGG CGTCGGCGCC 
TTCCTCTCGG TCCACGAGGG ACCGCAGCGG ATTGCCCGCA TCTCGGAGGT GCCGCTCGAG 
CCGGGCATGA TCCTCTCGAA CGAGCCGGGC TACTACCGCG AGGGCGCCTT CGGCATCCGG 
CTGGAAAACC TGATCGTCGT CGAGGAAGCG CCGGGGCTTG GCGATCATCG CCGGCAGTTG 
TCGTTCGAGA CCCTGACCTT CGTGCCCTTC GACCGGCGGC TGATCCTGCC CCATCGCCTC 
TCGCTCCCCG AGCGGGAATG GCTGGATGCC TACCATGCGG ATGTTCTCGA AAGGATCGGA 
TCGCGCCTTT CACCCCCGGC GCGGGCGTGG CTGGGGGCGG CGGCTGCGCC TCTTTGA

Protein sequence

MFQTFHATSS PAQGPARLAA LRAALTADGL TGFIVPRSDA HQGEYVAARD ERLQWLTGFT 
GSAGFCIVLP DLAGVFIDGR YRVQVKHQVD PGHFTPVPWP EVQPGDWLRE NLSQGTIGFD 
PWLHTADEIS RLEAALAGSD ISLRAVENPL DRLWADQPEA PMGRAFAHPD ALAGETGEAK 
RQRLAAALGL AGRKAAVLTL PDSICWLLNI RGADVPRNPV LHAFAVLHDD ARVTLFADAA 
KFDEATLAHL GQGVTLRPPQ AFVPALRTLG GPVQVDRKTA PLAVTLELQD AGIEVADGDD 
PCRLPKACKT PAEIAGMRDA HLRDGAAMVE FLCWLDAEAP KGGLTEIAVV TALEGFRRAT 
NALHDISFDT ICGAGPNGAI MHYRVTEGSN RPVQRDELLL VDSGAQYADG TTDITRTIAV 
GDPGEEAREC YTRVLQGLIA ISRARWPKGL AGRDLDALAR YPLWLAGQDY DHGTGHGVGA 
FLSVHEGPQR IARISEVPLE PGMILSNEPG YYREGAFGIR LENLIVVEEA PGLGDHRRQL 
SFETLTFVPF DRRLILPHRL SLPEREWLDA YHADVLERIG SRLSPPARAW LGAAAAPL