Gene RPB_1225 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1225
Symbol
ID	3910160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	1401931
End bp	1403061
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	69%
IMG OID	637883119
Product	carboxypeptidase
Protein accession	YP_484846
Protein GI	86748350
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCCAG CAAATCTGCC GTTTGATTCC GAAGCCATGC TGCAAGGCCT GCGCGCCTGG 
GTCGAGTGCG AAAGCCCGAC CTGGGACAAA GCCGCCGTCG AGCGCATGCT CGACCTCGCC 
GCGCGCGACA TGGCGGTGAT GGGTGCGTCG ATCGAACGCA TCGCCGGACG GCAGGGCTTC 
GCCGGCTGTG TTCGCGCACG CTTTCCGCAC CCGCGGCAGG GCGAGCCCGG CATCCTGATC 
GCCGGCCATC TCGACACCGT GCATCCGGTC GGCACGATCG AGAAACTGCA ATGGCGCCGC 
GACGGCAACA AATGCTACGG CCCGGGCATC TTCGACATGA AGGGCGGCAA CTATCTGACG 
CTCGAAGCCA TCCGCCAGCT CGCGCGCGCG TCGTTCACGA CGCCGCTGCC GGTCACCGTG 
CTGTTCACGC CGGACGAGGA AGTCGGCACG CCCTCGACCC GGGACATCAT CGAGGCGGAG 
GCCGCCCGCA ACAAATACGT GCTGGTGCCG GAGCCCGGCC GCCCCGACAA CGGCGTCGTC 
ACCGGCCGCT ACGCGATCGC GCGATTCAAT CTGACGGCGA CCGGCAAGCC CAGCCACGCC 
GGCGCGACGC TGTCCTCGGG ACGTTCCGCG ATCCGGGAAA TGGCGCGGCA GATATTGGCG 
ATCGACGCGA TGACGACGGA GGACTGCACG TTCAGCGTCG GCATCGTGCA CGGCGGACAA 
TGGGTCAATT GCGTCGCCAC CACCTGCACC GGCGAGGCGC TCAGCATGGC GAAGCGGCAG 
GCCGATCTCG ACCGCGGCGT CGAACGGATG CTGGCGCTGT CCGGCACCAG CAACGACGTC 
GGCTTCGAAG TGACGCGCGG CGTGACGCGG CCGGTCTGGG AGCCCGACGC CGGCACCATG 
GCGCTGTACC AGAAGGCGGC CGCGATCGCC GACCAGCTCG GGCTGAAGCT GCCGCACGGC 
AGCGCCGGCG GCGGTTCCGA CGGCAACTTC ACCGGCGCGA TGGGGATCCC GACTCTCGAC 
GGCCTCGGCG TGCGTGGCGC CGACGCCCAC ACGCTGAACG AGCATATCGA AGTCGATAGT 
CTGGCGGAAC GCGGGCGCCT GATGGCCGGG CTGCTCGCGA CTCTCGCATG A

Protein sequence

MNPANLPFDS EAMLQGLRAW VECESPTWDK AAVERMLDLA ARDMAVMGAS IERIAGRQGF 
AGCVRARFPH PRQGEPGILI AGHLDTVHPV GTIEKLQWRR DGNKCYGPGI FDMKGGNYLT 
LEAIRQLARA SFTTPLPVTV LFTPDEEVGT PSTRDIIEAE AARNKYVLVP EPGRPDNGVV 
TGRYAIARFN LTATGKPSHA GATLSSGRSA IREMARQILA IDAMTTEDCT FSVGIVHGGQ 
WVNCVATTCT GEALSMAKRQ ADLDRGVERM LALSGTSNDV GFEVTRGVTR PVWEPDAGTM 
ALYQKAAAIA DQLGLKLPHG SAGGGSDGNF TGAMGIPTLD GLGVRGADAH TLNEHIEVDS 
LAERGRLMAG LLATLA