Gene RPC_1668 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_1668
Symbol
ID	3972591
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	1800691
End bp	1801986
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	66%
IMG OID	637924783
Product	allantoate amidohydrolase
Protein accession	YP_531548
Protein GI	90423178
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01879] amidase, hydantoinase/carbamoylase family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACCGTC CGATCGATGA CGCGAATCGC AATCTGGACA TTCGCATGAG CAAGCTCGCC 
TCCAATCTGC AAATCGATTC CGCAAGGCTG TGGAGCACGA TCAACGACAC CGCGAAATTC 
GGCGGCACGC CGAAGGGCGG GGTGCGGCGG CTGACGCTGA GCGCCGAAGA CAAGCAGGTC 
CGCGACTGGT TTCGCCAAGC GCTCGAGGCC GCCGGCTGCG AGGTGCATGT CGATGCGCTC 
GGCAACATGT TCGCGCTGCG CCGTGGCCGC GACATGAGCA AGCCGCCGAT CGGGCTCGGC 
TCGCATCTCG ACACCCAGCC GACCGGCGGC AAGTTCGACG GCATTCTCGG TTCGCTCGCC 
GCCCTCGAAG TGGTGCGCAC GCTGAACGAC GCCGGCATCG AGACCGAGCT GCCTTTGTGC 
GTCGCCAACT GGACCAACGA GGAAGGCTCG CGCTACGCGC CGGCGATGAT GGGATCGGCG 
GCCTATGTCG GCGACTTCAC CGTCGAGGAC ATTTTGGCGC GCAAGGACGG CGAGGGCATC 
AGCGTCGCCG CGGCACTCGA CGGCATCGGC TATCGCGGCA GCGAGGCGGT CGGGACGCAG 
AAATTCACCA GCTTCGTCGA GCTGCATATC GAACAAGGCC CGATCCTGGA AGCCGAAGGC 
AAGACCATCG GCGTGGTGGA TTCCGGGCAG GGCGTGTTGT GGTACGATGG CCAGATCGTG 
GGCTTCGAAA GCCACGCCGG CTCGACGCCG ATGCGGCTGC GCCGCGACGC GCTGGCGACG 
CTTTCCGAGA TCGTGCTTGC GGTGGAGCGG ATCGCTACCG AACTCGGCCC CAACGCGGTC 
GGCACCATCG GCGAAGCGGC GATCGCGCGG CCATCGCGCA ACGTCATTCC CGGCGAGATC 
GCCTTCACCA TCGACATGCG CAGCGCCGAC GCGTCGATCA TGGATGCGCT CGACAAGAAT 
TTGCGCGCTG CCGCGGCGGA GATCGCCGGC CGCCGCAAGG TCGAAATCCC GCTCGATCTG 
GTGTGGCGGA TCGAGCCGAC GCATTTCGAC GCCAAGCTGG TCGACGCGGT GCAGCGAGCC 
GCCGGCGAGC TCGGCTACAG CCATCGCCGC ATTACTTCCG GCGCCGGCCA CGACTCCTGC 
AACCTCGCCA CCGCAATGCC GGCGGCGATG ATCTTCGTGC CGTGCAAGGA CGGCGTTAGC 
CACAACGAAT TGGAAGACGC CACCGAGGCC GATTGCGGCG CCGGTGCCAA CGTGCTGCTG 
CATACCGTGC TGGCGCTCGC CGGCGTGGCG AAGTAA

Protein sequence

MHRPIDDANR NLDIRMSKLA SNLQIDSARL WSTINDTAKF GGTPKGGVRR LTLSAEDKQV 
RDWFRQALEA AGCEVHVDAL GNMFALRRGR DMSKPPIGLG SHLDTQPTGG KFDGILGSLA 
ALEVVRTLND AGIETELPLC VANWTNEEGS RYAPAMMGSA AYVGDFTVED ILARKDGEGI 
SVAAALDGIG YRGSEAVGTQ KFTSFVELHI EQGPILEAEG KTIGVVDSGQ GVLWYDGQIV 
GFESHAGSTP MRLRRDALAT LSEIVLAVER IATELGPNAV GTIGEAAIAR PSRNVIPGEI 
AFTIDMRSAD ASIMDALDKN LRAAAAEIAG RRKVEIPLDL VWRIEPTHFD AKLVDAVQRA 
AGELGYSHRR ITSGAGHDSC NLATAMPAAM IFVPCKDGVS HNELEDATEA DCGAGANVLL 
HTVLALAGVA K