Gene RPC_3014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3014
Symbol
ID	3973621
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	3310218
End bp	3311957
Gene Length	1740 bp
Protein Length	579 aa
Translation table	11
GC content	66%
IMG OID	637926125
Product	Nitrilase/cyanide hydratase and apolipoprotein N-acyltransferase
Protein accession	YP_532878
Protein GI	90424508
COG category	[R] General function prediction only
COG ID	[COG0388] Predicted amidohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.55748
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCGCA AGATCCAGGT TGCCACCGTC CAGTTCGAAC CCACCATGTT CGAAAAGGAG 
CGCAACATCG CCGGTCTCCT CGCTCTCTGC GAGCAGGCGG CGCAATCCGG CGCCCGGTTG 
ATCGTGACGC CGGAAATGGG CACCACCGGA TATTGCTGGT TTGATCGCGC CGAGGTTGCG 
CCCTATGTCG AGCCGATTCC CGGGCCGAGC ACCGATCGCT TCGCCGCGCT GGCGCGAAAA 
TACGATTGCT ACATCGTCGT CGGCCTGCCG GAGGTCGACG ACGACGGCAT CTATTTCAAC 
TCCGCGGTGC TGATCGGGCC GGAGGGCGTG ATCGGCCGGC ATCGCAAGAC CCATCCCTAT 
ATTGCCGAGC CGAAATGGTC GGCGGCAGGG GATCTGCACA ACCAGGTGTT CGAGACGCCG 
ATCGGGCGCA TCGCCATCTT GATTTGCATG GATATCCATT TCATCGAGAC CGCGCGCTTG 
ATGGCGCTGG GTGGCGCCGA CATCATTTGC CACATCTCGA ATTGGCTGGC CGAGCGGACC 
CCGGCGCCGT ACTGGATCAG CCGGGCGTTC GAGAACGGCT GCTACGTGAT CGAAAGCAAC 
CGCTGGGGGC TGGAGCGCAC AGTGCAGTTT TCCGGCGGCA GCTGCGTGAT CGCGCCGGAT 
GGCGGGATCG CCGCCGTCAT CGATGGCGGC GACGGCGTGG CGATGGCGGA GATCGATCTC 
GATCTGGCGC GGGCGCGCCG TGTCGCCGGC GAGCCGGTGT TCCAGCGGCG CCGGCCGGAG 
CTTTACCCTG AGCTGCTGAC CGACACCTTC AGCTGGAATC CGCGCGATTT CTTCAAGCTG 
TACGGTCATC AGCCATGGCC GGAGGGCAAG TCGTCGCGGG TCAGCGTCGC GCAATTTGCG 
CCGAGCTCCG ATGTGGACGG CAATCTCGAT CACATCGACG CGCTGGCTCG GCAAGCCAAG 
GCCGACGGGG TCGAGCTTGT TGTGTTTCCG GAACTGGCGA TCAGCGGTCT GATCGACCCG 
GCGCAAGCTG CGCAGGCGAT TCCGGGCCCG GCGACCGATC GGCTCGGCGA CCTCGCCAAG 
CAGCTGTCGC TCTATCTGGT CTGCGGCATC GCCGAGCGAG CCGGCGAACT CACCTACAAC 
AGCGCGGTCC TGATCGCACC GGACGGCGCA TGGACGGTCT ATCGCAAGAC GCATCTCACC 
GAAGACGAGC GCAGCTGGGC GACCGCAGGC GACGACTGGA CCGTGGTCGA TACGCCGCTC 
GGTCGGATTG GCCTGCTGAT CGGTCATGAC GCGATGTTTC CGGAAGCAGG CCGCGTGCTG 
GCGCTGCGCG GCTGCGATCT GATCGTCTGC CCGGCGGCGA TCGCGACCCG GTTCAGCTCG 
CCGCATGCCG GCACGGCGGT CGCGCAGCCG GCGCCGATCC CGACCGGGGC CGATCCGTAT 
CACTGGCATC ACTTCCGCGT CCGCGCTGGC GAGAACAACG TGTTCTTCGC CTTCGCCAAT 
GTGATCGATC CTGCGCGCGG TTACGCCGGC CTGAGCGGCG TGTTCGGCCC CGACACCTTT 
GCCTTTCCAC GCCGCGAAGC CATGGTCGAA GACGGCGAGG GCGTCGCCAC GGCGGTGATC 
GACACCAGCA ATCTCGACAG CGTCTATCCG ACCAATGTGG TGCGGCGGAA GGACCTGGTG 
GCGATGCGGA TGCCGCACAG CTATCGGCCG CTGATCCAGG CGGTGGCGGG AAATTTCTGA

Protein sequence

MSRKIQVATV QFEPTMFEKE RNIAGLLALC EQAAQSGARL IVTPEMGTTG YCWFDRAEVA 
PYVEPIPGPS TDRFAALARK YDCYIVVGLP EVDDDGIYFN SAVLIGPEGV IGRHRKTHPY 
IAEPKWSAAG DLHNQVFETP IGRIAILICM DIHFIETARL MALGGADIIC HISNWLAERT 
PAPYWISRAF ENGCYVIESN RWGLERTVQF SGGSCVIAPD GGIAAVIDGG DGVAMAEIDL 
DLARARRVAG EPVFQRRRPE LYPELLTDTF SWNPRDFFKL YGHQPWPEGK SSRVSVAQFA 
PSSDVDGNLD HIDALARQAK ADGVELVVFP ELAISGLIDP AQAAQAIPGP ATDRLGDLAK 
QLSLYLVCGI AERAGELTYN SAVLIAPDGA WTVYRKTHLT EDERSWATAG DDWTVVDTPL 
GRIGLLIGHD AMFPEAGRVL ALRGCDLIVC PAAIATRFSS PHAGTAVAQP APIPTGADPY 
HWHHFRVRAG ENNVFFAFAN VIDPARGYAG LSGVFGPDTF AFPRREAMVE DGEGVATAVI 
DTSNLDSVYP TNVVRRKDLV AMRMPHSYRP LIQAVAGNF