Gene Rpal_2669 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_2669
Symbol
ID	6410332
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	2898652
End bp	2900391
Gene Length	1740 bp
Protein Length	579 aa
Translation table	11
GC content	66%
IMG OID	642712545
Product	Nitrilase/cyanide hydratase and apolipoprotein N-acyltransferase
Protein accession	YP_001991654
Protein GI	192291049
COG category	[R] General function prediction only
COG ID	[COG0388] Predicted amidohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.538211
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCAAC TGCTGAAGGT CGCTACCGTC CAGTTCGAGC CGATCATGGC CGAGAAGGAG 
CGCAACGTCG CGCGTCTGCT CGAGCTGTGC GAGGAGGCGG CGGTGGGAGG CGCCAAACTG 
ATCGTCACCC CGGAGATGGG CACCACCGGC TATTGCTGGT ACGACCGCGC CGAAGTGGCG 
CCGTTCGTCG AGCCGATCCC GGGGCCGACC ACAGCACGGT TTGCCGCGCT GGCGCGCAAG 
CACGATTGCT ACATCGTCGT CGGCCTTCCG GAGGTCGATG AGGACGGCAT CTATTACAAT 
TCGGCCGTCC TGATCGGCCC GGAGGGATTG ATCGGGCGTC ACCGCAAGAC GCATCCGTAT 
ATCTCTGAGC CGAAATGGTC GGCGGCGGGC GATCTGCACA ATCAGGTGTT TGACACGCCG 
ATCGGGCGGA TCGCGCTGCT GATCTGCATG GACATCCATT TCGTCGAGAC TGCCCGGTTG 
ATGGCCCTCG GTGGCGCCGA CATCATCTGT CACATCTCGA ACTGGCTGGC GGAGCGTACC 
CCGGCGCCGT ACTGGATCAG CCGGGCGTTC GAGAACTCCT GCTACGTCAT CGAGAGCAAC 
CGCTGGGGGC TTGAGCGGAC CGTGCAGTTC TCCGGCGGAA GCTGCGTGAT CGCGCCGGAC 
GGCGGCATCG CTGCGGTGAT CGATGGCGGC GACGGTGTGG CCTTCGCCGA AATCGATCTG 
GACACTGCGC GCGCGCGCCA GATCGGCGGC GAGGCGGTGT TTCGGCAGCG GCGGCCGGAG 
CTGTATCCGG AGTTGCTGAC CGGCACCTTC AGCTGGAATC CGTACGACTT CTTCGGCCTG 
TACGGACACG AGGCCTGGCC GAAGGGCAAG CGCTCCAAGC TCAGCGGCGC GCAGTTCGCG 
CCGGTCGCCG ATCTCAGTGC CAATCTCGAC CGGATCGAGG CGTTGGCACG CCAGGCGAAG 
GCGGATGGCG CCGAGATGGT GGTGTTTCCG GAACGGAGCC TTACCGGACT GGATGATCCG 
GCGCGTACTG CCGTCGCTGT GCCTGGCCCC GCGACCGACC GGCTCGCCGC GCTGGCAAGC 
GAGCTGTCGC TGTATCTCGT CTGCGGTCTC GCCGAACGCG ACGGCGATAT CCTGTACAAC 
AGTGCCGTGC TGATCGCGCC GGGCGGCACC ATCACCACCT ATCGCAAGAC GCATCTGACC 
GAGGACGAGC GGGGCTGGGC GCAGCCTGGC GACAGCTTCG TCGTGAGCGA TACGCCGCTT 
GGCCGCGTCG GCCTGCTGAT CGGCCACGAT GCGATGTTTC CTGAAGCCGG GCGCGTGCTG 
GCGCTCCGCG GCTGTGACAT CATCGCGTGC CCGGCGGCGA TCGAGACCCG GTTCAGCACG 
CCGCACGCCG GCACCAGCGT CAAACAGTCG GCACCGATCC CGACTGGCGC CGATCCGCAC 
CATTGGCATC ACTTCCGCGT CCGCGCCGGC GAGAACAATG TGTTCTTCGC TTTCGCCAAT 
GTGGTGGATA GAGCGCGCGG CTATCCCGGG CTGAGCGGCG TGTTTGGGCC GGATACGTTC 
GAATTCCCGC GCCGCGAGGC ACTGATCGGG AGCGAGGAGG GCATTGCCAC CGCGATGATC 
GACACCTCCA ATCTCGACAG CGTGTATCCG ACCAATGTGG TGCGGCGGAA GGATCTGGTG 
GCGATGCGGA TGCCGCACAG CTATCGGCCG CTGGTGCAGG CGATGGCCGG CAACTACTAA

Protein sequence

MSQLLKVATV QFEPIMAEKE RNVARLLELC EEAAVGGAKL IVTPEMGTTG YCWYDRAEVA 
PFVEPIPGPT TARFAALARK HDCYIVVGLP EVDEDGIYYN SAVLIGPEGL IGRHRKTHPY 
ISEPKWSAAG DLHNQVFDTP IGRIALLICM DIHFVETARL MALGGADIIC HISNWLAERT 
PAPYWISRAF ENSCYVIESN RWGLERTVQF SGGSCVIAPD GGIAAVIDGG DGVAFAEIDL 
DTARARQIGG EAVFRQRRPE LYPELLTGTF SWNPYDFFGL YGHEAWPKGK RSKLSGAQFA 
PVADLSANLD RIEALARQAK ADGAEMVVFP ERSLTGLDDP ARTAVAVPGP ATDRLAALAS 
ELSLYLVCGL AERDGDILYN SAVLIAPGGT ITTYRKTHLT EDERGWAQPG DSFVVSDTPL 
GRVGLLIGHD AMFPEAGRVL ALRGCDIIAC PAAIETRFST PHAGTSVKQS APIPTGADPH 
HWHHFRVRAG ENNVFFAFAN VVDRARGYPG LSGVFGPDTF EFPRREALIG SEEGIATAMI 
DTSNLDSVYP TNVVRRKDLV AMRMPHSYRP LVQAMAGNY