Gene Rpal_1751 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1751
Symbol
ID	6409408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	1879217
End bp	1880266
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	63%
IMG OID	642711639
Product	Nitrilase
Protein accession	YP_001990754
Protein GI	192290149
COG category	[R] General function prediction only
COG ID	[COG0388] Predicted amidohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.134006
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTCCTC ACTTCAAAGC CGCTGCGATA CACGCCGCGC CCGTATTCCT CGATAAGACT 
GCGACTACAA AAAAGGCGAT CTCGCTCATC CGTGAGGCAG TCGCTGCGGG TGCGGAGCTG 
GTTGCATTTC CGGAGACTTA CATCCCGGCG TTTCCGGTTT GGGCGGCGTT GTGGGCGCCG 
ATCGACAACC ACGATCTGTT CGTGCGAATG GCTGATCAGT CGGTGCTGAT CGATGGTCCC 
GAGGTGAAAG CGATCCGGGA CGAGGCTCGG CGGCTCGGCG TCGTGGTGTC GATCGGTATC 
AGCGAGAAAT CGCCGGCCAG CGTGGGTGGG ATCTGGAACT CCAATCTATT GATCGGCGAG 
GACGGCGAGA TCCTCAACCA TCACCGTAAG CTGGTTCCGA CCTTCTACGA GAAGCTGATC 
TGGAGCGCCG GTGACGGCGC GGGTCTCCGC GTCGTCGACA CGCGGCTCGG CAAGATCGGT 
CAATTGATCT GCGGCGAAAA CACCAATCCG CTGGCGCGCT ATGCATTGAT GGCGCAGGGC 
GAGCAGTTCC ATATCTCGAG CTGGCCGCCG GTCTGGCCGA CCCGGCGTCC GGCCGAAGGC 
GGAAACTATC ACATTGCGGC GGCGACCCGG ATTCGCGCCA GCGCGCATTG CTTCGAAGCG 
AAGGTCTTTG GTCTTGTCAC GTCCGGCGTG CTCGACAAGG CCGCGCGCGA CATGCTGGTG 
GCGCGCGATC CGTCGGCCGC AGCCGTGCTC GACGGCACGC CGCGCGCGGC GACATTCTTC 
TTGGACCCGA CAGGCGAGCA GATCGGCGAA GCGCTCTGCG AGGACGAGGG CATTCTGTAT 
GCCGATATCG ATCTCACCCG ATGCGTCGAG CCCAAGCAAT TTCACGACGT GGTCGGCTAC 
TACAACCGGT TCGATGTTTT CGCCGTCAGC ATCAGCCGTC ACCGGCTGAC GCCGGCGACG 
TTCATCGACG ATCTGCCACT CCCCGCAGTC GTGGACAATG TCGAAGACAA GGTCGGGCGC 
GCGCCGAACG CGGCGCCCGT AGCCCTTTAA

Protein sequence

MLPHFKAAAI HAAPVFLDKT ATTKKAISLI REAVAAGAEL VAFPETYIPA FPVWAALWAP 
IDNHDLFVRM ADQSVLIDGP EVKAIRDEAR RLGVVVSIGI SEKSPASVGG IWNSNLLIGE 
DGEILNHHRK LVPTFYEKLI WSAGDGAGLR VVDTRLGKIG QLICGENTNP LARYALMAQG 
EQFHISSWPP VWPTRRPAEG GNYHIAAATR IRASAHCFEA KVFGLVTSGV LDKAARDMLV 
ARDPSAAAVL DGTPRAATFF LDPTGEQIGE ALCEDEGILY ADIDLTRCVE PKQFHDVVGY 
YNRFDVFAVS ISRHRLTPAT FIDDLPLPAV VDNVEDKVGR APNAAPVAL