Gene Rleg2_5009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5009
Symbol
ID	6978103
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	-
Start bp	656957
End bp	657979
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	54%
IMG OID	643394155
Product	Nitrilase/cyanide hydratase and apolipoprotein N-acyltransferase
Protein accession	YP_002278973
Protein GI	209547055
COG category	[R] General function prediction only
COG ID	[COG0388] Predicted amidohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAAGCA TTAACTTCAA GGCCGCTGCT GCTCATGTTG CCCCGGTTTA TCTGGAACCC 
GTGGCGAGCG CTGAGAAAGC GTGCTCGGTA ATCGCAGAGG CTGCCCGAAA CGGGGCATCC 
CTTGTAGTTT TTTCCGAGAG CTTTCTTCCC GGGTTTCCCG TCTGGGCAGC GCTTTATCCA 
CCCATCCAAT CGCATGGACA TTTCAAGCGC TTCCTGAACG CTTCCGTATA TATGGATGGG 
CCAGAAATTG ATCGTGTCCG GAAAGCTGCA TCAAAAAGCG GTGTTTTCGT ATCCATCGGG 
TTCTCCGAGC GCAATCCAGC GAGTGTCGGA GGTCTGTGGA ACAGCAATGT CTTGATTTCC 
GATACGGGCG AAATCCTGAT CCATCATCGA AAGCTTGTGG CAACTTTCTT CGAAAAACTG 
GTTTGGGATC CAGGCGATGG CGCGGGTCTG GTCGTGGCAG AGACACGAAT CGGACGTATT 
GGAGGCCTGA TCTGCGGCGA AAACACGAAT CCGCTTGCGC GCTATAGCCT GATGACGCAG 
TCAGAGCAGG TTCACATAAG TAGTTACCCG CCGATCTGGC CAACTCGTGT TCCGACGGAG 
AGCGAGAACT ACGATAACCG AGCGGCCAAC CGGATCCGTG CCTCGTCCCA TTGCTTCGAG 
GCCAAGTGCT TCGGCATCGT CGTCGCAGGT CGCCTTGACG AAGCAGCGTG CAAAGCCATT 
GCCCTGGATG ACACAGCTAT TTCAGCAATT ATAGATGCCA GTCCGCAGGC CAGCAGTTTT 
TTCCTTGGGC CGACCGGGGC GCCAATAGGT GATGAAATGA TTGATGAAGG AATCGGCTAC 
GCCATTATCG ATCTTGATGA TTGCGTTGAA CCTAAGCGGT TTCACGACGT CGTTGCTGGT 
TACAACCGCT TTGATATATT CGACGTCGTC GTTAACCGGA CACGCCGCCA ACCGATCAGG 
TTTCTGCAAG CTCGCTCCGA GGAAGCTCTG GTCGAGCCCG GGGCAATGGC TTTGCAGGAG 
TAA

Protein sequence

MGSINFKAAA AHVAPVYLEP VASAEKACSV IAEAARNGAS LVVFSESFLP GFPVWAALYP 
PIQSHGHFKR FLNASVYMDG PEIDRVRKAA SKSGVFVSIG FSERNPASVG GLWNSNVLIS 
DTGEILIHHR KLVATFFEKL VWDPGDGAGL VVAETRIGRI GGLICGENTN PLARYSLMTQ 
SEQVHISSYP PIWPTRVPTE SENYDNRAAN RIRASSHCFE AKCFGIVVAG RLDEAACKAI 
ALDDTAISAI IDASPQASSF FLGPTGAPIG DEMIDEGIGY AIIDLDDCVE PKRFHDVVAG 
YNRFDIFDVV VNRTRRQPIR FLQARSEEAL VEPGAMALQE