Gene Rleg_6099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_6099
Symbol
ID	8016056
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012852
Strand	-
Start bp	136401
End bp	137561
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	63%
IMG OID	644827405
Product	fumarylacetoacetate (FAA) hydrolase
Protein accession	YP_002978605
Protein GI	241258721
COG category	[R] General function prediction only
COG ID	[COG3970] Fumarylacetoacetate (FAA) hydrolase family protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.59157
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCAAC CTCTGCTCGA TGTCGCCGCT TCGGATGGTC TTTTTGTCGG TCGCATCTGG 
AATCCCGAAG TGCAGGGACC GAGCATTGTG ACGCTGCGCG AGGGTATACT GGTCGACATC 
ACGTCGCGCG AGGCGCCGAC GCTGAGCGCC CTGCTCGAGC GGCAGGATGC CGCCACCTTC 
GTCCGTGCAG CAAGTGGCAA GGCGGTTGGC TCGCTGGCGG ACATCGCCGC CAACAGTACC 
GGAGCTCCGG ATCAAACGCA CCCTTATCTC CTTGCGCCCG TCGACCTGCA GGCAGTGAAA 
GCCTGCGGCG TCACCTTTGC GCAGTCGATG ATCGAGCGCG TCATCGAGGA GAAGGCGGCC 
GGCAGTCCGG AGCGTGCCGC CTCGATCCGC GAGCGCGTCA GCACGCTGAT CGGTGGCAGC 
CTCACCAATC TGAAGGCCGG CTCACCGGAG GCTGCCAAGG TCAAGCAGGC ACTGATCGAC 
GAAGGCATGT GGTCGCAATA TCTGGAGGTC GGTATCGGGC CGGACGCCGA AGTCTTCACC 
AAGTCGCCGG TGCTCTCCTC CGTCGGCTGG GGTGCGGATG TCGGCCTGCA TCCGATCTCG 
ACCTGGAACA ATCCCGAGCC GGAAATCGTG CTCGCGGTCA ACAGCCGCGG CGAAATCACG 
GGGGCGACTC TCGGCAACGA CGTCAACCTG CGCGACGTCG AGGGCCGCTC GGCGCTGCTG 
CTCGGCAAGG CCAAGGATAA CAATGCCTCC TGCTCGATCG GTCCTTTCAT CCGCCTGTTC 
GATGCCGGCT ACAGCCTCGA TGATGTACGC AAGGCCGAAC TCGACCTGAA GGTGTCAGGC 
CAGGATGGCT TCGTGATGCA CGGCAAGAGT TCGATGTCGC AGATCAGTCG CGATCCGACC 
GATCTCGTCA AGCAGACGGT CGGCGCCCAT CATCAATATC CCGACGGTTT CATGCTTTTC 
CTCGGCACGC TGTTTGCGCC GACTCAGGAC CGCGACGCGC CGAAGCAAGG CTTTACCCAC 
AAGATCGGCG ATGTCGTCGA GATTTCCTCG GCAGGCCTCG GCGCGCTCAT CAACACCGTG 
CGCCTCTCCA CCGAATGCCC GCCCTGGACC TTCGGCATTT CGGCGCTGAT GAGCAATCTG 
GCAAAGCGCG GTCTTCTCTA A

Protein sequence

MSQPLLDVAA SDGLFVGRIW NPEVQGPSIV TLREGILVDI TSREAPTLSA LLERQDAATF 
VRAASGKAVG SLADIAANST GAPDQTHPYL LAPVDLQAVK ACGVTFAQSM IERVIEEKAA 
GSPERAASIR ERVSTLIGGS LTNLKAGSPE AAKVKQALID EGMWSQYLEV GIGPDAEVFT 
KSPVLSSVGW GADVGLHPIS TWNNPEPEIV LAVNSRGEIT GATLGNDVNL RDVEGRSALL 
LGKAKDNNAS CSIGPFIRLF DAGYSLDDVR KAELDLKVSG QDGFVMHGKS SMSQISRDPT 
DLVKQTVGAH HQYPDGFMLF LGTLFAPTQD RDAPKQGFTH KIGDVVEISS AGLGALINTV 
RLSTECPPWT FGISALMSNL AKRGLL