Gene Rleg_5450 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5450
Symbol
ID	8016759
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012853
Strand	+
Start bp	27720
End bp	29678
Gene Length	1959 bp
Protein Length	652 aa
Translation table	11
GC content	56%
IMG OID	644827623
Product	peptidase C14 caspase catalytic subunit p20
Protein accession	YP_002978823
Protein GI	241518195
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.530037
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.170483
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTTGC GGAATCTAGA GAATTTTCGG GGGCAGTGTT TACGCGCGGT TCGGGAGCAG 
TGGTTGAGCA AGGCACGTGT CTTCGCGCTT GCAGCGCTTG CCTTTCTTGT GCTGGCCAAT 
GCGTCGAAGG GGGTCGAACC GAAATATTTG CAGGAGCGAC CCCCAACTTA TCACGCCTTC 
ATCTTCGGCA ACGACGCCTA CGAAGCACTG CCGGAAATCA AAAGCGCGGC TCGCGACTTC 
GAGAAGATGA GAGAGTACTT CGCCAATGCG AAATACCGCA TCTGGGACAT GGACGGCGCA 
GGCAAGTTCA AGTCTGTCGA TCAGTTCTAC AAGTACATGA AAGACGCACT CACGCAAATC 
CAGCCGGGCG ACGTGGTTGT CCTCTATTAC TCTGGCCACG GTTTTCATTA CGGCAACCAG 
GACTGGCTTG TCCCTTTGGA CTACCCGGCG GGCACCGTCG ACCAACAATT GCTCTTCAAG 
CACGCGGTCG GCGTCGACGA CGTTATTGCC GGACTCGCAA AACGCCGTAT CGATTACGCC 
GTCGCTATAA TTGACGCCTG CAGGACCCAA CCTCCCTTCC AGTTTAGAAC GCCTGGCGGA 
ACATTCCTCA ATGGTGAGCC GAGGTTGCCT GCTTTCAGCT ACACCGGGCC CTCCCTGACA 
GCTTGGAGCA TTGGCGTCCC AACATACGCT GGAGGGACTG CGATCGGCAC CGATTCCCCA 
GATGAAATGA GCGTGTACAG CGGGATATTT CTCGAAGCCC TGAGAAAGAA GCCCCGGATC 
AGTGAGTTGC AGCCGGAACT CGCCGTCGCA GTTCTCCGCC TGGCCTCTGA GGGAAGGATT 
GCACCAAACG AAATCGCACC TCGCTTCTTC AGTTCGAGGG ACTTCACGTT CGATGCCAGT 
CCCGATCCCA CACTTGTAGC GGGTCAAAAA CAAGAATGGC TTACAGCGAT TACGGAACCC 
TCGAGGTCAA TCGTGAGTGC CTTTATGGTT CGTAATCCAG GTAGCGCCTT CTCGTCCGCC 
GGATGGAAAT ACATCGACGA TCATGCAGGC GAGCCGGAGG ACGCTGGCGG AAGCAGCCTC 
ACCTCTGCGG ATGCAATCGA CTACGCCTTT CACGAAGCGC AGCTAACCGG GAAGATGGTG 
GCCATCGCAA CGTCTGGGTT CGACGTCAAT TTCCCGCGAA ACACGATTGG CCTTCCAGCG 
GTTGACAGGG ATCTGCTGCA GAACGCGATC GCGTATGTAG ACAAACCCGG AGAAATCGGC 
GACGCCTATA CCGCTCGCTA TGAGGCCAAA GGCTCGAAAC AGAACTTCGA CATCGACATT 
ATTGGCGCGG CCGGCGCACT GGCCGTCAAC ACTGGCCAAA CCTCCAGACC CGTTCCTGAT 
GTTACTGCCC TTCCTACGTT CACCTTTGGC CGTTCTTCGT CGATACAGAT CAACAGGACA 
TTTTTCGACG ACAACAGCGG AAAGCTTTAC GCCGAAATCG CACCTGGCCA GGAAGCCGTT 
GGCCCCCCCT CGTCCAGCGT TTGGACGGAC TTCAATTATC GTGGCGGAAA ACAGCCCTCG 
TTCAACAATC TGAACCGCGC GCTCCGTGAG GTCATCATCG ACGGCCCCCA GCTGGCCGAT 
CACTCCATCG CAAAGATAAC TGAAGACGTC AGGCGATCGA GCAAGGACAT CTTATGGGTA 
TCTATCGCAG TCGAATACCG CCCGCCCGAC CTGTCCGAAT ATCAAAATCG GAAGGCTAAG 
GCCGAGACCG ACCAAGCAGC TGCAGCTATA GACCGAGAGC TGGATAACAC AGTCAGAACG 
GACCGCCTTG CCTTGGCAGA AGCGCGATTG CGCGCCCAGG ACGCTCGAAT TCAACTGATT 
GACGCAGGAA TCGACGGAAA GCGGATTACG ACGGTGGGCG TCGATGCCGG GCAATCTCTC 
GGCAATCGAG TGCGCCTGCG TTTTTTTGGC TCGCGTTAA

Protein sequence

MTLRNLENFR GQCLRAVREQ WLSKARVFAL AALAFLVLAN ASKGVEPKYL QERPPTYHAF 
IFGNDAYEAL PEIKSAARDF EKMREYFANA KYRIWDMDGA GKFKSVDQFY KYMKDALTQI 
QPGDVVVLYY SGHGFHYGNQ DWLVPLDYPA GTVDQQLLFK HAVGVDDVIA GLAKRRIDYA 
VAIIDACRTQ PPFQFRTPGG TFLNGEPRLP AFSYTGPSLT AWSIGVPTYA GGTAIGTDSP 
DEMSVYSGIF LEALRKKPRI SELQPELAVA VLRLASEGRI APNEIAPRFF SSRDFTFDAS 
PDPTLVAGQK QEWLTAITEP SRSIVSAFMV RNPGSAFSSA GWKYIDDHAG EPEDAGGSSL 
TSADAIDYAF HEAQLTGKMV AIATSGFDVN FPRNTIGLPA VDRDLLQNAI AYVDKPGEIG 
DAYTARYEAK GSKQNFDIDI IGAAGALAVN TGQTSRPVPD VTALPTFTFG RSSSIQINRT 
FFDDNSGKLY AEIAPGQEAV GPPSSSVWTD FNYRGGKQPS FNNLNRALRE VIIDGPQLAD 
HSIAKITEDV RRSSKDILWV SIAVEYRPPD LSEYQNRKAK AETDQAAAAI DRELDNTVRT 
DRLALAEARL RAQDARIQLI DAGIDGKRIT TVGVDAGQSL GNRVRLRFFG SR