Gene Rleg2_1100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1100
Symbol
ID	6979819
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	1121837
End bp	1123195
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	62%
IMG OID	643395812
Product	hypothetical protein
Protein accession	YP_002280620
Protein GI	209548703
COG category	[S] Function unknown
COG ID	[COG4222] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.137961
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAACG TCCTTTTTGC TTCCGTATCG CTTTTCATCC TGATGACCGG CTCCGCTTCG 
GCCGACCAGC AGCAGTTTCC GGCCAAGCTC GCCGGCCAGG CGATCCTGCC TGCCAACACC 
ATGGCTCCGG CTCCGGCCGA TGCCCCTGAA TTCCTGAAAC ATTCCGGCAA GTTCACGACG 
GCGGACCGCA AGCGCACCGA AGCGCTCGGC ACAGTTCCCG GCAAGGACGG CGCCCGCGTC 
ACCGACCTGA AGCTTCCCTT CGACGGCCAG GCGATCCAGG GCTTCTCCGG CATCAAGACG 
ATGGCCGACG GCACCTTCTG GACGCTGACG GACAACGGCT TCGGCTCGAA GGCCAATTCC 
TCGGACTCCA TGCTCTTCTT GCACCAGATG AAGTTCGACT GGGCAGCCAA CAAGGCTGAC 
GTCGTCAAGA ACCTGTTCCT CTCCGATCCG AACAAGATCG CCCCCTTCCC GATCGTGCTC 
GAAGGCACCG ATACGCGCTA CCTCACCGGC GCCGACTTCG ACATCGAATC GATCCAGCCG 
GTTGCCGACG GTTTCTGGCT GGGCGACGAA TTTGGCCCCT ATATCCTGAA AATCGATACC 
CAAGGCCATC TGACCGACGT CATCGCGACG ACGCTCGACG GCAAGCCGGT GCTTTCGCCC 
GACAATCCGC TGATCCAGCT CCCGGGCAAC CCGGCTGCCA AGATGCCGGT CTTCAACCTG 
AAGCGCTCCG GCGGCTTCGA AGGCCTCGCC ATGTCGAAGG ACGGCGCCAA GCTCTACGGC 
CTGCTCGAGG GCGCCATCTA CAAGGATGAC GGCCAGATGG AATCGGTCGA CGGCCACACC 
GCCGTCCGCG TCATCGAATT CGACGTCGCC GCCAAGAAGT GGACCGGCCG CAGCTGGCTC 
TATCCGTTCG AGGACAAGGG TGTGTCGATC GGCGACTTCA ACATGCTCGA TGACACCACC 
GCTCTCGTCA TCGAGCGCGA CAGCGGCGCC GGCACCAAGG ACAAGGCCTG CGCCGACCCG 
AAGCAGCCGA AGCCGGATTG CTTCGAGGCC CCGGCCGAAC TGAAGCGCGT CTACAAGATC 
GAGTTCAACG ACGCCAATGC CGGCAAGGCC GTCCGCAAGA TCGGCTATAT CGACCTGTTG 
AATATCCAGG ATCCCGACAA CAAGAAGAAG GCCGGAGCCA AGGAAGGCGT CTACGACATG 
CCGTTCGTGA CGATCGAAAA CGTCGACCGC GTCGACGCCA CGCACATCAT CATCGGCAAC 
GACAACAACC TACCCTTCTC GGCCGGCCGC GCCGTCGACA AGGCTGACAA TAACGAGTTC 
AGCCTGCTTG AGGTCGGCGG GTTTTTGAAC GCGAAGTAA

Protein sequence

MKNVLFASVS LFILMTGSAS ADQQQFPAKL AGQAILPANT MAPAPADAPE FLKHSGKFTT 
ADRKRTEALG TVPGKDGARV TDLKLPFDGQ AIQGFSGIKT MADGTFWTLT DNGFGSKANS 
SDSMLFLHQM KFDWAANKAD VVKNLFLSDP NKIAPFPIVL EGTDTRYLTG ADFDIESIQP 
VADGFWLGDE FGPYILKIDT QGHLTDVIAT TLDGKPVLSP DNPLIQLPGN PAAKMPVFNL 
KRSGGFEGLA MSKDGAKLYG LLEGAIYKDD GQMESVDGHT AVRVIEFDVA AKKWTGRSWL 
YPFEDKGVSI GDFNMLDDTT ALVIERDSGA GTKDKACADP KQPKPDCFEA PAELKRVYKI 
EFNDANAGKA VRKIGYIDLL NIQDPDNKKK AGAKEGVYDM PFVTIENVDR VDATHIIIGN 
DNNLPFSAGR AVDKADNNEF SLLEVGGFLN AK