Gene Rleg_1247 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1247
Symbol
ID	8015541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	1224840
End bp	1226198
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	62%
IMG OID	644823828
Product	hypothetical protein
Protein accession	YP_002975078
Protein GI	241203982
COG category	[S] Function unknown
COG ID	[COG4222] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.171773
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0628011
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAACG TCCTTTTTGC TTCCGTATCG CTTTTCATCC TTGTCGCGGG CGCCGCTTCG 
GCCGACCAGC AGCAGTTCCC GGCCAAACTC GCCGGCCAGG CGATCCTGCC CGCCAACACC 
ATGGTTCCGG CACCGGCCGA TGCCCCCGAA TTCCTCAAGC ATTCCGGCAA GTTTACGACG 
CCGGACCGTA AGCGCGCCGA AGCGCTCGGC ACCGCTCCCG GCAAGGACGG CGCCCGCATC 
ATCGATCTGA AGCTTCCCTT CGACGGTCAG CCGATCCAGG GTTTCTCAGG GGTCAAGACG 
ATGGCCGACG GCACCTTCTG GACGCTCTCC GACAACGGCT TCGGCTCGAA GTCCAACTCG 
TCTGACTCCA TGCTCTTCCT GCACCAGATG AAGTTCGACT GGGCCGGCAA CAAGGCTGAA 
GTCGTCAAGA ACCTCTTCCT TTCCGACCCC AACAAGATTG CACCGTTCCC GATCGTGCTT 
GAAGGCACCG ACACGCGTTA TCTCACCGGC GCCGACTTTG ACATCGAATC GATCCAGCCG 
GTTGTAGACG GCTTCTGGCT CGGCGACGAA TTCGGTCCCT ACATCCTGAA GTTCGACACG 
TCAGGCCGCC TCACCGACGT CATCCCGACG ACGCTCGACG GCAAGCCGGT GCTTTCGCCC 
GACAATCCAC TTCTCTCGGT TCCGGCCAAC CCGGCCGCCA AGATGCCGGT CTTCAATCTG 
AAGCGCTCCG GCGGCTTCGA GGGCCTCGCC ATGTCCAAGG ACGGCGCCAA GCTCTACGGC 
CTGCTCGAAG GCGCCATCTA CAAGGATGAC CGCACGGTAG AAACCATCGA CGGCCACACC 
GCCATCCGCG TCATCGAGTT CGATGTCGCG TCCAAGAAGT GGACCGGCCG CAGCTGGCTC 
TATCCGTTCG AGGACAAGGG GGTATCGATC GGCGACTTCA ACGTGCTCGA CGACACCACC 
GCTCTCGTCA TCGAGCGCGA CAACGGCGCC GGCACGACGG ACAGGGCCTG CGCCGACCCG 
AAGCAGCCGA AGCCGGATTG TTTCGAAGCT CCGGCCGTGC TGAAGCGCGT CTACAAGATC 
GAGTTCAACG ACGCCAATGT CGGCAAGGCG GTCCGCAAGA TCGGCTATAT CGACCTCCTG 
AACATTCAGG ACCCCGACAA CAAGAAGAAG GCCGGCAGCA AGGACGGCGT CTACGACATG 
CCGTTCGTGA CGATCGAAAA CGTCGATCGC GTCGACGCCA CGCACATCAT CATCGGCAAC 
GACAACAACC TGCCCTTCTC GGCCGGCCGC GCCGTCGACA AGGCCGACAA TAACGAGTTC 
AGCCTGCTTG AGGTTGGCGA GTTTTTGAAC GCGAAGTAG

Protein sequence

MKNVLFASVS LFILVAGAAS ADQQQFPAKL AGQAILPANT MVPAPADAPE FLKHSGKFTT 
PDRKRAEALG TAPGKDGARI IDLKLPFDGQ PIQGFSGVKT MADGTFWTLS DNGFGSKSNS 
SDSMLFLHQM KFDWAGNKAE VVKNLFLSDP NKIAPFPIVL EGTDTRYLTG ADFDIESIQP 
VVDGFWLGDE FGPYILKFDT SGRLTDVIPT TLDGKPVLSP DNPLLSVPAN PAAKMPVFNL 
KRSGGFEGLA MSKDGAKLYG LLEGAIYKDD RTVETIDGHT AIRVIEFDVA SKKWTGRSWL 
YPFEDKGVSI GDFNVLDDTT ALVIERDNGA GTTDRACADP KQPKPDCFEA PAVLKRVYKI 
EFNDANVGKA VRKIGYIDLL NIQDPDNKKK AGSKDGVYDM PFVTIENVDR VDATHIIIGN 
DNNLPFSAGR AVDKADNNEF SLLEVGEFLN AK