Gene Rleg_0163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0163
Symbol
ID	8011394
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	162020
End bp	164020
Gene Length	2001 bp
Protein Length	666 aa
Translation table	11
GC content	61%
IMG OID	644822754
Product	Sigma 54 interacting domain protein
Protein accession	YP_002974013
Protein GI	241202917
COG category	[R] General function prediction only
COG ID	[COG4178] ABC-type uncharacterized transport system, permease and ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGACG CTAAACTTAA ACCGAAATCG GTCGACGGCA CCGAACCGCA CGGTGCCGGG 
AACTCGCCCC AGGAGACGGC ATCGACTGTC GAGGTCATGC CGCCACCAGA TGCCATCGAG 
CCCGATCCGG AGTTGACACC TGAAGAGGCC GAGCAGGCGC GCAAGCGGTA TCTGCTCAAA 
CGTTTCTGGA TCAGCGCGCG CCGTTACTGG GGTCGCGGTG GCGACAAGTT CGCTTGGCCC 
TTCTCGATCG GGCTATTGGC CCTGATCGGC ATGAATGTCG GCTTCCAGTA CGGAATCAAT 
CTGTGGAACC GCGGGATCTT CGACGCCATA GAGCGACACG ATGCCGGCAC CGTCTATTTC 
CTGACCGCCG TATTCGTGCC GCTTGTGCTC GGAACCGTCG CCATTGTCAC GATACAGGTC 
GCCGTTCGCA TGATGATCCA ACGTCGCTGG CGTTCCTGGC TGACAACATC AGTCATCGCG 
CGCTGGCTTG CAAACGGCCG TTACTATCAG TTGAATCTCA TCGGCGGCGA CCACAAGAAC 
CCGGAAGCGC GCATTTCCGA GGATTTGCGG ATTGCCACCG AAGCACCCGT CGATTTCATC 
GCCGGTGTCA TTTCCGCATT TCTGGCGGCC TCGACCTTCA TCGTGGTGCT CTGGACGATC 
GGCGGGGCTC TCACTCTGCC GATCGCAGGT TTCCCCGTTA CCATTCCCGG CTTTCTCGTC 
GTCACTGCGG TCCTCTACGC CGCGATCACC TCTACTTCGA TGGCGGTCAT CGGCCGCTAT 
TTCGTCCACG TCTCCGAGGC CAAAAATCAA GCAGAAGCCG AGTTTCGCTA CACGCTGACG 
CATGTCAGGG AAAACGGCGA GAGCATCGCG CTTCTCGGCG GCGAAGAGGA GGAGCGTAAC 
GACCTCGATA AGACCTTCGC CAATGTGCTA AGGCAATGGG CGCTGCTTGC CCGCCAGCAC 
ATGCGCACAA CGCTTGTGTC GCATGGGTCG ATGCTGATTG CGCCAGTCGT CCCGGTCCTG 
CTTTGCGCAC CAAAATTTCT CGAAGGCAGC ATGAGCCTCG GACAGGTCAT GCAGGCCGCC 
TCTGCTTTTG CCATCGTTCA GGGCGCGTTC GGCTGGCTGG TCGACAACTA TCCCCGTCTT 
GCCGATTGGA ATGCCTGTGC ACGGCGCATC GCCTCGCTGA TGATGTCGCT CGACGGGCTG 
GAGCGCGCCG AACAGAGCGA CTCGCTCGGG CGCATCAAGC ATGGTGAAAC CGAAGGCGAG 
GCGATGCTCA GCCTCAACGA TCTCTCCGTG TCGCTTGACG ATGGCACCGC CGTGGTGACG 
GAAACCCGGG TCGAAATCGA GCCCGGCGAG CGGGTGCTTG TGTCCGGTGA ATCCGGGTCG 
GGCAAGAGCA CGCTGGTGCG GGCCATCGCG GGTCTTTGGC CGTGGGGCGG CGGCAGCGTC 
AATTTCCATG CCGACCGGCG ATTATTCATG TTGCCGCAAC GGCCCTATAT CCCTTCGGGC 
ACGCTTCGCC GTGCGGTCGC CTATCCGGGC GCCGCCGATA GCTGGCCGCT GGACGAGATC 
AAGGCGGCTC TCGACAAGGT GGGACTGGAT TATCTGAACG ACAAGATCGA GGAAGATGCG 
CCCTGGGACC AGACCTTGTC GGGTGGCGAA AAGCAGCGGC TCGCCTTTGC GCGTCTGCTG 
CTGCACCAAC CCGATATCAT CGTGCTGGAT GAAGCAACGG CAGCACTCGA TGAGAAGAGC 
CAGGATAAGA TGATGCAGAT GGTGATCGAT GAATTGCCTG AAGTCACCAT CCTGAGCGTC 
GCGCATCGCG CTGAGCTGGA AGTCTTCCAT AGCCGCAAGA TCACGCTCGA GCGGCGCGAG 
GGCGGCGCAA AGCTTGTCAG CGATATCGAC CTGATCAAGC GCAAGAGAAA ACGGAACTTG 
CTGTCACGCG TTTTGGAGAA GCGGCGCTCC CCGCCGAAAG GCAGTACGAC CGCGAATGAA 
GGCGGCACAG TCCCCGAATA G

Protein sequence

MADAKLKPKS VDGTEPHGAG NSPQETASTV EVMPPPDAIE PDPELTPEEA EQARKRYLLK 
RFWISARRYW GRGGDKFAWP FSIGLLALIG MNVGFQYGIN LWNRGIFDAI ERHDAGTVYF 
LTAVFVPLVL GTVAIVTIQV AVRMMIQRRW RSWLTTSVIA RWLANGRYYQ LNLIGGDHKN 
PEARISEDLR IATEAPVDFI AGVISAFLAA STFIVVLWTI GGALTLPIAG FPVTIPGFLV 
VTAVLYAAIT STSMAVIGRY FVHVSEAKNQ AEAEFRYTLT HVRENGESIA LLGGEEEERN 
DLDKTFANVL RQWALLARQH MRTTLVSHGS MLIAPVVPVL LCAPKFLEGS MSLGQVMQAA 
SAFAIVQGAF GWLVDNYPRL ADWNACARRI ASLMMSLDGL ERAEQSDSLG RIKHGETEGE 
AMLSLNDLSV SLDDGTAVVT ETRVEIEPGE RVLVSGESGS GKSTLVRAIA GLWPWGGGSV 
NFHADRRLFM LPQRPYIPSG TLRRAVAYPG AADSWPLDEI KAALDKVGLD YLNDKIEEDA 
PWDQTLSGGE KQRLAFARLL LHQPDIIVLD EATAALDEKS QDKMMQMVID ELPEVTILSV 
AHRAELEVFH SRKITLERRE GGAKLVSDID LIKRKRKRNL LSRVLEKRRS PPKGSTTANE 
GGTVPE