Gene Rleg_1109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1109
Symbol
ID	8012231
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	1093056
End bp	1094297
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	65%
IMG OID	644823692
Product	putative RNA polymerase, sigma-24 subunit, ECF subfamily
Protein accession	YP_002974943
Protein GI	241203847
COG category	[K] Transcription
COG ID	[COG4941] Predicted RNA polymerase sigma factor containing a TPR repeat domain
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.107204
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGAAAGCG TGATCGAGGA AATCTATCGG ACGCAGTCGC GCCGGGTGCT GGCGACGCTG 
ATCCGCCTGC TCGGCGATTT CGACCGGGCG GAGGAAGCGC TTCACGACGC CTTTGCCGCG 
GCCGCGCGGA CATGGCCGAC GGACGGTATT CCCGGCAATC CAGTTTCCTG GCTTGTTTCC 
ACCGGGCGCT TCAAGGCGAT CGACACGATC CGGCGGCGGG CGCGTTTCGA TGCTTCGCAG 
CATCATATCG AGGACAGCCT CTACACGCCC GATGCAACGG AGATCGGCGA CATGGAACCG 
ATCGAGGACG ACATGCTGCG GCTGATCTTC ACCTGCTGCC ATCCTGTTAT TCCCGCCGAT 
GCGCAGATGG CGATGGCGCT CCGGGAAATC TGCGGGCTGA CCACCGAAGA GATCGCCCAT 
GCCTTCCTCA TTCCAGCGCC GACGGTCGCC CAGCGGATCG TGCGCGCCAA GAGCAGGATC 
CGGGCGGCAA AGATCCCCTA CGAGGTGCCC GGCCGCGAGG CACTGCCGCC GCGGCTCGAC 
CGGGTGCTGC ACGTCATCTA TCTCGTCTTC AATGAAGGTT ATTCGGCCTC CTCCGGCGAG 
GAGGTGGTCC GCGCCGACCT GACGGCGGAG GCGATTCGGC TGGCGCGGCT GCTACTGACG 
CTGCTGCCGC ATCCCGACGT CTGCGGCCTG CTGGCGCTGA TGCTGTTGCA GGATTCCCGC 
CGCACCGCCC GCCGCGGCGA GCAGGGATCG CTGGTGCTGC TTGCCGATCA GGACCGCTCG 
CTCTGGGATC ATGCAAAGAT TACCGAAGGC CTCGCGCTGC TCACGGAAGC GATGCGGGCG 
GGAGAGATCG GCACCTATAC GCTGCAAGCG GCGATCGCTG CCGAGCATGC CCGAGCGCCG 
GCTGCCGAAG AGACCGACTG GCGGCGGATC GCTTTCTATT ACGATCTGCT TCTGGCGGCG 
CAGCCCTCCC CGATTGTCGA GCTCAACCGT GCCGTGGCGA TTGCGATGGC GGAAGGGCCT 
GCAAAGGGGC TGGAACTGGT CGATGCCATT CTGGCACGCC GGGAGTTGCA GGCCTATCAC 
CTCGCCCATT CGGCGCGTGC GGATTTCCTG CGCCGTCTCG GCCGGACCGA TGAGGCTATC 
GCGGCCTATG AAACGGCGCT GTCTCTCTGC CGGCAGGAGC CGGAGCAGGC GTTTTTGAGA 
AAACGGATTT CAGAGCTTGC CGCGACGCCC GAGCGGCAGT GA

Protein sequence

MESVIEEIYR TQSRRVLATL IRLLGDFDRA EEALHDAFAA AARTWPTDGI PGNPVSWLVS 
TGRFKAIDTI RRRARFDASQ HHIEDSLYTP DATEIGDMEP IEDDMLRLIF TCCHPVIPAD 
AQMAMALREI CGLTTEEIAH AFLIPAPTVA QRIVRAKSRI RAAKIPYEVP GREALPPRLD 
RVLHVIYLVF NEGYSASSGE EVVRADLTAE AIRLARLLLT LLPHPDVCGL LALMLLQDSR 
RTARRGEQGS LVLLADQDRS LWDHAKITEG LALLTEAMRA GEIGTYTLQA AIAAEHARAP 
AAEETDWRRI AFYYDLLLAA QPSPIVELNR AVAIAMAEGP AKGLELVDAI LARRELQAYH 
LAHSARADFL RRLGRTDEAI AAYETALSLC RQEPEQAFLR KRISELAATP ERQ