Gene Rleg_1454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1454
Symbol
ID	8012543
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	1442032
End bp	1443042
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	58%
IMG OID	644824043
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_002975285
Protein GI	241204189
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.132743
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.477359
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCAGA AGAACTGGCA GGAACTGATC AAGCCGAACA AGGTGGAGTT CTCCTCGAGC 
TCGCGCACCA GGGCGACGCT TGTTGCCGAA CCGCTGGAGC GCGGCTTCGG CCTCACCCTC 
GGCAACGCGC TTCGCCGCGT TCTGCTTTCC TCGCTGCGCG GTGCTGCCGT CACGGCGGTG 
CAGATCGATG GCGTGCTGCA TGAATTCTCC TCGATTCCGG GCGTCCGCGA AGACGTCACG 
GACATCGTGC TCAACATCAA GGAAATCGCC ATCAAGATGG ATGGCGACGA TGCAAAGCGC 
ATGGTCGTGC GTAAGCAGGG CCCTGGCGTT GTCACGGCTG GCGACATTCA GACGGTCGGC 
GATATCGAAA TCCTCAACCC CGAGCATGTC ATCTGCACGC TCGACGAGGG TGCCGAGATC 
CGCATGGAAT TCACCGTCAA CAACGGCAAG GGCTATGTTC CGGCCGAACG CAATCGTGCG 
GAAGATGCTC CGATCGGTCT CATCCCGGTC GACAGCCTCT ACTCGCCGGT CAAGAAGGTG 
TCCTACAAGG TTGAAAATAC CCGCGAAGGA CAGGTTCTCG ATTACGACAA GCTGAACATG 
ACCATCGAAA CCGATGGCTC GATCACCGGC GAAGACGCCG TCGCTTTTGC GGCGCGCATC 
CTCCAGGATC AGCTTGGCGT CTTCGTCAAC TTCGACGAGC CGCAGAAGGA AACCGAAGAG 
GAAGCAGTCA CCGAACTCGC TTTCAACCCG GCTCTCCTGA AGAAGGTGGA CGAACTCGAG 
CTGTCGGTCC GTTCGGCAAA CTGCCTGAAG AACGACAACA TCGTCTACAT CGGCGACCTC 
ATTCAGAAGA CCGAAGCAGA AATGCTCCGC ACACCGAATT TTGGTCGCAA GTCGCTGAAC 
GAAATCAAGG AAGTTCTCGC TTCCATGGGC CTGCACCTCG GCATGGAAGT GCCGGCATGG 
CCGCCCGAGA ACATCGAAGA TCTCGCCAAG CGTTACGAAG ATCAATACTG A

Protein sequence

MIQKNWQELI KPNKVEFSSS SRTRATLVAE PLERGFGLTL GNALRRVLLS SLRGAAVTAV 
QIDGVLHEFS SIPGVREDVT DIVLNIKEIA IKMDGDDAKR MVVRKQGPGV VTAGDIQTVG 
DIEILNPEHV ICTLDEGAEI RMEFTVNNGK GYVPAERNRA EDAPIGLIPV DSLYSPVKKV 
SYKVENTREG QVLDYDKLNM TIETDGSITG EDAVAFAARI LQDQLGVFVN FDEPQKETEE 
EAVTELAFNP ALLKKVDELE LSVRSANCLK NDNIVYIGDL IQKTEAEMLR TPNFGRKSLN 
EIKEVLASMG LHLGMEVPAW PPENIEDLAK RYEDQY