Gene Rleg2_5055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5055
Symbol
ID	6978149
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	+
Start bp	703181
End bp	704545
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	56%
IMG OID	643394195
Product	nitrogenase MoFe cofactor biosynthesis protein NifE
Protein accession	YP_002279013
Protein GI	209547095
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01283] nitrogenase molybdenum-iron cofactor biosynthesis protein NifE

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATCGA TCGAGGCTCA AACAGGAGAT ACTTCCAGCC AACGTACCGC CGCGATATAC 
CCAACCAAAG AAAACAAGGC ATGTCAGAAG GCGACGCAAG GATCGGCGGC CGGCGGCTGC 
GCCTTCGACG GAGCTAAGGT GGTGCTCCAG CCAATAGTGG ATGTCGCGCA TTTAATTCAC 
GCGCCGCCCG CATGCGAGGG CAATTCCTGG GACAACCGAG GCGCGGCGTC GTCAGGTCCG 
GTTCTTTGGC GCACCAGCTT TACCACTGAC ATTACTGAAA TCGATATAGT GACGGGAGAT 
ACTGATCAGA AGCTTCTTGA GGCGATCCGC GAGATCAAAA AGGGATATGC ACCGGCGGCA 
ATCTTCGTCT ATGGAACATG CGTAAGCGAG CTGATTGGTG GCAACATCGA CGCGGTCTGC 
AGGCACGCAG CGCAGAAGTT CGCGATACCA GTGGTGCCGG TTAAGTCGCC GGGCTTCCGC 
GGTTCGAAGA GCGTGGGCAA CAGGATCGCC GGAGAGGCTC TGCTCGAGCA CGTGATAGGC 
ACGGTGGAGG CCGATAATAC TAGCCCATAC GACATCAATA TCCTCGGCGA ATTCAACCTC 
TCAGGAGAGT TTTGGCTGGT GAAGCCGCTG TTGGACCGGC TTGGCATCCG TGTTCGCGCC 
TGTATTCCCG GAGATGCGCG CTTTGCGCAG GTTGGTTCCG CCCACCGCTC CCGTGCAGCT 
ATGGTGGTGT GCTCCACTGC TCAGATCAAC CTTGCACGTA AGATGGAAGC ACGCTGGGAT 
ATTCCATTTT TTGAGGGGTC CTTCTATGGC ATCTCCGGCA CCTCGGAATC GCTTCGGCGG 
ATCGCTCAAT TGCTCGTAAA CAAGGGCGCT GGTCTAGCAT TCCTCCACCG TACTGAGGAG 
CTCATTGCAG ATGAGGAGGA AAGAGTCTGG AAGAATTTGG AAGTGTACCG GCGTAGGCTC 
GTGGGCAAGC GCGTTCATCT GAACACCGGC GGCGTGAAAT CCTGGTCCAT CGTGCATGCA 
TTGATCGAGA TCGGCATGGA AATTATCGGC ACATCAGTCA AGAAGTCGAC CGTCAGGGAC 
AAAGAGAAAA TCAAACAGAT GCTAAAGAAC GAGAGCCGCC TGCATCACAC GATGGCAGCA 
AGCAAGCTAT ACGCGGTGTT ACGCGGACAG AAGCCTGATA TCATGCTGTC GGGCGGACGC 
ACTCAATTCG TTGCACTTGA GGCAAAAATA CCATGGCTCG ACGTCAATCA GGAGCGCCAG 
CATCCCTACG CTGGCTACGA AGGCATGGTG AAACTCGCGC AAGAGATTGA TCTGGCAATC 
CACAGCCCCA TCTGGGCGCA ATTGCGCGAA CCGGAGCCGT GGTAG

Protein sequence

MSSIEAQTGD TSSQRTAAIY PTKENKACQK ATQGSAAGGC AFDGAKVVLQ PIVDVAHLIH 
APPACEGNSW DNRGAASSGP VLWRTSFTTD ITEIDIVTGD TDQKLLEAIR EIKKGYAPAA 
IFVYGTCVSE LIGGNIDAVC RHAAQKFAIP VVPVKSPGFR GSKSVGNRIA GEALLEHVIG 
TVEADNTSPY DINILGEFNL SGEFWLVKPL LDRLGIRVRA CIPGDARFAQ VGSAHRSRAA 
MVVCSTAQIN LARKMEARWD IPFFEGSFYG ISGTSESLRR IAQLLVNKGA GLAFLHRTEE 
LIADEEERVW KNLEVYRRRL VGKRVHLNTG GVKSWSIVHA LIEIGMEIIG TSVKKSTVRD 
KEKIKQMLKN ESRLHHTMAA SKLYAVLRGQ KPDIMLSGGR TQFVALEAKI PWLDVNQERQ 
HPYAGYEGMV KLAQEIDLAI HSPIWAQLRE PEPW