Gene Rleg_4931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4931
Symbol
ID	8007526
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	+
Start bp	309442
End bp	310953
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	54%
IMG OID	644821850
Product	nitrogenase molybdenum-iron protein alpha chain
Protein accession	YP_002973110
Protein GI	241113275
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01282] nitrogenase molybdenum-iron protein alpha chain [TIGR01862] nitrogenase component I, alpha chain

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTCG ACTACGAGAA CGACGGTGAT TTCAACTCCA GGCTTATAGA TGCGGTACTC 
TCCCAGTATC CGGATAAGAC GGCTAAGCGC CGCAAAAAGC ACCTTGGCGT CGCGAAGGGC 
CGAGAGGCAG CCGAGCAGAG CTCGGATGCG CTTTGTGAGA CCGGGGTGAA ATCCAACATC 
AAGTCCATTC CGGGCGTGAT GACTGTTCGC GGCTGCGCTT ATGCCGGCTC GAAGGGTGTC 
GTGTGGGGCC CGATCAAGGA TATGGTCCAT ATATCACATG GGCCTGTCGG TTGTGGGCAC 
TATTCCTGGT CGCAACGCCG CAACTATTAC GTCGGTCTGA CGGGTGTCGA AGCCTTTGTC 
ACCATGCAAT TCACGTCTGA CTTTCAAGAA AAGGATATTG TTTTTGGTGG CGACAAAAAG 
CTCGAGAAGC TCATCGATGA AGTTGAGCAA CTGTTTCCAC TGAACAACGG TGTCAGCTTG 
CAGTCAGAGT GTCCAATCGG ATTGATCGGC GACGATATTG AAGCTGTGGC GCGCAAGAAG 
GCCAAGGAGC ACAACAAAAC GATCGTGCCG GTGCGATGCG AAGGGTTTCG TGGAGTGTCG 
CAATCGCTTG GCCATCATAT CGCCAATGAC GCGATACGCG ACTGGGTTTT CGATAAGAAA 
GACACCCACT ACGAGGCCAG CTTTTTCGAC GTTAACGTAA TAGGTGACTA CAATATCGGC 
GGCGATGCGT GGGCTTCCCG CATTCTGCTG GAGGACATGG GGTTGCGGGT GGTCGGCAAC 
TGGTCGGGAG ATGCCACACT CGCGGAGGTG GAGCGTGCGC CAAAAGCGAC GCTCAACCTT 
ATTCACTGCT ACCGGTCCAT GAACTACATC GCTCGGCATA TGGAGGAAAA GTACGGCATT 
CCCTGGATGG AGTACAACTT TTTCGGTCCT TCCCAGATCG AAGTTTCTTT GCGCAATATC 
GCCGCATTTT TCGGGCCGGA GACCCAAGAT AGGGCCGAAG CACTCATCAC CAGATACCAA 
CCCCTCGTCC AGGCGGTGAC GGAGAAATAC CGTCCGCGCC TCGATGGCAA AACTGTGATG 
CTCTACGTTG GCGGATTGCG TCCCCGCCAT GTCATCACCG CCTATGAGGA TCTCGGAATG 
GAGATCGTTG GCACGGGCTA CGAATTTGGC CATGGCGACG ATTACGAGCG CACCAGCCAC 
TATGTCAAAA AAGGTACGCT TATCTACGAT GATGTGACCG GCTACGAGCT CGAGAACTTC 
GTCGAGGCCA TTCGCCCGGA CCTAGTAGGC TCGGGCATCA AGGAAAAATA TCCGGTTCAA 
AAAATGGGCA TACCGTTTCG CCAGATGCAT TCTTGGGACT ATTCGGGTCC GTATCATGGT 
TATGACGGCT TCGCCATCTT TGCCAGAGAC ATGGATCTTG CCATCAACAA TCCGATCTGG 
GGCCTCTACG ACGCGCCATG GAAAGAAGCG CACTGCAGCC ATGCCTGCAG TTGCGGCGGA 
CAAGACGAAT AG

Protein sequence

MSLDYENDGD FNSRLIDAVL SQYPDKTAKR RKKHLGVAKG REAAEQSSDA LCETGVKSNI 
KSIPGVMTVR GCAYAGSKGV VWGPIKDMVH ISHGPVGCGH YSWSQRRNYY VGLTGVEAFV 
TMQFTSDFQE KDIVFGGDKK LEKLIDEVEQ LFPLNNGVSL QSECPIGLIG DDIEAVARKK 
AKEHNKTIVP VRCEGFRGVS QSLGHHIAND AIRDWVFDKK DTHYEASFFD VNVIGDYNIG 
GDAWASRILL EDMGLRVVGN WSGDATLAEV ERAPKATLNL IHCYRSMNYI ARHMEEKYGI 
PWMEYNFFGP SQIEVSLRNI AAFFGPETQD RAEALITRYQ PLVQAVTEKY RPRLDGKTVM 
LYVGGLRPRH VITAYEDLGM EIVGTGYEFG HGDDYERTSH YVKKGTLIYD DVTGYELENF 
VEAIRPDLVG SGIKEKYPVQ KMGIPFRQMH SWDYSGPYHG YDGFAIFARD MDLAINNPIW 
GLYDAPWKEA HCSHACSCGG QDE