Gene Rleg_1237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1237
Symbol
ID	8012343
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	1211497
End bp	1213701
Gene Length	2205 bp
Protein Length	734 aa
Translation table	11
GC content	63%
IMG OID	644823818
Product	Nitrate reductase
Protein accession	YP_002975068
Protein GI	241203972
COG category	[C] Energy production and conversion
COG ID	[COG0243] Anaerobic dehydrogenases, typically selenocysteine-containing
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0895339
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.000112023
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATTCGC GTCATGGGGA ATTTTTGTGG CTTTTGGCCG TGCAAGCCTT GGAATATACA 
AATGCCATGA ACATTGCGAC CCCCATCCAC GCCAAATCAG AAAAGCCGGA CAATAGGGTG 
GGCCACACGG CCTGTCCGCA TGACTGTCCC TCCACCTGCG CACTGGAGGT CGAGATATCG 
GAGGATGGCC GCATCGGCCG CGTGCGCGGC GCCAATGACC ATTCCTACAC GTCAGGCGTC 
ATCTGCGCCA AGGTCGCCCG TTATGCCGAG CGGCTCTACC ATCCCGACCG CCTGATGCAT 
CCGTTGCGCC GCGCCGGCGC CAAGGGGGCA GGGCAGTGGC AGCAGATTTC TTGGGACGAT 
GCGCTGGATG AGATCGCCGA AGCCTTTGTG AAAGCCGAGG CAAGGGACGG CAGCGAGGCG 
GTCTGGCCCT ATTTCTACGC CGGTACGATG GGCTGGGTGC AGCGCGATTC CATCGATCGC 
CTCCGTCATG CCAAGCGTTA CTCCGGTTTC TTCTCTTCGA TCTGCACCAA CCCGGCCTGG 
ACCGGCTTCA CCATGGCGAC CGGCACGCTG CGCGGTCCCG ATCCACGCGA GATGGGCCGC 
ACCGATTGCG TCGTCATCTG GGGCACCAAC GCGGTGTCGA CGCAGGTCAA TGTGATGACC 
CACGCCATCA AGTCGCGCAA GGAGCGCGGC GCGAAGATCG TCGTCATCGA CATCTACGAC 
AATCCGACGA TGAAGCAGGC CGACATGGCG CTGATCGTCA GGCCGGGTAC CGACGCCGCG 
CTCGCCTGCG CCGTCATGCA CATCGCCTTC CGCGACGGTT ACGCCGACCG CGATTACATG 
GCGAGATACG CCGATGATCC CGCCGGTCTC GAAGCGCATC TGAAAACCAA GACGCCGCAA 
TGGGCCGCTG CTATCACCGG CCTTTCGATC GAGGAGATCG AAGCCTTCGC CAGCCTCGTC 
GGCACGACGA AGAAGACCTT CTTCCGCCTG GGTTACGGCT TCACCCGCCA GCGCAACGGC 
GCGGTCGCCA TGCATGCGGC CGCCTCGGTC GCCACCGTTC TCGGCTCCTG GCAATATGAG 
GGCGGCGGCG CCTTCCATTC GAACAGCGAT ATCTTCCGCA TGAACAGCGC CGAACTGACC 
GGCCGGTCGA TGAAGGATGC CGATATCCGC ATGCTCGACC AGTCGCAGAT CGGCCGCGTG 
CTGACCGGCG ATGCCGTGGC GCTGCGCCAT CGCGGCCCGG TGACGGCTAT GCTGATCCAG 
AACACCAATC CCGCCAACAT CGCCCCCGAG CAGCGCCTCG TCAGACGTGG CTTTGCCCGT 
GAGGACCTCT TCGTTGCCGT CCACGAGCAG TTCCTGACCG AAACGGCCGA GATCGCCAAT 
ATCGTCATTC CGGCAACGAT GTTCGTCGAA CATGACGACA TCTACCGGGC CGGCGGCCAG 
AACCATATCC TGCTGGGACC GAAGCTGGTC GAGCCACCGC CCACCGTGCG CACCAATCTC 
TTCGTCATCG AGGAACTGGC CAAACGCCTC GGCGTCGCCG ATCGCCCAGG CTTCGGCTTT 
ACCGCCCGCG AGATGGTCGA CCGCATCCTC GAATCGAGCG GCCTGCCGGA TTACGATCAT 
TTCCTCGAAC ACAAATGGTT CGATCGCCAG CCCGCTTTCG AGGAAGCGCA TTATCTGAAC 
GGCTTTGCCC ATCCGGACGG CAAGTTCCAC TTTCGCCCGG ACTGGATCAA TCAGCCGGCG 
CCGAACAAAC CGCCGGCGGC AATCGGCGCG CTCGGTCCGC ACGCAGCGCT TCCAGACTTC 
CCCGATCAGG TCGATGTCAT CGAAGTCGCC GATCCCGAGC ATCCCTTCCG CCTCGCCACG 
TCGCCGGCGC GCAACTTCCT GAATTCGAGC TTTTCGGAAA CCAAGACCTC CCGGCAGAAA 
GAAGGCCGCC CTGAAGTGAT GATCAATCCG GCCGACGCCG AAGCCAACGG CATCACCCAT 
GGCGATCTCG TCCGCATCGG TAACAGCCGC GGCGATCTGC GCATCCACGC CCGCATCACC 
ACTGAAGTGA AATCAGGCGT GCTGATTGCC GAGGGCCTTT GGCCGAACAA GGCGCATGTC 
GACGGCGAGG GCATCAACGT CTTGACCGGC GCCGACCCCG TCGCGCCTTA TGGCGGTGCG 
GCCGTGCACG ACAACAAGGT CTGGCTTCGC AGGGACGCAG CATGA

Protein sequence

MNSRHGEFLW LLAVQALEYT NAMNIATPIH AKSEKPDNRV GHTACPHDCP STCALEVEIS 
EDGRIGRVRG ANDHSYTSGV ICAKVARYAE RLYHPDRLMH PLRRAGAKGA GQWQQISWDD 
ALDEIAEAFV KAEARDGSEA VWPYFYAGTM GWVQRDSIDR LRHAKRYSGF FSSICTNPAW 
TGFTMATGTL RGPDPREMGR TDCVVIWGTN AVSTQVNVMT HAIKSRKERG AKIVVIDIYD 
NPTMKQADMA LIVRPGTDAA LACAVMHIAF RDGYADRDYM ARYADDPAGL EAHLKTKTPQ 
WAAAITGLSI EEIEAFASLV GTTKKTFFRL GYGFTRQRNG AVAMHAAASV ATVLGSWQYE 
GGGAFHSNSD IFRMNSAELT GRSMKDADIR MLDQSQIGRV LTGDAVALRH RGPVTAMLIQ 
NTNPANIAPE QRLVRRGFAR EDLFVAVHEQ FLTETAEIAN IVIPATMFVE HDDIYRAGGQ 
NHILLGPKLV EPPPTVRTNL FVIEELAKRL GVADRPGFGF TAREMVDRIL ESSGLPDYDH 
FLEHKWFDRQ PAFEEAHYLN GFAHPDGKFH FRPDWINQPA PNKPPAAIGA LGPHAALPDF 
PDQVDVIEVA DPEHPFRLAT SPARNFLNSS FSETKTSRQK EGRPEVMINP ADAEANGITH 
GDLVRIGNSR GDLRIHARIT TEVKSGVLIA EGLWPNKAHV DGEGINVLTG ADPVAPYGGA 
AVHDNKVWLR RDAA