Gene Rleg2_3590 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3590
Symbol
ID	6982351
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	3715209
End bp	3717110
Gene Length	1902 bp
Protein Length	633 aa
Translation table	11
GC content	65%
IMG OID	643398315
Product	cobalt chelatase, pCobT subunit
Protein accession	YP_002283083
Protein GI	209551166
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG4547] Cobalamin biosynthesis protein CobT (nicotinate-mononucleotide:5, 6-dimethylbenzimidazole phosphoribosyltransferase)
TIGRFAM ID	[TIGR01651] cobaltochelatase, CobT subunit

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.94588
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.603807
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCTC GCGGTGACAA TTCGAAAGCA AAGCCCGGCG CGCCCGTCGA CGTCGAGCCA 
TTGCGCCGGG CGATATCCGG CTGCGTGCGC TCGGTCGCCG GCGACGGCGA TGTCGAGGTG 
ACCTTCGCCA ATGAACGGCC TGGCATGACC GGCGAGCGCA TCCGGCTGCC GGAGCTTTCC 
AAGCGGCCGA CGGCGCATGA GCTGGCGGTC ACCCGCGGGC TCGGCGATTC CATGGCGCTG 
CGCCTTGCCT GCCATGACGA GAAGATGCAT GCGACGATGG CGCCGCAGGG TTCGGATGCC 
CGGGCGATCT TCGATGTCGT CGAGCAGGCG CGCGTCGAAT CGATCGGCGC GCTGCGCATG 
GAGGGCATGG CGACCAACCT GCGCTCCATG ACCGAAGAGA AATATTCCAA GGCGAACTTC 
ACCGGCATCG AGCGCCAGGA AGACGCACCG GTCGGCGAAG CCGTCGCGAT GATGGTGCGC 
GAGAAGCTCA CCGGTCAGCG CCCGCCTGAA ACCGCCGGCA AGGTGCTCGA CCTCTGGCGC 
GGCTTCATCG AGGAAAAGGC GGGGGCCGAA CTCAACAATC TGTCGGGTGC GATCAACGAC 
CAGCAGGCCT TCGCCAAGGT CATCCGCAAC ATGCTGTCGG CCATGGAAAT GGCCGAGGAA 
TACGGCGATG ACGACAACGA CGCCGACAAT GACGACCAGT CGGATCAGGA AGACCAGCCG 
AGCGGCGACG AGCAGGATCA GGACGAGGTC GACGAGGATG CCGGCACCGA TGCCGCCCCG 
GTCGAAGACA GCGAAGTCGC CGACGAGCAG ATGGAGGACG GCGAGACCGA AGGCGCCGAA 
ATCTCCGACG ACGACATGAT GGAAGAGGGC GAGGACGATT CGGAAACGCC GGGCGAGACC 
CGCCGTCCGA ACACGCCTTT CTCAGATTTC AACGAGAAGG TCGATTATCA CGTCTTTACC 
GAAGAGTTCG ACGAGATCAT CACCGCCGAG GAACTCTGCG ACGCCGCCGA ACTGGAGCGC 
CTGCGCGCCT TCCTCGACAA GCAGCTGGCA CACCTGCAGG GCGCGGTCGG CCGCCTCGCC 
AACCGGCTGC AGCGCCGGCT GATGGCGCAG CAGAACCGCT CCTGGGATTT CGATCTGGAA 
GAGGGTTATC TCGATCCGGC CCGGCTGCAG CGCATCATCA TCGATCCGAT GCAGGCGCTG 
TCCTTCAAGA TGGAGCGCGA CACGCAGTTC CGCGACACGG TCGTCACCTT GCTGATCGAC 
AATTCCGGCT CGATGCGCGG CCGGCCGATC ACGGTTGCCG CCACCTGCGC CGATATCCTC 
GCCCGCACGC TGGAGCGCTG CGGCGTCAAG GTCGAGATCC TCGGTTTTAC CACCAAGGCC 
TGGAAGGGCG GGCAGGCGCG GGAAAGCTGG CTTGCCGGCG GCAAACCGCA GACGCCCGGC 
CGCCTCAACG ACCTGCGCCA CATCATCTAC AAATCGGCCG ACGCGCCGTG GCGTCGGGCA 
CGCGCCAATC TCGGGCTGAT GATGCGCGAG GGCCTGCTCA AGGAAAATAT CGACGGCGAG 
GCGCTGATCT GGGCGCATAA CCGCCTGCTC GCACGCCGCG AGCAGCGCCG CATCCTGATG 
ATGATCTCGG ACGGCGCGCC AGTCGACGAT TCGACGCTGT CGGTCAATCC GGGCAATTAT 
CTCGAGCGGC ACCTGCGCGC CGTCATCGAA CAGATCGAGA CACGCTCGCC GGTGGAATTG 
CTGGCAATCG GCATCGGTCA CGACGTGACG CGCTACTATC GCCGCGCCGT GACGATCGTC 
GATGCCGACG AACTTGCCGG CGCGATGACC GAGCAGCTCG CCTCGCTGTT CGAAGATCAA 
TCCACCCAGC CGCGTGGCGG CCGGCTCCGT CGTGCCGGCT GA

Protein sequence

MAARGDNSKA KPGAPVDVEP LRRAISGCVR SVAGDGDVEV TFANERPGMT GERIRLPELS 
KRPTAHELAV TRGLGDSMAL RLACHDEKMH ATMAPQGSDA RAIFDVVEQA RVESIGALRM 
EGMATNLRSM TEEKYSKANF TGIERQEDAP VGEAVAMMVR EKLTGQRPPE TAGKVLDLWR 
GFIEEKAGAE LNNLSGAIND QQAFAKVIRN MLSAMEMAEE YGDDDNDADN DDQSDQEDQP 
SGDEQDQDEV DEDAGTDAAP VEDSEVADEQ MEDGETEGAE ISDDDMMEEG EDDSETPGET 
RRPNTPFSDF NEKVDYHVFT EEFDEIITAE ELCDAAELER LRAFLDKQLA HLQGAVGRLA 
NRLQRRLMAQ QNRSWDFDLE EGYLDPARLQ RIIIDPMQAL SFKMERDTQF RDTVVTLLID 
NSGSMRGRPI TVAATCADIL ARTLERCGVK VEILGFTTKA WKGGQARESW LAGGKPQTPG 
RLNDLRHIIY KSADAPWRRA RANLGLMMRE GLLKENIDGE ALIWAHNRLL ARREQRRILM 
MISDGAPVDD STLSVNPGNY LERHLRAVIE QIETRSPVEL LAIGIGHDVT RYYRRAVTIV 
DADELAGAMT EQLASLFEDQ STQPRGGRLR RAG