Gene Rleg_2363 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_2363
Symbol	cobD
ID	8013353
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	2365506
End bp	2366486
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	66%
IMG OID	644824945
Product	cobalamin biosynthesis protein
Protein accession	YP_002976175
Protein GI	241205079
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1270] Cobalamin biosynthesis protein CobD/CbiB
TIGRFAM ID	[TIGR00380] cobalamin biosynthesis protein CobD

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.764656
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0402118
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATCG ACCAAAACCT TCTCGTGCTG CTTTTGGCGC TGCTGCTCGA CCGGATCGCC 
GGCGATCCAC AATGGCTGTG GTTGCGGGTG CCGCATCCCG TCGTCATGTT CGGCGCGGCG 
ATCTCCTATG CCGACCGGCA GCTCAATCCC GCAAGCCTCA CGGGGTCGCA ACGCCGGATG 
AACGGCGTCG CTGCCATCCT GGCGCTGCTT CTTTTGGCGC TGGCCGCAGG CTTCGTGTTC 
AACCGGTTCT TCGCGCTGTT CGGCCTTGTC GGCATCTTGC TGGAGACCGG GCTGGTGGCG 
ATCTTCCTGG CGCAGAAAAG CCTTGCCGAT CACGTCGCGG CCGTCGCCGT CGCGCTACGC 
GACGAGGGGC TTGCCGGCGG GCGGACCGCC GTTTCCCGCA TCGTCGGGCG CGATCCCGAG 
ACGCTGGACG AGCCTGCCGT CTGCCGCGCG GCGATCGAAA GCCTTGCCGA GAATTTCTCC 
GACGGCGTCG TCGCACCGGC GCTCTGGTAT GCAGTCTTCG GCCTGCCGGG GCTTTTCGCC 
TACAAGATGC TGAACACGGC GGATTCGATG ATCGGCCATA AGTCGGAAAA ATACATCGAC 
TTCGGCTGGG CGGCCGCTCG GCTCGACGAT GTCGCCAACT GGCCGGCCGC GCGCCTCTCC 
ATCCTGCTGA TTGCCGCCGG AGCCTGGATC CGGCGGGGAA CAAGCGCCGG CCGTGAGGCG 
ATCCGCGTGG CGATGCGCGA CGGGGCCTTG CACCGTTCGC CGAACTCCGG CAGGCCGGAG 
GCGGCCATGG CAGGCGCGCT GAACGTCCAG CTCGCCGGCC CGCGCATCTA TGGCGGCGTC 
ATCGTGCGTG AACCGATGAT CAACGACGCC GGCCGCGACG TGGCGACCTC GGGCGACATC 
GAGGACGGCG TATCGGTGTT TTATGCCAGC TGCATGGTGC TCGCCGGTGT GACGTTCGGG 
CTTTTCTTGT GTTTTCTGTA G

Protein sequence

MTIDQNLLVL LLALLLDRIA GDPQWLWLRV PHPVVMFGAA ISYADRQLNP ASLTGSQRRM 
NGVAAILALL LLALAAGFVF NRFFALFGLV GILLETGLVA IFLAQKSLAD HVAAVAVALR 
DEGLAGGRTA VSRIVGRDPE TLDEPAVCRA AIESLAENFS DGVVAPALWY AVFGLPGLFA 
YKMLNTADSM IGHKSEKYID FGWAAARLDD VANWPAARLS ILLIAAGAWI RRGTSAGREA 
IRVAMRDGAL HRSPNSGRPE AAMAGALNVQ LAGPRIYGGV IVREPMINDA GRDVATSGDI 
EDGVSVFYAS CMVLAGVTFG LFLCFL