Gene Rleg2_2121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_2121
Symbol	cobD
ID	6980860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	2179011
End bp	2179991
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	65%
IMG OID	643396843
Product	cobalamin biosynthesis protein
Protein accession	YP_002281631
Protein GI	209549714
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1270] Cobalamin biosynthesis protein CobD/CbiB
TIGRFAM ID	[TIGR00380] cobalamin biosynthesis protein CobD

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.373169
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.00319539
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGATCG ACGAAAACCT TCTTGTGTTG CTTCTGGCGC TGCTGCTCGA CCGGATCGCC 
GGGGATCCGC AATGGCTGTG GTCACGCGTG CCGCATCCCG TCGTCATGTT CGGCGCGGCG 
ATCTCCTATG CCGACCAGCA GCTCAATCCT TCAAGCCTTA CCGGCTCCCA GCGCCGTATG 
AACGGCGTCG CCGCGATCCT GGCGCTGCTG CTGCTGTCGA TTGCCGCTGG CTTCGTGTTC 
GACCGGTTCT TCGCGCTCTT CGGCCTTGTC GGCCTCGTGC TGGAAGCCGG TCTGGTGGCG 
ATCTTCCTGG CGCAGAAGAG CCTTGCCGAT CATGTCGCGG CCGTCGCCAC CGCCTTGCGG 
GGCGAAGGGC TCGCCGGCGG CCGGAATGCC GTCTCCCGCA TCGTCGGCCG CGATCCCGAA 
ACGCTCGACG AGCCGGCCGT CTGCCGCGCT GCGATCGAAA GCCTTGCGGA AAATTTCTCC 
GACGGCGTCG TGGCGCCGGC TCTCTGCTAT GCCGTCTTCG GCCTGCCGGG TCTGCTTGCC 
TACAAGATGC TGAACACTGC GGATTCGATG ATCGGCCACA GATCGGAAAA ATACATCGAT 
TTCGGTTGGG CTGCGGCCCG GCTCGACGAT ATCGTCAACT GGCCGGCCGC GCGGCTTTCC 
ATCCTGCTGA TCGCCGCCGG GGCCTGGATC CGGCGCGGCA TAAGCCCCTG CCGCGAGGCG 
ATCCGCGTGG CGATGCGGGA CGGCGGCCTG CACCGATCGC CGAATTCCGG CAGGCCCGAG 
GCGGCCATGG CCGGCGCTCT CAACGTCCAG CTCGCCGGCC CGCGCATCTA TGGCGGTGTG 
ATCGTGACGG AGCCGATGAT CAACAATGCC GGCCGCGACA TTGCCACCGC CGGCGACATT 
GAGGACGGCG TGTCGGTGTT CTATGCCAGC TGCATGGTGC TCACCGGTCT GATCTTCGGA 
TTGTTCTTGT GTTTTCTGTA G

Protein sequence

MTIDENLLVL LLALLLDRIA GDPQWLWSRV PHPVVMFGAA ISYADQQLNP SSLTGSQRRM 
NGVAAILALL LLSIAAGFVF DRFFALFGLV GLVLEAGLVA IFLAQKSLAD HVAAVATALR 
GEGLAGGRNA VSRIVGRDPE TLDEPAVCRA AIESLAENFS DGVVAPALCY AVFGLPGLLA 
YKMLNTADSM IGHRSEKYID FGWAAARLDD IVNWPAARLS ILLIAAGAWI RRGISPCREA 
IRVAMRDGGL HRSPNSGRPE AAMAGALNVQ LAGPRIYGGV IVTEPMINNA GRDIATAGDI 
EDGVSVFYAS CMVLTGLIFG LFLCFL