Gene Rleg_3884 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_3884
Symbol
ID	8014705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	3953533
End bp	3954525
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	61%
IMG OID	644826454
Product	cobalt chelatase, pCobS small subunit
Protein accession	YP_002977666
Protein GI	241206570
COG category	[R] General function prediction only
COG ID	[COG0714] MoxR-like ATPases
TIGRFAM ID	[TIGR01650] cobaltochelatase, CobS subunit

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.922452
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0087584
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCAAGA TCGACCTGGA TATATCAGAA CTGCCCGATA CCACCGTTTC GGTCCGCGAG 
GCCTTCGGCA TCGATTCCGA CATTCGCGTT CCCGCCTACA GCAAGGGCGA CGCCTATGTT 
CCGGACCTCG ACACCGACTA CCTGTTCGAC CGCGACACGA CGCTCGCCAT TCTCGCAGGC 
TTCGCCCATA ACCGCCGCGT GATGATTTCC GGCTATCACG GCACGGGCAA GTCCTCGCAT 
ATCGAGCAGG TGGCGGCGCG GCTCAACTGG CCTTGCGTGC GCATCAACCT CGATAGCCAT 
GTCAGCCGTA TCGATCTCGT CGGCAAGGAT GCGATCGTCG TCAAGGACGG GCTGCAGGTC 
ACCGAATTCA AAGACGGCAT CCTGCCCTGG GCCTATCAGC ACAATGTCGC GCTGGTCTTC 
GACGAATATG ATGCCGGCCG CCCCGATGTG ATGTTCGTGA TTCAGCGCGT ACTCGAATCC 
TCCGGGCGCC TGACGCTGCT CGATCAGAGC CGCGTCATTC GGCCGCACCC GGCCTTCCGT 
CTGTTTGCGA CTGCGAACAC GATCGGCCTC GGCGACACGA CCGGCCTCTA TCACGGCACG 
CAGCAGATCA ACCAGGCGCA GATGGACCGC TGGTCGATCG TCACCACGCT GAACTACCTG 
CCGCATGATC ACGAAGTGAA TATCGTCGCC GCCAAGGTGA AGAGCTTCGG CAAGGACAAG 
AACGGCCGTG AGACGGTTTC GAAGATGGTG CGCGTCGCCG ACCTGACGCG TGCCGCCTTC 
ATGAACGGCG ATCTCTCGAC CGTCATGAGC CCGCGTACGG TTATCACCTG GGCCGAAAAC 
GCCGAAATCT TCGGCGATCT CGCCTTCGCC TTCCGCGTCA CCTTCCTCAA CAAGTGCGAC 
GAGCTGGAGC GTCCGTTGGT CGCCGAGCAT TATCAGCGCG CCTTCGGCGT CGAGCTGAAG 
GAAAGTGCCG CCAACATCGT TCTCGGGGCT TGA

Protein sequence

MSKIDLDISE LPDTTVSVRE AFGIDSDIRV PAYSKGDAYV PDLDTDYLFD RDTTLAILAG 
FAHNRRVMIS GYHGTGKSSH IEQVAARLNW PCVRINLDSH VSRIDLVGKD AIVVKDGLQV 
TEFKDGILPW AYQHNVALVF DEYDAGRPDV MFVIQRVLES SGRLTLLDQS RVIRPHPAFR 
LFATANTIGL GDTTGLYHGT QQINQAQMDR WSIVTTLNYL PHDHEVNIVA AKVKSFGKDK 
NGRETVSKMV RVADLTRAAF MNGDLSTVMS PRTVITWAEN AEIFGDLAFA FRVTFLNKCD 
ELERPLVAEH YQRAFGVELK ESAANIVLGA