Gene Rleg_3574 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_3574
Symbol
ID	8014433
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	3608981
End bp	3610057
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	64%
IMG OID	644826139
Product	phosphoribosylaminoimidazole carboxylase ATPase subunit
Protein accession	YP_002977359
Protein GI	241206263
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.416397
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCAA CAACGATCGG CATTATCGGC GGCGGCCAGC TCGGCCGCAT GCTGGCGATT 
GCCGCCGCCA GGTTGAATTT TCGCACGGTC ATCCTCGAGC CGCAGGCGGA CTGCCCGGCC 
GCCCAGCTCG CCAACCGGCA GATTACCGCT GCCTATGACG ATCCGGCGGC ACTCGCCGAA 
CTCGCCGATA TCTGCGATGT CGTCACCTAC GAATTCGAAA ACGTGCCTGT CGCAGCCGCC 
GAAAAGCTCT CGGCGAGCGT GTCGGTCTAT CCGCCGCCGA AGGCGCTGGA AGCCGCCCAG 
GACCGTCTCG TCGAAAAACG CTTTCTCAAC GGCTGCGGCA TAACCACTGC ACGCTTCCAT 
GCGATCCACA GCCAGGCCGA TCTCGAAACG GCGCTGAAGG ATTTCGGCGG CCAGGGCGTG 
CTGAAGACCC GCCGTCTCGG TTATGACGGC AAGGGCCAGA AGGTTTTCCG CTCGGCGGCC 
GACAGCCCGG ATGGCACCTA TGCAGCACTT GGCGGCGTGC CGCTCATTCT CGAAAGCTTC 
GTCGCCTTCG AGCGTGAAGT CTCGATCATC GCCGCCCGCG CCACCGACGG TACGGTCGTC 
TGCTTCGATC CCGCCGAGAA TGTCCACCGC AACGGCATCC TCCACACCTC GACGGTTCCC 
GCCGCGATCT CGGCGCCGAC GGCGGACGCC GCGCGGAAAT CGGCCGAGAA AATCCTTGCC 
GCATTGAACT ATGTCGGCGT CATCGGCATC GAATTCTTTG TGCTTGCCGA TGGCGGTCTG 
ATCGCCAACG AGATGGCGCC GCGCGTCCAC AACTCCGGTC ACTGGACGGA AGCCGCCTGC 
GTCGTCAGCC AGTTCGAGCA GCATATCCGC GCCGTCACCG GCCTGCCGCT TGGCAATGCC 
GAGCGACATT CCGACTGCGT CATGCAGAAC CTGATCGGCG ACGATATCCT TGCCGTTCCC 
GACTGGCTGC GGCGCCCCGA CACGCTGGTT CATCTCTACG GCAAGACCGA GTGGCGCCCC 
GGCCGCAAGA TGGGTCATGT CACCACCGTG ACGCCGAAAT CGCCGGTTTG GACCTGA

Protein sequence

MTATTIGIIG GGQLGRMLAI AAARLNFRTV ILEPQADCPA AQLANRQITA AYDDPAALAE 
LADICDVVTY EFENVPVAAA EKLSASVSVY PPPKALEAAQ DRLVEKRFLN GCGITTARFH 
AIHSQADLET ALKDFGGQGV LKTRRLGYDG KGQKVFRSAA DSPDGTYAAL GGVPLILESF 
VAFEREVSII AARATDGTVV CFDPAENVHR NGILHTSTVP AAISAPTADA ARKSAEKILA 
ALNYVGVIGI EFFVLADGGL IANEMAPRVH NSGHWTEAAC VVSQFEQHIR AVTGLPLGNA 
ERHSDCVMQN LIGDDILAVP DWLRRPDTLV HLYGKTEWRP GRKMGHVTTV TPKSPVWT