Gene Mmcs_3059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_3059
Symbol
ID	4111891
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	3235346
End bp	3236116
Gene Length	771 bp
Protein Length	256 aa
Translation table	11
GC content	70%
IMG OID	638032189
Product	phosphoribosyl isomerase A
Protein accession	YP_640222
Protein GI	108800025
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0106] Phosphoribosylformimino-5-aminoimidazole carboxamide ribonucleotide (ProFAR) isomerase
TIGRFAM ID	[TIGR00007] phosphoribosylformimino-5-aminoimidazole carboxamide ribotide isomerase [TIGR01919] 1-(5-phosphoribosyl)-5-[(5-phosphoribosylamino)methylideneamino] imidazole-4-carboxamide isomerase/N-(5'phosphoribosyl)anthranilate isomerase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTCCGTCG TGCCAGAGAA GTCGGTGTCC GAGAAAAGAC CGTTGATCCT CCTCCCCGCC 
GTCGATGTCG TCGAAGGCCG TGCCGTGCGC CTGGTACAGG GCAAGGCCGG CAGTGAAACC 
GAGTACGGGT CGGCGCTCGA CGCCGCGCTC GGCTGGCAGC GCGACGGGGC CGAGTGGATC 
CATCTGGTGG ATCTCGACGC CGCGTTCGGG CGGGGGTCGA ACCGCGAACT GCTCGCCGAC 
GTCGTGGGCC GCCTCGATGT GGCGGTCGAA CTGTCCGGCG GCATCCGTGA CGACGAGTCG 
CTCGAGGCAG CGCTGGCCAC CGGATGCGCC CGGGTCAACA TCGGCACCGC CGCGCTGGAG 
AACCCGCAGT GGTGCGCGAA AGTCGTCGCC GAGTTCGGCG ACAAGGTGGC AGTGGGCCTC 
GACGTCAAGA TCGTCGACGA TCAGCACCGC CTGCGCGGAC GGGGTTGGGA GACCGACGGC 
GGGGACCTGT GGGAGGTGCT CGACCGCCTC GACTCCGAAG GCTGCTCGCG CTACGTCGTC 
ACCGACGTGA CCAAGGACGG CACCCTTCAG GGGCCGAACC TCGATCTGCT CGGCCGCGTC 
GCCGACCGCA CCGATGCGCC GGTGATCGCC TCCGGCGGGG TGTCCAGCCT CGACGATCTG 
CGCGCGATCG CCACGTTGAC CGACCGGGGC GTCGAGGGTG CGATCGTCGG CAAAGCGCTG 
TACGCCGGGC GCTTCACGCT GCCCGAGGCG CTGGCAGCGA TGGGGCAGTA G

Protein sequence

MSVVPEKSVS EKRPLILLPA VDVVEGRAVR LVQGKAGSET EYGSALDAAL GWQRDGAEWI 
HLVDLDAAFG RGSNRELLAD VVGRLDVAVE LSGGIRDDES LEAALATGCA RVNIGTAALE 
NPQWCAKVVA EFGDKVAVGL DVKIVDDQHR LRGRGWETDG GDLWEVLDRL DSEGCSRYVV 
TDVTKDGTLQ GPNLDLLGRV ADRTDAPVIA SGGVSSLDDL RAIATLTDRG VEGAIVGKAL 
YAGRFTLPEA LAAMGQ