Gene Sare_3416 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3416
Symbol
ID	5704025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3944855
End bp	3945580
Gene Length	726 bp
Protein Length	241 aa
Translation table	11
GC content	71%
IMG OID	641272843
Product	phosphoribosyl isomerase A
Protein accession	YP_001538209
Protein GI	159038956
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0106] Phosphoribosylformimino-5-aminoimidazole carboxamide ribonucleotide (ProFAR) isomerase
TIGRFAM ID	[TIGR00007] phosphoribosylformimino-5-aminoimidazole carboxamide ribotide isomerase [TIGR01919] 1-(5-phosphoribosyl)-5-[(5-phosphoribosylamino)methylideneamino] imidazole-4-carboxamide isomerase/N-(5'phosphoribosyl)anthranilate isomerase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0173551
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCTCA CCCTGTTGCC TGCCGTCGAC GTCGCTGATG GGCAAGCAGT CCGTCTGGTG 
CAGGGCGCCG CCGGTAGCGA AACCGCCTAC GGCGACCCCT TGGACGCCGC CTTGGCTTGG 
CAGCGCGACG GGGCGGAGTG GATTCATCTG GTTGACCTGG ACGCGGCCTT CGGTCGGGGT 
TCCAACGCTG ATCTGCTCGC CGACGTGGTA CGCCAACTGG ACGTGCGGGT GGAGCTCTCG 
GGCGGTGTCC GGGACGACGA GTCGCTGCGT GCCGCGCTGG CGACCGGTGC CACCCGGGTC 
AACATCGGCA CCGCCGCGCT GGAGGACCCC CTGTGGTGCG ATCGGGTCTG TGGCGAGTAC 
GGCGACCGAG TGGCGATCGG GCTCGACGTG CGGGGACGTA CCCTGTCGGC CCGTGGCTGG 
ACCCGGGACG GCGGCGACCT GTGGGAGGTG CTGGAGCGGC TGGACCGAGC CGGTGCGTCC 
CGGTACGTGG TCACCGACAT CACCAAGGAC GGCACGATGC GCGGGCCGAA CCTGGAGTTG 
CTCCGCGAGG TCTGCGCCCG CACCAACGCG CCGGTGATCG CCTCCGGTGG TGTCTCCACC 
CTGGCTGACC TGCGGGCGTT GGCGGCTCTG GAACCGGCCG GTGTGGAGGG GGTCATCGCC 
GGCAAGGCCC TGTACGCCGG GGCGTTCACC GTGGCTGAGG CGTTACGGAC GCTGGCCGAC 
GCCTGA

Protein sequence

MSLTLLPAVD VADGQAVRLV QGAAGSETAY GDPLDAALAW QRDGAEWIHL VDLDAAFGRG 
SNADLLADVV RQLDVRVELS GGVRDDESLR AALATGATRV NIGTAALEDP LWCDRVCGEY 
GDRVAIGLDV RGRTLSARGW TRDGGDLWEV LERLDRAGAS RYVVTDITKD GTMRGPNLEL 
LREVCARTNA PVIASGGVST LADLRALAAL EPAGVEGVIA GKALYAGAFT VAEALRTLAD 
A