Gene Rcas_1844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1844
Symbol
ID	5539322
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2355945
End bp	2356970
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	63%
IMG OID	640893982
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_001431953
Protein GI	156741824
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.496619
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACAT ACCGCGATGC GGGCGTCGAT ATTGAGGCTG CGGCGCGCGC CAAACAGTTG 
ATGGCGGGAG CCGTGCACAG CACCTATTCC CCCGCAGTGC TGGCGGGCAT AGGCGCCTTT 
GGCGGATGCT TCGATCTGCG CACCGCTCTG GGAGAAGCGC TCGGCGATGC CGTGCTGGTC 
GCTTCTACCG ATAGCGTCGG CACGAAGACA CTGGTTGCTG CGGCGCTCGG TCGCTACGAA 
ACACTCGGCT ACGATCTGGT CAACCACTGC GTCAACGATA TTCTGGTGCA GGGCGCACGA 
CCACTGTTCC TGCTCGATTA TCTGGCGGTC GACCGGCTCA ATCCGCAGCG TGCTGCGACA 
CTGGTAGCGA GTGTCGCAAC CGCGTGTCGC GCGGCCGGAT GCGTTCTGCT CGGCGGCGAA 
ACGGCGCAGA TGCCCGATGT GTACCGCGAC GGCGCCTTCG AACTAGCGGG AACGATTGTC 
GGCGTGGTGC AGCGCGAGCG GATGCTGCCG CAAAACGTTG CAATTGGCGA CGTTATCCTG 
GCGCTGCCTT CGAGCGGATT GCACACCAAC GGCTATTCCC TGGCGCGGCG AGCGCTTGGA 
CCGGATAGCG CCTTCGGGTA TGACGCTACA CCCGCCGAAT TAGGCGGCAG AAGCGTCGGC 
GAGGCATTAC TCGAACCGCA CCGGTCGTAT CTTTCCGCGT TCGAGCAGTT GGCAGCAGCG 
GAGATACCGG TACACGCGCT GGCGCACATC ACCGGCGGCG GCGTATATGA AAACCTGCCG 
CGCGTCCTTC CAGAAGGGTA TGGCGCAGTC ATCCGGCGCG GCACATGGGA TGTCCCGCCG 
ATCTGTGCGC TTGTGGTGCA TGCTGCCGGT CTCGATGAGC ACGAAGCCTA TCGCACACTG 
AACATGGGTC TCGGCATGCT CGTAATCGTC CCATCCGAAG CCGCCGACGC CGCACTGCGC 
ACCGTCCATG AAGCCCGGCT GGTCGGCGAA GTGATCGCCG GCGAAGGAGT GCATCTGATA 
GCATAG

Protein sequence

MTTYRDAGVD IEAAARAKQL MAGAVHSTYS PAVLAGIGAF GGCFDLRTAL GEALGDAVLV 
ASTDSVGTKT LVAAALGRYE TLGYDLVNHC VNDILVQGAR PLFLLDYLAV DRLNPQRAAT 
LVASVATACR AAGCVLLGGE TAQMPDVYRD GAFELAGTIV GVVQRERMLP QNVAIGDVIL 
ALPSSGLHTN GYSLARRALG PDSAFGYDAT PAELGGRSVG EALLEPHRSY LSAFEQLAAA 
EIPVHALAHI TGGGVYENLP RVLPEGYGAV IRRGTWDVPP ICALVVHAAG LDEHEAYRTL 
NMGLGMLVIV PSEAADAALR TVHEARLVGE VIAGEGVHLI A