Gene Rcas_2525 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2525
Symbol
ID	5540007
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	3257264
End bp	3258391
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	62%
IMG OID	640894656
Product	phosphoribosylaminoimidazole carboxylase ATPase subunit
Protein accession	YP_001432623
Protein GI	156742494
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0404264
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGATA GATTAATCGG TGTTCTGGGC GGAGGGCAAT TGGGGCGAAT GCTGGCGCTC 
GCCGGTTATC CGCTCGGTTT CCGCTTCCGC TTCCTCGATC CTGCCGATGA TGCGCCGGTT 
CGCTACCTGG CAGAGCAGGT TGTCGCATCA TACGACGACC ATTTAGCCGT GGCACAGTTC 
GGCAGCGGGT TGATAGTCGT CACCTATGAG TTTGAGAATG TACCGGTGGC GACGGCGCGC 
GCGCTCGAGC AGCATATACC GGTGTTTCCA CCGCCGCAGG CGCTTGAGGT TGCACAGGAT 
CGTCTCGCGG AAAAGCGCTT CTTCACACAA CTGAACATTC CAACCGCGCC GTTCGCGCCG 
GTGGACGACC GCGCGTCGCT TGATGCAGCA ATCGAGCGTA TTGGGCTGCC TGCTCTTCTG 
AAGACGCGAC GCCTGGGGTA TGATGGCAAG GGGCAGGCAT TGATCGGGCA GCGTGCAGAC 
ATCGAAGACG CCTGGCGCGC ACTTGGCGGG CAGCCGCTTA TCCTCGAAGG GTTTGTTTCG 
TTTGTGCGTG AACTTTCCGT CCTGGCAGTG CGCGGGCAGG ATGGCGCCGT CGCGTGCTAC 
CCGCCGGTCG AGAATCTGCA CCGCAATGGC ATTCTGTATC GCTCGATCGC CCCTGCGCCC 
GGGCTTGCCA CCGAGGTGCA ACTGCTGGCG GAGACCTATG CGCGCCGGGT GCTCGAAGCG 
CTCGACTATG TCGGCGTTCT GGCAATCGAG ATGTTTGAAG TGGAACCTGA CCGTACCGGC 
GGCGCTCGCC TGCTGGCGAA CGAAATGGCG CCGCGCGTCC ACAATTCTGG TCATTGGACG 
ATTGATGGCG CTGTGACGAG TCAGTTCGAG AACCACCTGC GCGCCATCGC CGGTCTGCCG 
CTCGGCGACG CCTCAGCGCG CGGTTGCGCC GCGATGGTCA ACCTTATCGG CGGATTGCCC 
GATGTGACGA TGCTGCTGGC GCTGCCTGAT ACTCATCTGC ACCTCTATGA CAAAGCGCCG 
CGACCGGGGC GCAAACTGGG ACATGTAACC GTCTGCGCCG TGGATGCAGA GCGCCTGGCA 
GAGCGCCTGG CAGTCGTCGA ACGGTATGTT CTGGCGAGCA CGAAGTGA

Protein sequence

MNDRLIGVLG GGQLGRMLAL AGYPLGFRFR FLDPADDAPV RYLAEQVVAS YDDHLAVAQF 
GSGLIVVTYE FENVPVATAR ALEQHIPVFP PPQALEVAQD RLAEKRFFTQ LNIPTAPFAP 
VDDRASLDAA IERIGLPALL KTRRLGYDGK GQALIGQRAD IEDAWRALGG QPLILEGFVS 
FVRELSVLAV RGQDGAVACY PPVENLHRNG ILYRSIAPAP GLATEVQLLA ETYARRVLEA 
LDYVGVLAIE MFEVEPDRTG GARLLANEMA PRVHNSGHWT IDGAVTSQFE NHLRAIAGLP 
LGDASARGCA AMVNLIGGLP DVTMLLALPD THLHLYDKAP RPGRKLGHVT VCAVDAERLA 
ERLAVVERYV LASTK