Gene RoseRS_1820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_1820
Symbol
ID	5208779
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	2246302
End bp	2247429
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	60%
IMG OID	640595428
Product	phosphoribosylaminoimidazole carboxylase ATPase subunit
Protein accession	YP_001276160
Protein GI	148655955
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0373364
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAATA CTATGATTGG CATTCTGGGC GGCGGGCAGT TGGGGCGTAT GCTGGCACTT 
GCTGGCTATC CGCTCGGTCT GCGCTTCCGC TTCTTCGATC CTTCCGCCGA TGCGCCGGTT 
CGCTACCTGG CGGAACAGGT TGTCGCCCCC TATGATGACC ATCTGGCGCT GGATCAGTTC 
AGCCATGGGT TAACGGTGGC GACGTATGAG TTCGAGAATG TGCCGGTAAC AACGGCACGC 
GCACTTGAGC GGCGCATACC GGTGTTTCCG CCGCCGCAGG CGCTTGAGGC AGCGCAGGAT 
CGTCTCCAGG AAAAACGCTT CTTCGCAAGC CTGAACATTC CAACCACGCC TTTCGCGCCG 
GTGGATGATC GCGAGTCGCT TGAGGCAGCC GTTGTGCATA TCGGACTCCC TGCCGTTCTG 
AAGACGCGAC GCCTGGGGTA TGACGGAAAA GGTCAGGTGA TTCTCCATAC CCACACCGAC 
GTTGATCCCG CCTGGCACGC ACTCGGCGGG CAACCGTTGA TCCTCGAAAA GTTCATCGCG 
TTCGACCGCG AACTATCGGT GCTGGCGGTA CGCGGACAGG ACGGCGGCAT CGCGTGCTAT 
CCGCTGGTCG AAAATGTTCA CCGGAACGGC ATCCTGCACC GCTCGATCGC GCCAGCGCCC 
GGACTTGCAG CCGAAACGCA GATGCTGGCA GAGACGTATG CGCGCCGTGT TCTCGAAGCC 
CTCGATTATA TCGGCGTGCT GGCGATTGAA CTGTTTGAAA TCGACGAAAC GAACGCGCGC 
GCAACAGGCG CTCGCCTGCT GGCAAACGAA ATGGCGCCGC GCGTGCACAA CTCCGGTCAC 
TGGACGATTG AGGGAGCAGT CACAAGTCAG TTCGAGAACC ATGTGCGGGC AATCGTCGGT 
CTGCCAACTG GCGCCACCTC AGCGCGAGGG TATGCGGCGA TGGTCAATCT GATCGACAGT 
CTGCCCGATA TAACCATGCT GCTGGCGCTG CCGGACACGC ACGTGCATCT CTACGACAAA 
GCGCCGCGAC CGGGTCGCAA ACTGGGGCAT GTGACCATCT GCGCCGGGGA TGTGACACAA 
CTGGCAGATC GATTGGCGGT TGTGGAACGG TATGTTCTGG CATGTTGA

Protein sequence

MNNTMIGILG GGQLGRMLAL AGYPLGLRFR FFDPSADAPV RYLAEQVVAP YDDHLALDQF 
SHGLTVATYE FENVPVTTAR ALERRIPVFP PPQALEAAQD RLQEKRFFAS LNIPTTPFAP 
VDDRESLEAA VVHIGLPAVL KTRRLGYDGK GQVILHTHTD VDPAWHALGG QPLILEKFIA 
FDRELSVLAV RGQDGGIACY PLVENVHRNG ILHRSIAPAP GLAAETQMLA ETYARRVLEA 
LDYIGVLAIE LFEIDETNAR ATGARLLANE MAPRVHNSGH WTIEGAVTSQ FENHVRAIVG 
LPTGATSARG YAAMVNLIDS LPDITMLLAL PDTHVHLYDK APRPGRKLGH VTICAGDVTQ 
LADRLAVVER YVLAC