Gene Rru_A2167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A2167
Symbol
ID	3835594
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	+
Start bp	2516259
End bp	2517425
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	67%
IMG OID	637826269
Product	phosphoribosylformylglycinamidine cyclo-ligase
Protein accession	YP_427254
Protein GI	83593502
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCCGGG GAACCGCACC GGCTGCGGGC GCCCACCCGC CGCGACGAAC ACCAGTGAAG 
AACGAGGTTG CCATTTCCAC TTCCCATCTC GACGCCGGCG CCACGGGCAC CGGCCTGACC 
TATAAAGATG CCGGTGTTGA CATAGACAGC GGCAATGCTC TCGTGCAAGC GATCAAACCG 
CTTGCCGCAT CGACAAAGCG CCCGGGGGCC GACGCGTCCC TCGGCGGCTT CGGCGCGATC 
TTCGATCTTG CCGCCGCCGG CTATTCCGAT CCCCTTCTTA TCACGGCGAC GGACGGTGTT 
GGCACAAAGC TGAAGATCGC CCTCGACTCG GGCATCCATG ATAGCGTCGG CATCGACCTC 
GTGGCCATGT GCGTCAATGA TCTGGTCGTC CAGGGCGGCG AGCCGCTGCT GTTTCTCGAC 
TACTTCGCCA CCTCGCGCCT GCAGGTGCCG GTGGCCAGCG CCGTGGTCAA GGGCATCGCC 
GAGGGCTGCC TTCAGGCCGG TTGCGCCCTG GTCGGCGGCG AGACCGCCGA AATGCCCGGC 
ATGTATGGCA ATAACGACTA TGATCTGGCC GGCTTCGCCG TTGGCGCCGT CGAGCGCTCG 
CAGCTTCTGA CCGATGACCG CATCGGCCTG GGCGACGTTC TGCTCGGCCT CGCCAGCTCG 
GGCGTCCATT CCAACGGCTT CTCGCTGGTC CGGCGCATCG TCGAGCGCAG CGGCTTGGCC 
TGGGACGCCC CGGCGCCCTT CGCCCCCGAA ACCACCCTGG CCCGCGCCCT GCTGACGCCC 
ACGCGCATCT ATGTGAAATC CTGTCTGGCC CTGCACCGCG CTGGGCTGGT TCATGGCTTC 
GCCCATATCA CCGGCGGCGG CTTCTGGGAG AATATCCCGC GTGTTCTGCC CCAGGGGGCT 
TGCGCCCACC TTGACGGCCT GTCCTGGCCC TTCCCGCCGG TCTTCCGCTG GCTGATGGAT 
CAGGGCGGCG TCAGCGCCCA TGAAATGGCC CGCACCTTCA ACTGCGGCAT CGGCATGGTG 
GTTGCCGTTC CCGCCGACAA GGCCGAAGCC GCCATCGCTT TGCTTGGCGA ACACGGTGAA 
ACCGTTCATC GCCTGGGCAC CATCGCCGCG CGCGGCGAGG GCGAGGCGGT GATCATCGAT 
CACCTGGACG AAGCCTTCGC CCGATGA

Protein sequence

MVRGTAPAAG AHPPRRTPVK NEVAISTSHL DAGATGTGLT YKDAGVDIDS GNALVQAIKP 
LAASTKRPGA DASLGGFGAI FDLAAAGYSD PLLITATDGV GTKLKIALDS GIHDSVGIDL 
VAMCVNDLVV QGGEPLLFLD YFATSRLQVP VASAVVKGIA EGCLQAGCAL VGGETAEMPG 
MYGNNDYDLA GFAVGAVERS QLLTDDRIGL GDVLLGLASS GVHSNGFSLV RRIVERSGLA 
WDAPAPFAPE TTLARALLTP TRIYVKSCLA LHRAGLVHGF AHITGGGFWE NIPRVLPQGA 
CAHLDGLSWP FPPVFRWLMD QGGVSAHEMA RTFNCGIGMV VAVPADKAEA AIALLGEHGE 
TVHRLGTIAA RGEGEAVIID HLDEAFAR