Gene SeAg_B0579 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B0579
Symbol	purK
ID	6795778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	-
Start bp	578900
End bp	579967
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	59%
IMG OID	642774860
Product	phosphoribosylaminoimidazole carboxylase ATPase subunit
Protein accession	YP_002145516
Protein GI	197250376
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0000140285
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCAAG TTTGTGTTCT CGGCAACGGA CAACTGGGCC GAATGCTGCG CCAGGCGGGC 
GAACCGCTGG GTATCGCCGT CTGGCCGGTT GGTCTGGATG CAGAGCCTAC CGCCGTGCCG 
GTACAGCAGA GCGTCATTAC CGCAGAGATT GAGCGCTGGC CGGAAACCGC GCTTACCCGC 
GAGCTGGCGC GCCACCCGGC CTTCGTCAAT CGTGATGTAT TTCCGATCAT CGCCGACCGT 
CTGACACAAA AACAGCTTTT CGATAAACTG GGACTCGCGA CCGCGCCGTG GCAGCTGCTG 
ACCAGCGCCG ACGAGTGGTC CGGCATCTTT GACCGTCTGG GAGAACTGGC GATTATTAAG 
CGTCGCGTTG GCGGCTACGA CGGTCGCGGG CAGTGGCGTC TACGCGCGGA CGAAACCGGG 
CAACTGCCGG ATGACTGCTA TGGCGAATGT ATTGTTGAGC GCGGTATCCA TTTTTCCGGC 
GAAGTGTCGT TAGTCGGCGC TCGCGCTCAT GACGGCAGTA CCGTGTATTA CCCGCTAACG 
CACAATTTGC ATCAGGACGG CATCTTGCGG ACCAGCGTCG CGTTCCCACA GGCGAACGCC 
GAACAGCAGG AGCAGGCGGA ATCGATGCTG TCAGCAATTA TGCAGGCGCT GAACTATGTC 
GGCGTAATGG CGATGGAATG TTTTATCACG CCGGAAGGCC TGTTAATCAA TGAACTGGCG 
CCGCGCGTAC ATAACAGCGG ACACTGGACG CAAAATGGCG CCAGCATCAG TCAGTTTGAA 
TTGCATTTGC GCGCGATTAC CGGCCTGCCG TTGCCCGCGC CGGTGATTAA CGCCCCGTCG 
GTGATGATCA ACCTGATCGG CAGCGAGCTG AATTACGACT GGCTGAAGCT GCCGCTGGTA 
CATCTGCACT GGTATGATAA AGCGGTACGT CCGGGGCGAA AAGTCGGCCA TCTGAATCTG 
ACCGACAGCG ATACGTCACG TCTTAGCGCC ACCCTGGAAG CGCTTTCTCC GCTCCTGCCG 
GGCGAATACG CCAGCGGCAT TATCTGGGCG CAAAGTAAGC TTAAATAA

Protein sequence

MKQVCVLGNG QLGRMLRQAG EPLGIAVWPV GLDAEPTAVP VQQSVITAEI ERWPETALTR 
ELARHPAFVN RDVFPIIADR LTQKQLFDKL GLATAPWQLL TSADEWSGIF DRLGELAIIK 
RRVGGYDGRG QWRLRADETG QLPDDCYGEC IVERGIHFSG EVSLVGARAH DGSTVYYPLT 
HNLHQDGILR TSVAFPQANA EQQEQAESML SAIMQALNYV GVMAMECFIT PEGLLINELA 
PRVHNSGHWT QNGASISQFE LHLRAITGLP LPAPVINAPS VMINLIGSEL NYDWLKLPLV 
HLHWYDKAVR PGRKVGHLNL TDSDTSRLSA TLEALSPLLP GEYASGIIWA QSKLK