Gene SeD_A0581 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A0581
Symbol	purK
ID	6871351
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	599470
End bp	600537
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	59%
IMG OID	642783801
Product	phosphoribosylaminoimidazole carboxylase ATPase subunit
Protein accession	YP_002214488
Protein GI	198244482
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0705893
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCAAG TTTGCGTTCT CGGCAACGGA CAACTGGGCC GAATGCTGCG CCAGGCGGGC 
GAACCGCTGG GTATCGCCGT CTGGCCGGTT GGTCTGGATG CAGAGCCTAC CGCCGTGCCG 
GTACAGCAGA GCGTCATTAC CGCAGAGATT GAGCGCTGGC CGGAAACCGC GCTTACCCGC 
GAGCTGGCGC GCCACCCGGC CTTCGTCAAT CGCGATGTAT TTCCGATCAT CGCCGACCGT 
CTGACACAAA AACAGCTTTT CGATAAACTG GGACTCGCGA CCGCGCCGTG GCAGCTGCTG 
ACCAGCACCG ACGAGTGGTC CGGCATCTTT GACCGCCTGG GCGAACTGGC GATTATTAAG 
CGTCGCGTTG GCGGCTACGA CGGTCGCGGG CAGTGGCGTC TACGCGCGGA CGAAACCGGG 
CAACTGCCGG ATGACTGCTA TGGCGAATGT ATTGTTGAGC GCGGTATCCA TTTTTCCGGC 
GAAGTGTCGT TAGTCGGCGC GCGCGCTCAT GACGGCAGTA CCGTGTTTTA CCCGCTAACG 
CACAATTTGC ATCAGGACGG CATCTTGCGG ACCAGCGTCG CGTTCCCACA GGCGAACGCC 
GAACAGCAGG AGCAGGCGGA ATCGATGCTG TCAGCAATTA TGCAGGCGCT GAACTACGTC 
GGCGTAATGG CGATGGAATG TTTTATCACG CCGGAAGGCC TGTTAATCAA TGAACTGGCG 
CCGCGCGTGC ATAACAGCGG ACACTGGACG CAAAATGGCG CCAGCATCAG TCAGTTTGAA 
TTGCATTTGC GCGCGATTAC CGGCCTGCCG TTGCCCGCGC CGGTGATTAA CGCCCCGTCG 
GTGATGATCA ACCTGATCGG CAGCGAGCTG AATTACGACT GGCTGAAGCT GCCGCTGGTA 
CATCTGCACT GGTATGATAA AGCGGTACGT CCGGGGCGAA AAGTCGGCCA TCTGAATCTG 
ACCGACAGCG ATACGTCACG TCTTAGCGCC ACCCTGGAAG CGCTCTCTCC GCTCCTGCCG 
GGCGAATACG CCAGCGGCAT TATCTGGGCG CAAAGTAAGC TTAAATAA

Protein sequence

MKQVCVLGNG QLGRMLRQAG EPLGIAVWPV GLDAEPTAVP VQQSVITAEI ERWPETALTR 
ELARHPAFVN RDVFPIIADR LTQKQLFDKL GLATAPWQLL TSTDEWSGIF DRLGELAIIK 
RRVGGYDGRG QWRLRADETG QLPDDCYGEC IVERGIHFSG EVSLVGARAH DGSTVFYPLT 
HNLHQDGILR TSVAFPQANA EQQEQAESML SAIMQALNYV GVMAMECFIT PEGLLINELA 
PRVHNSGHWT QNGASISQFE LHLRAITGLP LPAPVINAPS VMINLIGSEL NYDWLKLPLV 
HLHWYDKAVR PGRKVGHLNL TDSDTSRLSA TLEALSPLLP GEYASGIIWA QSKLK