Gene SeSA_A4125 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A4125
Symbol	gppA
ID	6515780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	4000487
End bp	4001968
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	56%
IMG OID	642749093
Product	guanosine pentaphosphate phosphohydrolase
Protein accession	YP_002116849
Protein GI	194737882
COG category	[F] Nucleotide transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0248] Exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.353078
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTCCA CCTCGTTGTA TGCCGCTATT GATCTCGGTT CCAATAGTTT TCATATGCTG 
GTCGTGCGCG AGGCGGCGGG AAGCATCCAG ACGCTGACCC GAATAAAACG CAAGGTGCGT 
CTGGCCGCGG GTCTGAACAA CGACAACCAC CTTTCAGCCG AAGCGATGGA ACGCGGCTGG 
CAATGCCTGC GTCTGTTTGC TGAACGTTTG CAGGATATTC CGCAGCCGCA AATCCGCGTG 
GTTGCCACCG CAACATTGCG TCTCGCCGTC AATGCAGGGG AATTTATCGC GAAAGCGCAG 
ACTATCCTTG GTTGTCCGGT GCAGGTTATC AGCGGCGAAG AAGAGGCGCG GCTAATTTAT 
CAGGGGGTCG CTCATACCAC CGGCGGCGCA GATCAGCGGC TGGTGGTGGA TATCGGCGGC 
GCCAGCACTG AACTGGTTAC CGGCACTGGC GCGCAAACCA CGTCGCTGTT TAGCCTGTCG 
ATGGGCTGCG TAACGTGGCT TGAACGCTAT TTTAGCGATC GTAATCTGGC GCAAGAAAAC 
TTTGATGATG CGGAGAAGGC CGCGCGCGAT GTACTGCGTC CGGTCGCCGA TGAACTGCGT 
TTTCATGGCT GGAAGGTCTG CGTGGGTGCC TCCGGCACCG TACAGGCATT GCAGGAAATC 
ATGATGGCGC AGGGGATGGA CGAGCGCATT ACGCTCGCCA AACTGCAGCA GCTAAAACAA 
CGCGCGATAC AGTGCGGGCG TCTGGAAGAG CTGGAAATCG AAGGCCTGAC GCTGGAACGC 
GCGCTGGTTT TCCCAAGTGG GCTGGCTATT CTGATCGCGA TATTTACCGA GCTGAACATC 
CAGAGCATGA CGCTGGCAGG CGGCGCGTTA CGCGAAGGGC TGGTGTATGG GATGTTGCAT 
CTGGCGGTAG ATCAGGATAT CCGCAGCCGC ACGCTGCGAA ACATTCAGCG TCGGTTTATC 
GTCGATACCG ATCAGGCGAA CCGCGTAGCG AAGCTGGCAG ATAACTTCCT CAAACAGGTA 
GAAAATGCTT GGCATATTGA GCCTATCAGT CGTGAACTGT TGCTTAGCGC TTGCCAGTTG 
CATGAGATCG GTCTGAGCGT TGATTTTAAA CAGGCGCCCT ATCATGCCGC CTATTTAGTA 
CGCCATTTGG ATCTGCCTGG CTATACGCCC GCGCAGAAAA AGTTGCTCGC CACCCTCTTA 
CTGAATCAGA CCAATCCGGT CGATCTCTCT TCGCTTCATC AGCAAAACGC GGTACCGCCC 
CGTGTTGCGG AACAGCTATG CCGTTTGCTG CGCCTGGCGA TTCTTTTTGC CGGTCGCCGT 
CGTGACGATC TGGTACCAGA AATTACGCTA CAGGCGCTAA ATGAAAATCT GACGTTAACC 
TTGCCTGGCG ACTGGCTGGC GCATCACCCG CTGGGTAAAG AGTTGATTGA TCAGGAAAGC 
CAGTGGCAAA GCTATGTACA CTGGCCGCTG GACGTTCGCT AA

Protein sequence

MNSTSLYAAI DLGSNSFHML VVREAAGSIQ TLTRIKRKVR LAAGLNNDNH LSAEAMERGW 
QCLRLFAERL QDIPQPQIRV VATATLRLAV NAGEFIAKAQ TILGCPVQVI SGEEEARLIY 
QGVAHTTGGA DQRLVVDIGG ASTELVTGTG AQTTSLFSLS MGCVTWLERY FSDRNLAQEN 
FDDAEKAARD VLRPVADELR FHGWKVCVGA SGTVQALQEI MMAQGMDERI TLAKLQQLKQ 
RAIQCGRLEE LEIEGLTLER ALVFPSGLAI LIAIFTELNI QSMTLAGGAL REGLVYGMLH 
LAVDQDIRSR TLRNIQRRFI VDTDQANRVA KLADNFLKQV ENAWHIEPIS RELLLSACQL 
HEIGLSVDFK QAPYHAAYLV RHLDLPGYTP AQKKLLATLL LNQTNPVDLS SLHQQNAVPP 
RVAEQLCRLL RLAILFAGRR RDDLVPEITL QALNENLTLT LPGDWLAHHP LGKELIDQES 
QWQSYVHWPL DVR