Gene SeHA_C4243 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4243
Symbol	gppA
ID	6491077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	4131716
End bp	4133197
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	56%
IMG OID	642744336
Product	guanosine pentaphosphate phosphohydrolase
Protein accession	YP_002047934
Protein GI	194449328
COG category	[F] Nucleotide transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0248] Exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	103
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTCCA CCTCGTTGTA TGCCGCCATT GATCTCGGTT CCAATAGTTT TCATATGCTG 
GTCGTGCGCG AGGCGGCGGG AAGCATCCAG ACGCTGACCC GAATAAAACG CAAGGTGCGT 
CTGGCCGCGG GTCTGAACAA CGACAACCAC CTTTCAGCCG AAGCGATGGA ACGCGGCTGG 
CAATGTCTGC GCCTGTTTGC TGAACGTTTG CAGGATATTC CGCAGCCGCA AATCCGCGTG 
GTTGCCACCG CAACATTGCG TCTCGCCGTC AATGCGGGTG AATTTATCGC GAAAGCGCAG 
ACTATCCTTG GTTGTCCGGT GCAGGTTATC AGCGGCGAAG AAGAGGCGCG GCTAATTTAT 
CAGGGGGTCG CTCATACCAC CGGCGGCGCA GATCAGCGAC TGGTGGTGGA TATCGGCGGC 
GCCAGCACTG AACTGGTTAC CGGCACTGGC GCGCAAACCA CGTCGCTGTT TAGCCTGTCG 
ATGGGCTGCG TAACGTGGCT TGAACGCTAT TTTAGCGATC GTAATCTGGC GCAAGAAAAC 
TTTGATGATG CGGAGAAAGC CGCGCGCGAT GTACTGCGTC CGGTCGCCGA TGAACTGCGT 
TTTCATGGCT GGAAGGTCTG CGTGGGTGCC TCCGGCACCG TACAGGCATT GCAGGAAATC 
ATGATGGCGC AGGGGATGGA CGAGCGCATT ACGCTCGCCA AACTGCAGCA GCTAAAACAA 
CGCGCGATAC AGTGCGGGCG TCTGGAAGAG CTGGAAATCG AAGGCCTGAC GCTGGAGCGC 
GCGCTGGTTT TCCCAAGCGG GCTGGCTATT CTGATCGCGA TATTTACCGA GCTGAACATC 
CAGAGCATGA CGCTGGCAGG CGGCGCGTTA CGCGAAGGGC TGGTGTATGG GATGTTGCAT 
CTGGCGGTAG ATCAGGATAT CCGCAGCCGC ACGCTGCGAA ACATTCAGCG TCGGTTTATC 
GTCGATACCG AGCAGGCGAA CCGCGTAGCG AAGCTGGCAG ATAACTTCCT CAAACAGGTA 
GAAAATGCCT GGCATATTGA GCCTATCAGT CGTGAACTGT TGCTTAGCGC TTGCCAGTTG 
CATGAGATCG GTCTGAGCGT TGATTTTAAA CAGGCGCCCT ATCATGCCGC CTATTTAGTA 
CGCCATTTGG ATCTGCCTGG CTATACGCCC GCGCAGAAAA AGTTGCTCGC CACCCTCTTA 
CTGAATCAGA CCAATCCGGT CGATCTCTCT TCGCTTCATC AGCAAAACGC GGTACCGCCC 
CGTGTTGCGG AACAGCTATG CCGTTTGCTG CGACTGGCGA TTCTTTTTGC CGGTCGCCGT 
CGTGACGATC TGGTACCAGA AATTACGCTA CAGGCGCTAA ATGAAAATCT GACGTTAACC 
TTGCCTGGCG ACTGGCTGGC ACATCACCCG CTGGGTAAAG AGTTGATTGA TCAGGAAAGC 
CAGTGGCAAA GCTATGTACA CTGGCCGCTG GACGTTCGCT AA

Protein sequence

MNSTSLYAAI DLGSNSFHML VVREAAGSIQ TLTRIKRKVR LAAGLNNDNH LSAEAMERGW 
QCLRLFAERL QDIPQPQIRV VATATLRLAV NAGEFIAKAQ TILGCPVQVI SGEEEARLIY 
QGVAHTTGGA DQRLVVDIGG ASTELVTGTG AQTTSLFSLS MGCVTWLERY FSDRNLAQEN 
FDDAEKAARD VLRPVADELR FHGWKVCVGA SGTVQALQEI MMAQGMDERI TLAKLQQLKQ 
RAIQCGRLEE LEIEGLTLER ALVFPSGLAI LIAIFTELNI QSMTLAGGAL REGLVYGMLH 
LAVDQDIRSR TLRNIQRRFI VDTEQANRVA KLADNFLKQV ENAWHIEPIS RELLLSACQL 
HEIGLSVDFK QAPYHAAYLV RHLDLPGYTP AQKKLLATLL LNQTNPVDLS SLHQQNAVPP 
RVAEQLCRLL RLAILFAGRR RDDLVPEITL QALNENLTLT LPGDWLAHHP LGKELIDQES 
QWQSYVHWPL DVR