Gene SeD_A2871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2871
Symbol
ID	6873517
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	2745905
End bp	2747485
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	54%
IMG OID	642785922
Product	exopolyphosphatase
Protein accession	YP_002216572
Protein GI	198244636
COG category	[F] Nucleotide transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0248] Exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	81
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTACAT CAAATCACTC GAGCAACCAG ACTAACGCTA TGCCAATTTA CGATAAATCC 
CCTCGTCCGC AGGAGTTCGC TGCGGTCGAT CTCGGCTCAA ACAGCTTTCA TATGGTCATT 
GCCCGCGTGG TTGACGGCGC AATGCAGATT ATCGGGCGTT TAAAACAGCG CGTCCATCTG 
GCGGACGGGC TGGGCGCAGA TAATAAACTC AGCGAAGAAG CCATGGAACG GGGGCTTAGC 
TGTCTGTCGC TGTTTGCTGA ACGCTTACAA GGTTTCTCCC CTTCCAGCGT CTGTATCGTA 
GGCACCCATA CGTTACGTCA GGCGCAAAAT GCCGCTGATT TTCTCAAACG CGCGGAAAAG 
GTTATTCCCT ACCCGATAGA GATTATTTCC GGTAACGAAG AAGCGCGCCT GATTTTTATG 
GGCGTAGAAC ATACGCAGCC GGAAAAAGGC CGCAAGCTGG TGATCGATAT CGGCGGCGGG 
TCAACAGAGC TGGTCATTGG CGAAAACTTC GAACCCAGGC TGGTTGAAAG CCGTCGTATG 
GGCTGCGTGA GCTTCGCGCA GCTCTACTTT CCCGGCGGCG TTATCAATAA AGAAAACTTC 
CAGCGCGCCC GAATGGCGGC GGCGCAAAAA CTGGAAACCT TAACCTGGCA GTATCGTATT 
CAGGGTTGGA ACGTAGCGAT GGGCGCTTCC GGTACGATTA AGGCCGCTCA TGAAGTTCTC 
CTGGCGCTGG GTGAGAAAGA TGGCTTCATT ACGCCGGAGC GCCTCGATAA ACTGAAGTCA 
GAAGTGTTGA AGCACCGCTC CTTTAATGCG CTCAGCCTGC CGGGTCTGTC TGAAGAACGA 
AAAGCGGTCT TTGTGCCGGG CCTGGCGATT CTGTGCGGCG TTTTTGATGC TCTGGCTATC 
CGCGAGCTTC GCCTTTCCGA CGGCGCGTTG CGCGAAGGCG TGCTGTATGA AATGGAAGGC 
CGCTTCCGCC ATCAGGATGT TCGCAGCCGT ACCGCAAAAA GTCTGGCCAA TCAATACAAC 
ATTGACAGAG AACAGGCCAG ACGCGTGCTG GAAACCACCA TGCAGATGTA CGAGCAGTGG 
CAGGCCCAGC AGCCAAAACT GGCGCATCCG CAGCTTGAAG CGTTGCTCCG CTGGGCGGCA 
ATGCTGCATG AGGTTGGACT GAATATTAAT CACAGCGGTT TACATCGCCA TTCGGCTTAT 
ATTCTGCAAC ACAGCGATTT GCCCGGCTTT AATCAGGAGC AGCAAATGAT GATGGCGACG 
CTGGTGCGTT ACCATCGTAA AGCCATAAAA CTGGATGATA TGCCCCGCTT TACGCTGTTT 
AAGAAAAAAC AGTATCTGCC GTTAATTCAG CTACTTCGGC TGGGCGTATT ACTGAACAAC 
CAGCGGCAGG CGACCACTAC GCCGCCAACG CTGCGACTAA CGACCGATGA CAGCCACTGG 
ACGTTATGTT TTCCGCATGA CTGGTTCAGC CAGAATGCGC TGGTACTGCT TGATCTGGAA 
AAAGAACAGC AGTACTGGGA AGCTGTAACT GGCTGGCGTC TCAATATTGA GGAAGAAAGC 
TCGCCGGAGA TCGCCGCGTA A

Protein sequence

MTTSNHSSNQ TNAMPIYDKS PRPQEFAAVD LGSNSFHMVI ARVVDGAMQI IGRLKQRVHL 
ADGLGADNKL SEEAMERGLS CLSLFAERLQ GFSPSSVCIV GTHTLRQAQN AADFLKRAEK 
VIPYPIEIIS GNEEARLIFM GVEHTQPEKG RKLVIDIGGG STELVIGENF EPRLVESRRM 
GCVSFAQLYF PGGVINKENF QRARMAAAQK LETLTWQYRI QGWNVAMGAS GTIKAAHEVL 
LALGEKDGFI TPERLDKLKS EVLKHRSFNA LSLPGLSEER KAVFVPGLAI LCGVFDALAI 
RELRLSDGAL REGVLYEMEG RFRHQDVRSR TAKSLANQYN IDREQARRVL ETTMQMYEQW 
QAQQPKLAHP QLEALLRWAA MLHEVGLNIN HSGLHRHSAY ILQHSDLPGF NQEQQMMMAT 
LVRYHRKAIK LDDMPRFTLF KKKQYLPLIQ LLRLGVLLNN QRQATTTPPT LRLTTDDSHW 
TLCFPHDWFS QNALVLLDLE KEQQYWEAVT GWRLNIEEES SPEIAA