Gene SeD_A1103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1103
Symbol
ID	6873365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	1100304
End bp	1101878
Gene Length	1575 bp
Protein Length	524 aa
Translation table	11
GC content	56%
IMG OID	642784288
Product	nudix hydrolase
Protein accession	YP_002214962
Protein GI	198241782
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1051] ADP-ribose pyrophosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	0.426954
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACACCT ACGCTGCCGG GATCCTGTTT AAGTCTGGCG GGAAAATATT TCTGGTTAAG 
CGTGGGGATG ATGGTTCGTG GACGGTACCG GGCGGAAAAC TCGAAGAGGG GGAGACGCCT 
GAAGCCGCGG CAAAGCGTGA AGTGCTGGAA GAATGCGGGT TTGATTATTC CGCACCGCTG 
ACGCCTCATA CCCTGATTGA TGGCTATGTT ACCTACCTCG CAGATGATGC TGAGCAATTC 
GACGCGGTAC TGAACGATGA AAATCAGGCC TGTGGCTGGT TTTCTCCGGA TGAACTGCCG 
GAACCGTTGC ATCCCGGTAT GGTGGCAATG CTTGATGCCG AACCACTCAA TGAAAAGGAC 
GTTGCCGGGC TTATTGCCGA CGGGCAACTC ACATCCCCGC AGTTTTTCAG AAATATGTAC 
CTGTGGGCGC TGCGTATCAC CGGAACGGGT GTTACCTGGC GTTCTAAGTT CAGGCAATAC 
GCTTACCGTT CTCCCGAGAA TTACCTCACT GATGATTTCC TCGCCCGGTG CTCTGGCCTG 
CCGGTGATCT GGCTGCACCC GGAGAAAAAC ACGCTGAACA GCGAGGAGTA CGCCGCGAGG 
ACTATCGGTG CGATTGCATT TGCCTGGATC CAGGGTGATG AGGTGTGGGG AATGGCCCGC 
ATCTACGACA CTGACGCCGC CACGATTCTT TCAACGCGGC AACTGAGTAC ATCCCCCACG 
GTGACGGGCG GCGATGACGT TCTGATCAAC GTCGACGGCG AGCCGCTGCT GCTGGAGGGG 
AACCCTGTTT TACTGGACCA CCTGGCTATT TGTGAGCAGG GCGTCTGGGA CAAGCTGGGG 
GAACCGACGG GAGTTAAATC CGACACACTT TTGAACGAGG TCCAGAAAAT GGATGAAGAA 
AAAGTATTAG CACTCATTAA CCAGGCGCTG GACGCTCGCG AAGCCCGCGC AAAGGCCGAC 
GCCGAGGAAA AAGCAAAAGC AGATGCTGAA GCAGCAGAAA AGGCGAAAGC TGATGAAGAT 
GCCGCCCGTC TCAAGGAAGA GGAAGAAAAG GCGAAGGCTG ACGCTGAAGC AAAGGCCAAA 
GCGGACGCGG AGGCAGAAGA AAAAGCCAAA GCGGATGCCG AACTGGAAAA AATCCGCGCA 
GACATGGAAG AAATGAAAAG TCGTGTACCG CAGGAACTCA GCGATGAAGA GCGCAATGAA 
ATCGCTGATA CCCAGTGTAA GGCCGACAGC GTGTTTGCTT CATTTGGTGA GCGCGCGCCG 
CAGCCGATGG CGGGAGAACG CGCTATGCCA TACCGCCGCC GCATCATGAC TCGCCTGCAA 
AAATATTCTT CAGACTATAA AGAAGTGGAT CTGCATGCCA TCGCAGACAG CCAGCTCCTG 
AGTATTGCGG AGAAAAAAAT CTATGCCGAT GCGCAGGCAT CAGCGGCATC CAGTCTGGAG 
CCCGGCGCCG GGTTACGTGA AGTCATCCGC ACCGACGCCA CCGGACGCCG TATCAGTACC 
TTTATCGGCG ATCCGTCCGC AACATGGGCA CCGTTCCAGG CCGTCAGCCG CAAAGTCGCT 
GGCATCAAAC AGTAA

Protein sequence

MNTYAAGILF KSGGKIFLVK RGDDGSWTVP GGKLEEGETP EAAAKREVLE ECGFDYSAPL 
TPHTLIDGYV TYLADDAEQF DAVLNDENQA CGWFSPDELP EPLHPGMVAM LDAEPLNEKD 
VAGLIADGQL TSPQFFRNMY LWALRITGTG VTWRSKFRQY AYRSPENYLT DDFLARCSGL 
PVIWLHPEKN TLNSEEYAAR TIGAIAFAWI QGDEVWGMAR IYDTDAATIL STRQLSTSPT 
VTGGDDVLIN VDGEPLLLEG NPVLLDHLAI CEQGVWDKLG EPTGVKSDTL LNEVQKMDEE 
KVLALINQAL DAREARAKAD AEEKAKADAE AAEKAKADED AARLKEEEEK AKADAEAKAK 
ADAEAEEKAK ADAELEKIRA DMEEMKSRVP QELSDEERNE IADTQCKADS VFASFGERAP 
QPMAGERAMP YRRRIMTRLQ KYSSDYKEVD LHAIADSQLL SIAEKKIYAD AQASAASSLE 
PGAGLREVIR TDATGRRIST FIGDPSATWA PFQAVSRKVA GIKQ