Gene SeSA_A2022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A2022
Symbol
ID	6517100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	1944300
End bp	1945406
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	51%
IMG OID	642747105
Product	exodeoxyribonuclease 8
Protein accession	YP_002114906
Protein GI	194734908
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCTGATA ACACCCCAAC AACCCATGAA GAAAATGCAG CAAGGCTTCG TCAGGCGGGC 
AAATGTCTGC GGGATATTGA GGCAGGGAGA TTTCAGTGTG ATGAAGAAAA ACCGCAACCG 
ACAGGCGAAC TGGCAGATGA ACCAGCAACG CCTGAAGCAG TGGAACAGGA CACAACTGAA 
CATCATCCGG ATCCACAGCC GCTGGAGAAT GAGCCACCTG TAAGCCAGAC AGAAGCAGGC 
TACCAGAAAA TACGGGCAGA ACTGCACGAA GCACGTAAAA ACATTCCACC CAAAAACCCG 
GTTGATGTTG GTAAACAACT GGCAGCCGTG CGCGGTGAAT ATGCCGAAGA CATCAGCGAC 
CCGAACGATC CGAAGTGGGT TCCTAACAAT TACAGCGCCT CAAATCAGGG TGAAAAAGAA 
GAAGTGGTGC CGGAGGAAAA ACAACTAGCA GCAGAGCCGG AGGCTGTCAC CAGAAACGCG 
GACGGGACTT TCGATGTATC AGCGCTATTT CCGCCCCCCT CAAACCAGAC CGAAAAAACG 
GAAGCCAGAA CAGAAAGAGA TGGAGAAACG CCGAAAGAGA GCAACCAGCA GGAAACGGCT 
GGCGATACAG GGCAGGAAAT TACAACGGAC GGTGGATCAG GTACTGGCGG TGATGAAGCT 
GGCGAAGCGG CAGATCCCGT AGAAAACGGA AATTTCACTG TCCCTGATGA TATACAGCCA 
GGCATTTACT ATGACATCCC TAACGAGGCG TATCACGCTG GCCCGGGGGT CAGTAAATCA 
CAGCTTGATG ATATCGCAGA TACACCAGCA ATTTATCTTT GGCGCAAAAA TGCCCCCGTG 
GACACGGAGA AAACAAAATC TCTCGATACA GGAACGGCTT TTCACTGCCG GGTACTGGAA 
CCAGAGGAAT TCAGTAAACG CTTCATCATC GCACCGGAGT TTAACCGCCG TACCAGTGCA 
GGAAAAGAAG AAGAGAAAAC CTTTCTGGAA GAGTGCGCAC GGACAGGAAT AACCGTGCTT 
ACGGCAGAAG AAGGCCGGAA AATCGAACTT ATGTACCAGA GTGTGATGGC GTTAACCGAG 
TGCATTGCTG GAGAAGTTGA TCAGTGA

Protein sequence

MPDNTPTTHE ENAARLRQAG KCLRDIEAGR FQCDEEKPQP TGELADEPAT PEAVEQDTTE 
HHPDPQPLEN EPPVSQTEAG YQKIRAELHE ARKNIPPKNP VDVGKQLAAV RGEYAEDISD 
PNDPKWVPNN YSASNQGEKE EVVPEEKQLA AEPEAVTRNA DGTFDVSALF PPPSNQTEKT 
EARTERDGET PKESNQQETA GDTGQEITTD GGSGTGGDEA GEAADPVENG NFTVPDDIQP 
GIYYDIPNEA YHAGPGVSKS QLDDIADTPA IYLWRKNAPV DTEKTKSLDT GTAFHCRVLE 
PEEFSKRFII APEFNRRTSA GKEEEKTFLE ECARTGITVL TAEEGRKIEL MYQSVMALTE 
CIAGEVDQ