Gene SeSA_A4820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A4820
Symbol
ID	6518226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	4676033
End bp	4677583
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	54%
IMG OID	642749752
Product	hypothetical protein
Protein accession	YP_002117481
Protein GI	194735927
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGCCT CATGCGAAAC TGCGCTCCAG CAGCGTTGCC AGCAAATTGT GACCAGCCCG 
GTGCTCACGC CTGAACAAAA ACGCCATTTT CTGGCGCTGG AAGCTGAAAA CGCCCTGCCT 
TATCCCACCC TGCCGGAAGA TGCCCGCCAG GCGCTGGATG AAGGCGTCAT TTGCGATATG 
TTTGAGGGGC ACGCCCCCTT CAAACCGCGC TACGTGTTGC CCGATTACGC CCGATTTCTG 
GCTAACGGTT CACAGTGGCT GGAACTGGAA GGCGCGAAAG ATCTGGATGA TGCGTTATCC 
CTACTCACCA TTCTGTATCA TCACGTACCT TCCGTGACGT CCATGCCGGT TTATCTCGGC 
CAGCTTGATG CGTTGCTGCA ACCGTATGTT AGAATTCTAA CACAAGATGC GATCGATATT 
CGAATAAAAC GTTTCTGGCG TTATCTCGAC AGAACGCTGC CAGACGCCTT TATGCATGCC 
AATATTGGCC CTGCCGATAC GCCTGTCACA CGAGCGATTT TGCGCGCTGA TGCCGAGCTA 
AATCAGGTGG CGCCTAACCT GACGTTTATC TACGATGCGG AAATTACGCC GGACGATCTG 
CTGCTGGAGG TCGCCAAAAA CATTTGCGAA TGCAGTAAGC CACACATTTC CAACGGCCCT 
GTAAATGATA AAATTTTCAC AAAAGGCCAT TATGGCATCG TCAGTTGTTA TAACTCGCTA 
CCGCTTGGCG GCGGCGGCAG TACGCTGGTA CGTCTCAACC TGAAAGCCGT GGCAGAACGC 
AGTACGTCTG TCGATGACTT CTTTTCACGC ACGCTACCGC ACTACTGCCG ACAGCAGATC 
GCCATCATTA ATTCACGATG TGAATTCCTC TATGAAAAGT CACATTTCTT TGAGAATAGC 
TTTCTTGTAC AGGAAGGTTT GATCGATCCC GAACGTTTTG CGCCGATGTT CGGTATGTAC 
GGGCTGGCGG AAGCCGTGAA CCTGCTGTGC GAAAACGCGG GCCTGACCGC CCGTTACGGC 
AAGAATGAAA CGGCGAACGA GCTGGGCTAC CGTATCAGCG CCCAACTGGC GGATTTCGTC 
GAAAATACGC CAGTGAAGTA TGGCTGGAAG CAACGGGCGC TGCTCCATGC CCAGTCTGGC 
ATAAGTTCCG ATATCGGCAC TACGCCGGGC GCGCGTCTGC CGTATGGCGA TGAACCGGAC 
CCTATCACCC ATTTGCAAAC CGTCGCACCG CACCATGCCT TTTATCATGC CGGGATCAGC 
GACATTCTGA CGCTGGACGA AACCATCAAG CGTAATCCGC AGGCGCTGGT TCAGCTTTGT 
CTTGGCGCGT TCAAAGCCGG GATGCGGGAA TTTACCGCCA ATGTCAGCGG CAACGATCTG 
GTGCGCGTCA CCGGTTATAT GGTGCGCCTG TCGGATCTGG CGAAATTTCG CGCCGAAGGC 
TCGCGCACGA ATACCACCTG GCTGGGAGAA GAAGCCGCAC GTAATACCCG CATCCTGGAA 
CGACAGCCAC GCGTAGTCAG CCATGAACAA CAGATGCGCT TTAGTCAGTA A

Protein sequence

MPASCETALQ QRCQQIVTSP VLTPEQKRHF LALEAENALP YPTLPEDARQ ALDEGVICDM 
FEGHAPFKPR YVLPDYARFL ANGSQWLELE GAKDLDDALS LLTILYHHVP SVTSMPVYLG 
QLDALLQPYV RILTQDAIDI RIKRFWRYLD RTLPDAFMHA NIGPADTPVT RAILRADAEL 
NQVAPNLTFI YDAEITPDDL LLEVAKNICE CSKPHISNGP VNDKIFTKGH YGIVSCYNSL 
PLGGGGSTLV RLNLKAVAER STSVDDFFSR TLPHYCRQQI AIINSRCEFL YEKSHFFENS 
FLVQEGLIDP ERFAPMFGMY GLAEAVNLLC ENAGLTARYG KNETANELGY RISAQLADFV 
ENTPVKYGWK QRALLHAQSG ISSDIGTTPG ARLPYGDEPD PITHLQTVAP HHAFYHAGIS 
DILTLDETIK RNPQALVQLC LGAFKAGMRE FTANVSGNDL VRVTGYMVRL SDLAKFRAEG 
SRTNTTWLGE EAARNTRILE RQPRVVSHEQ QMRFSQ