Gene SeD_A4981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4981
Symbol
ID	6872004
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	4809149
End bp	4810699
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	54%
IMG OID	642787851
Product	hypothetical protein
Protein accession	YP_002218441
Protein GI	198243246
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.986087
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	98
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGCCT CATGCGAAAC TGCGCTCCAG CAGCGTTGCC AGCAAATTGT GACCAGCCCG 
GTGCTCACGC CTGAACAAAA ACGCCATTTT CTGGCGCTGG AAGCTGAAAA CGCCCTGCCT 
TATCCCCCCC TGCCGGAAGA TGCCCGCCAG GCGCTGGATG AAGGTGTCAT TTGCGATATG 
TTTGAGGGGC ACGCCCCCTT CAAACCGCGC TACGTGTTGC CCGATTACGC CCGATTTCTG 
GCTAACGGTT CACAGTGGCT GGAACTGGAA GGCGCGAAAG ATCTGGATGA TGCGTTATCC 
CTACTCACCA TTCTGTATCA TCACGTTCCT TCCGTGACGT CCATGCCGGT TTATCTCGGC 
CAGCTTGATG CGTTGCTGCA ACCATATGTT AGAATTATAA CACAAGATGC GATCGATATT 
CGAATAAAAC GTTTCTGGCG TTATCTCGAC AGAACGCTGC CAGACGCCTT TATGCATGCC 
AATATTGGCC CTGCCGATAC GCCTGTCACA CGAGCGATTT TGCGCGCTGA TGCCGAGCTA 
AAGCAGGTGA CGCCTAACCT GACGTTTATC TACGATGCGG AAATTACGCC GGACGATCTG 
CTGCTGGAGG TCGCCAAAAA CATTTGCGAA TGCAGTAAGC CACACATTTC CAACGGCCCT 
GTAAATGATA AAATTTTCAC AAAAGGGCAT TATGGCATCG TCAGTTGTTA TAACTCGCTA 
CCGCTTGGCG GCGGCGGCAG TACGCTGGTA CGTCTCAACC TGAAAGCCGT GGCAGAACGC 
AGTACGTCTG TCGATGACTT CTTTTCACGC ACGCTACCGC ACTACTGCCG ACAGCAGATC 
GCCATCATTA ATTCACGATG TGAATTCCTC TATGAAAAGT CACATTTCTT TGAGAATAGC 
TTTCTTGTAC AGGAAGGTTT GATCGATCCC GAACGTTTTG CGCCGATGTT CGGTATGTAC 
GGGCTGGCGG AAGCCGTGAA TCTGCTGTGC GAAAACGCGG GCCTGAACGC CCGTTACGGC 
AAGAATGAAA CGGCGAACGA GCTGGGCTAC CGTATCAGCG CCCAACTGGC GGATTTCGTC 
GAAAATACGC CAGTGAAGTA TGGCTGGAAG CAACGGGCGC TGCTCCATGC CCAGTCTGGC 
ATCAGTTCCG ATATCGGCAC TACGCCGGGC GCGCGTCTGC CGTATGGCGA TGAACCGGAC 
CCTATCACCC ATTTGCAAAC CGTCGCGCCG CACCATGCCT TTTACCATGC CGGGATCAGC 
GACATTCTGA CGCTGGACGA AACCATCAAG CGTAATCCGC AGGCGCTGGT TCAGCTTTGT 
CTTGGCGCGT TCAAAGCCGG GATGCGGGAA TTTACTGCCA ATGTCAGCGG CAACGATCTG 
GTGCGCGTCA CCGGTTATAT GGTGCGCCTG TCGGATCTGG CGAAATTTCG CGCCGAAGGC 
TCGCGCACGA ATACCACCTG GCCGGGAGAA GAAGCCGCAC GTAATACCCG CATCCTGGAA 
CGACAGCCAC GCGTAGTCAG CCATGAACAA CAGATGCGCT TTAGTCAGTA A

Protein sequence

MPASCETALQ QRCQQIVTSP VLTPEQKRHF LALEAENALP YPPLPEDARQ ALDEGVICDM 
FEGHAPFKPR YVLPDYARFL ANGSQWLELE GAKDLDDALS LLTILYHHVP SVTSMPVYLG 
QLDALLQPYV RIITQDAIDI RIKRFWRYLD RTLPDAFMHA NIGPADTPVT RAILRADAEL 
KQVTPNLTFI YDAEITPDDL LLEVAKNICE CSKPHISNGP VNDKIFTKGH YGIVSCYNSL 
PLGGGGSTLV RLNLKAVAER STSVDDFFSR TLPHYCRQQI AIINSRCEFL YEKSHFFENS 
FLVQEGLIDP ERFAPMFGMY GLAEAVNLLC ENAGLNARYG KNETANELGY RISAQLADFV 
ENTPVKYGWK QRALLHAQSG ISSDIGTTPG ARLPYGDEPD PITHLQTVAP HHAFYHAGIS 
DILTLDETIK RNPQALVQLC LGAFKAGMRE FTANVSGNDL VRVTGYMVRL SDLAKFRAEG 
SRTNTTWPGE EAARNTRILE RQPRVVSHEQ QMRFSQ