Gene SeHA_C4974 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4974
Symbol
ID	6488872
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	4850967
End bp	4852517
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	54%
IMG OID	642745017
Product	hypothetical protein
Protein accession	YP_002048586
Protein GI	194448333
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.164186
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	91
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGCCT CATGCGAAAC TGCGCTCCAG CAGCGTTGCC AGCAAATTGT GACCAGCCCG 
GTGCTCACGC CTGAACAAAA ACGCCATTTT CTGGCGCTGG AAGCTGAAAA CGCCCTGCCT 
TATCCCACCC TGCCGGAAGA TGCCCGCCAG GCGCTGGATG AAGGCGTCAT TTGCGATATG 
TTTGAGGGGC ACGCCCCCTT CAAACCGCGC TACGTGTTGC CCGATTACGC CCGATTTCTG 
GCTAACGGTT CACAGTGGCT GGAACTGGAA GGCGCGAAAG ATCTGGATGA TGCGTTATCC 
CTACTCACCA TTCTGTATCA TCACGTTCCT TCCGTGACGT CCATGCCGGT TTATCTCGGC 
CAGCTTGATG CGTTGCTGCA ACCGTATGTT AGAATTCTAA CACAAGATGC GATCGATATT 
CGAATAAAAC GTTTCTGGCG TTATCTCGAC AGAACGCTGC CAGACGCCTT TATGCATGCC 
AATATTGGCC CTGCCGATAC GCCTGTCACA CGAGCGATTT TGCGCGCCGA TGCCGAGCTA 
AAGCAGGTGG CGCCTAACCT GACGTTTATC TACGATGCGG AAATTACGCC GGACGATCTG 
CTGCTGGAGG TCGCCAAAAA CATTTGCGAA TGCAGTAAGC CACACATTTC CAACGGCCCT 
GTAAATGATA AAATTTTCAC AAAAGGCCAT TATGGCATCG TCAGTTGTTA TAACTCGCTA 
CCGCTTGGCG GCGGCGGCAG TACGCTGGTA CGTCTCAACC TGAAAGCCGT GGCAGAACGC 
AGTACGTCTG TCGATGACTT CTTTTCACGC ACGCTACCGC ACTACTGCCG ACAGCAGATC 
GCCATCATTA ATTCACGATG TGAATTCCTC TATGAGAAGT CACATTTCTT TGAGAATAGC 
TTTCTTGTAC AGGAAGGTTT GATCGATCCC GAACGTTTTG CGCCGATGTT CGGTATGTAC 
GGGCTGGCGG AAGCCGTGAA CCTGCTGTGC GAAAACGCGG GCCTGACCGC CCGTTACGGC 
AAGAATGATA CGGCGAACGA GCTGGGCTAC CGTATCAGCG CCCAACTGAC GGATTTCGTC 
GAAAATACGC CAGTGAAGTA TGGCTGGAAG CAACGGGCGC TGCTCCATGC CCAGTCTGGC 
ATCAGTTCCG ATATTGGCAC TACGCCGGGC GCGCGTCTGC CGTATGGCGA TGAACCGGAC 
CCTATCACCC ATTTGCAAAC CGTCGCGCCG CACCATGCCT TTTATCATGC CGGGATCAGC 
GACATTCTGA CGCTGGACGA AACCATCAAG CGTAATCCGC AGGCGCTGGT TCAGCTTTGT 
CTTGGCGCGT TCAAAGCCGG GATGCGGGAA TTTACTGCCA ATGTCAGCGG CAACGATCTG 
GTGCGCGTCA CCGGTTATAT GGTGCGCCTG TCGGATCTGG CGAAATTTCG CGCCGAAGGC 
TCGCGCACGA ATACCACCTG GCTGGGAGAA GAAGCCGCAC GTAATACCCG CATCCTGGAA 
CGACAGCCAC GCGTAGTCAG CCATGAACAA CAGATGCGCT TTAGTCAGTA A

Protein sequence

MPASCETALQ QRCQQIVTSP VLTPEQKRHF LALEAENALP YPTLPEDARQ ALDEGVICDM 
FEGHAPFKPR YVLPDYARFL ANGSQWLELE GAKDLDDALS LLTILYHHVP SVTSMPVYLG 
QLDALLQPYV RILTQDAIDI RIKRFWRYLD RTLPDAFMHA NIGPADTPVT RAILRADAEL 
KQVAPNLTFI YDAEITPDDL LLEVAKNICE CSKPHISNGP VNDKIFTKGH YGIVSCYNSL 
PLGGGGSTLV RLNLKAVAER STSVDDFFSR TLPHYCRQQI AIINSRCEFL YEKSHFFENS 
FLVQEGLIDP ERFAPMFGMY GLAEAVNLLC ENAGLTARYG KNDTANELGY RISAQLTDFV 
ENTPVKYGWK QRALLHAQSG ISSDIGTTPG ARLPYGDEPD PITHLQTVAP HHAFYHAGIS 
DILTLDETIK RNPQALVQLC LGAFKAGMRE FTANVSGNDL VRVTGYMVRL SDLAKFRAEG 
SRTNTTWLGE EAARNTRILE RQPRVVSHEQ QMRFSQ