Gene SeD_A3184 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3184
Symbol	eprH
ID	6873503
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	3060733
End bp	3061797
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	50%
IMG OID	642786204
Product	type III secretion apparatus protein PrgH/EprH
Protein accession	YP_002216845
Protein GI	198244606
COG category
COG ID
TIGRFAM ID	[TIGR02554] type III secretion system protein PrgH/EprH

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	0.736227
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTAGGTC AGAGTGATGC GCTCACTGCT TCAGGCCAAC TCCCTGATAT ACCTGCCGAT 
AGCTTTTTTA TCCCGCTGGA CCATGGCGGA GTAAATTTTG AAATCCAGGT GGATACGGAT 
ACGACCGAAA TTATACTCCA TGAGCTGAAA GAAGGAAATT CTGAATCTCG TTCGGTGCAA 
TTAAATACGC CAATACAGGT CGGTGAATTG CTTATCCTGA TTCGCCCGGA AAGCGAGCCG 
TGGGTGCCCG AGCAGCCTGA GAAGTTAGAA ACGTCTGCAA AAAAGAACGA GCCGCGTTTT 
AAAAACGGAA TTGTAGCCGC ACTGGCCGGG TTTTTTATAT TGGGAATTGG GACTGTGGGG 
ACGTTATGGA TACTTAACTC GCCGCAGCGG CAGGCCGCAG AGCTCGATTC GTTATTGGGG 
CAGGAGAAGG AGCGTTTTCA GGTGTTGCCA GGCCGGGACA AAATGCTCTA TGTCGCTGCG 
CAAAATGAAA GAGATACGCT GTGGGCTCGT CAGGTTTTAG CGAGGGGCGA TTATGATAAA 
AATGCGCGAG TGATTAACGA AAACGAAGAA AATAAGCGTA TCTCTATCTG GCTGGATACC 
TATTATCCGC AGCTGGCTTA TTATCGGATT CATTTCGATG AGCCGCGTAA ACCCGTTTTC 
TGGCTAAGCC GCCAGCGAAA CACGATGAGC AAGAAAGAGC TCGAGGTGTT AAGTCAAAAG 
CTGAGAGCGC TAATGCCTTA CGCGGATTCG GTTAACATCA CGTTGATGGA CGATGTTACC 
GCAGCAGGCC AGGCGGAAGC GGGGCTAAAA CAGCAGGCGT TACCTTATTC CCGCAGGAAT 
CATAAGGGGG GCGTAACGTT TGTTATTCAG GGGGCGCTCG ATGATGTAGA AATACTCAGA 
GCCCGTCAAT TTGTCGATAG CTATTACCGC ACATGGGGAG GACGCTATGT GCAGTTTGCG 
ATCGAATTAA AAGATGACTG GCTCAAGGGG CGCTCATTTC AGTACGGGGC GGAAGGTTAT 
ATCAAAATGA GCCCAGGCCA TTGGTATTTC CCAAGCCCAC TTTAA

Protein sequence

MVGQSDALTA SGQLPDIPAD SFFIPLDHGG VNFEIQVDTD TTEIILHELK EGNSESRSVQ 
LNTPIQVGEL LILIRPESEP WVPEQPEKLE TSAKKNEPRF KNGIVAALAG FFILGIGTVG 
TLWILNSPQR QAAELDSLLG QEKERFQVLP GRDKMLYVAA QNERDTLWAR QVLARGDYDK 
NARVINENEE NKRISIWLDT YYPQLAYYRI HFDEPRKPVF WLSRQRNTMS KKELEVLSQK 
LRALMPYADS VNITLMDDVT AAGQAEAGLK QQALPYSRRN HKGGVTFVIQ GALDDVEILR 
ARQFVDSYYR TWGGRYVQFA IELKDDWLKG RSFQYGAEGY IKMSPGHWYF PSPL