Gene SeHA_C3063 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3063
Symbol	eprH
ID	6491785
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	2990856
End bp	2991920
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	50%
IMG OID	642743218
Product	type III secretion apparatus protein PrgH/EprH
Protein accession	YP_002046837
Protein GI	194448137
COG category
COG ID
TIGRFAM ID	[TIGR02554] type III secretion system protein PrgH/EprH

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.69246
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	0.188447
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTAGGTC AGAGTGATGC GCTCACTGCT TCAGGTCAAC TCCCTGATAT ACCTGCCGAT 
AGCTTTTTTA TCCCGCTGGA CCATGGCGGA GTAAATTTTG AAATCCAGGT GGATACGGAT 
GCGACCGAAA TTATACTCCA TGAGCTGAAA GAAGGAAATT CTGAATCTCG TTCGGTGCAA 
TTAAATACGC CAATACAGGT CGGTGAATTG CTTATCCTGA TTCGCCCGGA AAGCGAGCCG 
TGGGTGCCCG AGCAGCCTGA GAAGTTAGAA ACGTCTGCAA AAAAGAACGA GCCGCGTTTT 
AAAAACGGAA TTGTAGCCGC ACTGGCCGGG TTTTTTATAT TGGGAATTGG GACTGTGGGG 
ACGTTATGGA TACTTAACTC GCCGCAGCGG CAGGCCGCAG AGCTCGATTC GTTATTGGGG 
CAGGAGAAGG AGCGTTTTCA GGTGTTGCCA GGACGGGACA AAATGCTCTA TGTCGCTGCG 
CAAAATGAAA GAGATACGCT GTGGGCTCGT CAGGTTTTAG CGAGGGGCGA TTATGATAAA 
AATGCGCGAG TGATTAACGA AAACGAAGAA AATAAGCGTA TCTCTACCTG GCTGGATACC 
TATTATCCGC AGCTTGCTTA TTATCGGCTT CATTTCGATG AGCCGCGTAA ACCCGTTTTC 
TGGCTAAGCC GCCAGCGAAA CACGATGAGC AAGAAAGAGC TCGAGGTGTT AAGTCAAAAG 
CTGAGAGCGC TAATGCCTTA CGCGGATTCG GTTAACATCA CGTTGATGGA CGATGTTACC 
GCAGCAGGCC AGGCGGAAGC GGGGCTAAAA CAGCAGGCGT TACCTTATTC CCGCAGGAAT 
CATAAGGGGG GCGTAACGTT TGTTATTCAG GGGGCGCTCG ATGATGTAGA AATACTCAGA 
GCCCGTCAAT TTGTCGATAG CTATTACCGC ACATGGGGAG GACGCTATGT GCAGTTTGCG 
ATCGAATTAA AAGATGACTG GCTCAAGGGG CGCTCATTTC AGTACGGGGC GGAAGGTTAT 
ATCAAAATGA GCCCAGGCCA TTGGTATTTC CCAAGCCCAC TTTAA

Protein sequence

MVGQSDALTA SGQLPDIPAD SFFIPLDHGG VNFEIQVDTD ATEIILHELK EGNSESRSVQ 
LNTPIQVGEL LILIRPESEP WVPEQPEKLE TSAKKNEPRF KNGIVAALAG FFILGIGTVG 
TLWILNSPQR QAAELDSLLG QEKERFQVLP GRDKMLYVAA QNERDTLWAR QVLARGDYDK 
NARVINENEE NKRISTWLDT YYPQLAYYRL HFDEPRKPVF WLSRQRNTMS KKELEVLSQK 
LRALMPYADS VNITLMDDVT AAGQAEAGLK QQALPYSRRN HKGGVTFVIQ GALDDVEILR 
ARQFVDSYYR TWGGRYVQFA IELKDDWLKG RSFQYGAEGY IKMSPGHWYF PSPL