Gene ECH74115_4623 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4623
Symbol	secY
ID	6971391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4280858
End bp	4282189
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	50%
IMG OID	643388328
Product	preprotein translocase subunit SecY
Protein accession	YP_002272756
Protein GI	209400982
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0201] Preprotein translocase subunit SecY
TIGRFAM ID	[TIGR00967] preprotein translocase, SecY subunit

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000434636
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTAAAC AACCGGGATT AGATTTTCAA AGTGCCAAAG GTGGCTTAGG CGAGCTGAAA 
CGCAGACTGC TGTTTGTTAT CGGTGCGCTG ATTGTGTTCC GTATTGGCTC TTTTATTCCG 
ATCCCTGGTA TTGATGCCGC TGTACTTGCC AAACTGCTTG AGCAACAGCG AGGCACCATC 
ATTGAGATGT TTAACATGTT CTCTGGTGGT GCTCTCAGCC GTGCTTCTAT CTTTGCTCTG 
GGGATCATGC CGTATATTTC GGCGTCGATC ATTATCCAGC TGCTGACGGT GGTTCACCCA 
ACGTTGGCAG AAATTAAGAA AGAAGGGGAG TCTGGTCGTC GTAAGATCAG CCAGTACACC 
CGTTACGGTA CTCTGGTGCT GGCAATATTC CAGTCGATCG GTATTGCTAC CGGTCTGCCG 
AATATGCCTG GTATGCAAGG CCTGGTGATT AACCCGGGCT TTGCATTCTA CTTCACCGCT 
GTTGTAAGTC TGGTCACAGG AACGATGTTC CTGATGTGGT TGGGCGAACA GATCACTGAA 
CGAGGTATCG GCAACGGTAT TTCAATCATT ATCTTCGCCG GTATTGTCGC GGGACTCCCG 
CCAGCCATTG CCCATACTAT CGAGCAAGCG CGTCAAGGCG ACCTGCACTT CCTCGTGTTG 
CTGTTGGTTG CAGTATTAGT ATTTGCAGTG ACGTTCTTTG TTGTATTTGT TGAGCGTGGT 
CAACGCCGCA TTGTGGTAAA CTACGCGAAA CGTCAGCAAG GTCGTCGTGT CTATGCTGCA 
CAGAGCACAC ATTTACCGCT GAAAGTGAAT ATGGCGGGGG TAATCCCGGC AATCTTCGCT 
TCCAGTATTA TTCTGTTCCC GGCGACCATC GCGTCATGGT TCGGGGGCGG TACTGGTTGG 
AACTGGCTGA CAACAATTTC GCTGTATTTG CAGCCTGGGC AACCGCTTTA TGTGTTACTC 
TATGCGTCTG CAATCATCTT CTTCTGTTTC TTCTACACGG CGTTGGTTTT CAACCCGCGT 
GAAACAGCAG ATAACCTGAA GAAGTCCGGT GCATTTGTAC CAGGAATTCG TCCGGGAGAG 
CAAACGGCGA AGTATATCGA TAAAGTAATG ACCCGCCTGA CCCTGGTTGG TGCGCTGTAT 
ATTACCTTTA TCTGCCTGAT CCCGGAGTTC ATGCGTGATG CAATGAAAGT ACCGTTCTAC 
TTCGGTGGGA CCTCACTGCT TATCGTTGTT GTCGTGATTA TGGACTTTAT GGCTCAAGTG 
CAAACTCTGA TGATGTCCAG TCAGTATGAG TCTGCATTGA AGAAGGCGAA CCTGAAAGGC 
TACGGCCGAT AA

Protein sequence

MAKQPGLDFQ SAKGGLGELK RRLLFVIGAL IVFRIGSFIP IPGIDAAVLA KLLEQQRGTI 
IEMFNMFSGG ALSRASIFAL GIMPYISASI IIQLLTVVHP TLAEIKKEGE SGRRKISQYT 
RYGTLVLAIF QSIGIATGLP NMPGMQGLVI NPGFAFYFTA VVSLVTGTMF LMWLGEQITE 
RGIGNGISII IFAGIVAGLP PAIAHTIEQA RQGDLHFLVL LLVAVLVFAV TFFVVFVERG 
QRRIVVNYAK RQQGRRVYAA QSTHLPLKVN MAGVIPAIFA SSIILFPATI ASWFGGGTGW 
NWLTTISLYL QPGQPLYVLL YASAIIFFCF FYTALVFNPR ETADNLKKSG AFVPGIRPGE 
QTAKYIDKVM TRLTLVGALY ITFICLIPEF MRDAMKVPFY FGGTSLLIVV VVIMDFMAQV 
QTLMMSSQYE SALKKANLKG YGR