Gene EcHS_A3131 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3131
Symbol	gspK
ID	5593643
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3141222
End bp	3142199
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	56%
IMG OID	640922250
Product	general secretion pathway protein K
Protein accession	YP_001459749
Protein GI	157162431
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3156] Type II secretory pathway, component PulK
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	88
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCACCT CACCACCAAA ACGCGGAATG GCACTGGTCG TGGTGCTGGT ATTGCTGGCA 
GTTATGATGC TGGTAACCAT CACGCTTTCC GGGCGGATGC AGCAGCAACT TGGGCGAACG 
CGCAGCCAGC AGGAGTACCA GCAGGCGCTG TGGTACAGCG CCAGTGCAGA AAGCCTGGCG 
CTGAGCGCGC TCAGTCTGAG CCTGAAAAAT GAAAAGCGCG TGCATCTGGA ACAGCCGTGG 
GCTTCCGGCC CTCGTTTTTT CCCACTGCCG CAGGGGCAAA TCGCCGTCAC TCTGCGTGAC 
GCACAGGCCT GCTTTAACCT GAATGCCCTC GCTCAGCCCA CAACGGCGTC GCGTCCGCTC 
GCGGTACAAC AACTGATTGC CCTGATCACG CGCCTGGATG TGCCTGCTTA TCGGGCCGAA 
CTGATAGCCG AAAGCCTGTG GGAGTTTATT GATGAAGACC GCAGCGTGCA GACGCGTCTG 
GGCCGTGAAG ACAGCGAATA TCTCGCCCGC TCGGTGCCTT TCTACGCCGC CAATCAACCG 
CTGGCCGATA TCAGCGAGAT GCGCGTGGTG CAGGGAATGG ACGCCGGGCT TTATCAAAAA 
CTGAAACCGC TGGTCTGTGC GCTGCCGATG ACCCGCCAGC AAATCAACAT CAATACTTTA 
GACGTCACGC AAAGTGTGAT TCTTGAGGCG CTGTTTGACC CGTGGTTAAG CCCTGTTCAG 
GCGCGGGCGT TATTACAACA ACGTCCGGCG AAGGGCTGGG AAGATGTCGA TCAGTTTCTT 
GCACAGCCGC TACTTGCTGA CGTCGATGAG CGTACTAAAA AACAGCTAAA AACCGTCCTG 
AGCGTGGACA GCAATTACTT CTGGCTGCGT TCAGATATCA CCGTGAATGA GATTGAACTG 
ACGATGAACT CGTTAATTGT CCGCATGGGC CCACAACACT TTTCGGTTCT CTGGCATCAG 
ACAGGAGAAA GTGAGTGA

Protein sequence

MITSPPKRGM ALVVVLVLLA VMMLVTITLS GRMQQQLGRT RSQQEYQQAL WYSASAESLA 
LSALSLSLKN EKRVHLEQPW ASGPRFFPLP QGQIAVTLRD AQACFNLNAL AQPTTASRPL 
AVQQLIALIT RLDVPAYRAE LIAESLWEFI DEDRSVQTRL GREDSEYLAR SVPFYAANQP 
LADISEMRVV QGMDAGLYQK LKPLVCALPM TRQQININTL DVTQSVILEA LFDPWLSPVQ 
ARALLQQRPA KGWEDVDQFL AQPLLADVDE RTKKQLKTVL SVDSNYFWLR SDITVNEIEL 
TMNSLIVRMG PQHFSVLWHQ TGESE