Gene EcHS_A2549 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2549
Symbol	cysK
ID	5593818
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	2559973
End bp	2560944
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	50%
IMG OID	640921670
Product	cysteine synthase A
Protein accession	YP_001459197
Protein GI	157161879
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID	[TIGR01136] cysteine synthases [TIGR01139] cysteine synthase A

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00000000000853816
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAGA TTTTTGAAGA TAACTCGCTG ACTATCGGTC ACACGCCGCT GGTTCGCCTG 
AATCGCATCG GTAACGGACG CATTCTGGCG AAGGTGGAAT CTCGTAACCC CAGCTTCAGC 
GTTAAGTGCC GTATCGGTGC CAACATGATT TGGGATGCCG AAAAGCGCGG CGTGCTGAAA 
CCAGGCGTTG AACTGGTTGA ACCGACCAGC GGTAATACCG GGATTGCACT GGCCTATGTA 
GCTGCCGCTC GCGGTTACAA ACTCACCCTG ACCATGCCAG AAACCATGAG TATTGAACGC 
CGCAAGCTGC TGAAAGCGTT AGGTGCAAAC CTGGTGCTGA CGGAAGGTGC TAAAGGCATG 
AAAGGCGCAA TCCAAAAAGC AGAAGAAATT GTCGCCAGCA ATCCAGAGAA ATACCTGCTG 
CTGCAACAAT TCAGCAATCC GGCAAACCCT GAAATTCACG AAAAAACCAC CGGTCCGGAG 
ATCTGGGAAG ATACCGACGG TCAGGTTGAT GTATTTATTG CTGGCGTTGG GACTGGCGGT 
ACGCTGACTG GCGTCAGCCG CTACATTAAA GGCACCAAAG GCAAGACCGA TCTTATATCT 
GTCGCCGTTG AGCCAACCGA TTCTCCAGTT ATCGCCCAGG CGCTGGCAGG TGAAGAGATT 
AAACCTGGCC CGCATAAAAT TCAGGGTATT GGCGCTGGTT TTATCCCGGC TAACCTCGAT 
CTCAAGCTGG TCGATAAAGT CATTGGCATC ACCAATGAAG AAGCCATTTC TACCGCCCGT 
CGTCTAATGG AAGAAGAAGG TATTCTTGCA GGTATCTCTT CTGGAGCAGC TGTTGCCGCG 
GCGTTGAAAC TACAAGAAGA TGAAAGCTTT ACCAACAAGA ATATTGTGGT TATTCTACCA 
TCATCGGGTG AGCGTTATTT AAGCACCGCA TTGTTTGCCG ATCTCTTCAC TGAGAAAGAA 
TTGCAACAGT AA

Protein sequence

MSKIFEDNSL TIGHTPLVRL NRIGNGRILA KVESRNPSFS VKCRIGANMI WDAEKRGVLK 
PGVELVEPTS GNTGIALAYV AAARGYKLTL TMPETMSIER RKLLKALGAN LVLTEGAKGM 
KGAIQKAEEI VASNPEKYLL LQQFSNPANP EIHEKTTGPE IWEDTDGQVD VFIAGVGTGG 
TLTGVSRYIK GTKGKTDLIS VAVEPTDSPV IAQALAGEEI KPGPHKIQGI GAGFIPANLD 
LKLVDKVIGI TNEEAISTAR RLMEEEGILA GISSGAAVAA ALKLQEDESF TNKNIVVILP 
SSGERYLSTA LFADLFTEKE LQQ