Gene EcSMS35_2569 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2569
Symbol	cysK
ID	6143429
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	2623399
End bp	2624370
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	50%
IMG OID	641617440
Product	cysteine synthase A
Protein accession	YP_001744605
Protein GI	170683441
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID	[TIGR01136] cysteine synthases [TIGR01139] cysteine synthase A

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00204709
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAAGA TTTTTGAAGA TAACTCGCTG ACTATCGGTC ACACACCGCT GGTTCGCCTG 
AATCGCATCG GTAACGGACG CATTCTGGCG AAGGTGGAAT CTCGTAACCC CAGCTTCAGC 
GTTAAGTGCC GTATCGGTGC CAACATGATT TGGGATGCCG AAAAGCGCGG CGTGCTGAAA 
CCAGGCGTTG AACTGGTTGA ACCAACCAGC GGTAATACCG GGATTGCACT GGCCTATGTC 
GCTGCCGCTC GCGGTTACAA ACTTACCCTG ACCATGCCAG AAACCATGAG TATTGAACGC 
CGCAAGCTGC TGAAAGCGTT AGGTGCAAAC CTGGTGCTGA CCGAAGGTGC TAAAGGCATG 
AAAGGCGCAA TCCAAAAAGC AGAAGAAATT GTCGCCAGCA ATCCAGAGAA ATACCTGCTG 
CTGCAACAAT TCAGCAATCC GGCAAACCCT GAAATTCACG AAAAAACCAC CGGTCCGGAG 
ATCTGGGAAG ATACCGACGG TCAGGTTGAT GTATTTATTG CTGGCGTTGG GACTGGCGGT 
ACGCTGACTG GCGTCAGCCG CTACATTAAA GGCACCAAAG GCAAGACCGA TCTTATCTCT 
GTCGCCGTTG AGCCAACCGA TTCTCCAGTT ATCGCCCAGG CGCTGGCAGG TGAAGAGATT 
AAACCTGGCC CGCATAAAAT TCAGGGTATT GGCGCTGGTT TTATCCCGGC TAACCTCGAT 
CTCAAGCTGG TCGACAAAGT CATTGGCATC ACCAATGAAG AAGCCATTTC TACCGCACGT 
CGTCTGATGG AAGAAGAAGG TATTCTTGCT GGTATCTCTT CTGGAGCAGC TGTTGCCGCG 
GCGTTGAAAC TACAAGAAGA TGAAAGCTTT ACCAACAAGA ATATTGTGGT TATTCTACCA 
TCATCGGGTG AGCGTTATTT AAGCACCGCA TTGTTTGCCG ATCTCTTCAC TGAGAAAGAA 
CTGCAACAGT AA

Protein sequence

MSKIFEDNSL TIGHTPLVRL NRIGNGRILA KVESRNPSFS VKCRIGANMI WDAEKRGVLK 
PGVELVEPTS GNTGIALAYV AAARGYKLTL TMPETMSIER RKLLKALGAN LVLTEGAKGM 
KGAIQKAEEI VASNPEKYLL LQQFSNPANP EIHEKTTGPE IWEDTDGQVD VFIAGVGTGG 
TLTGVSRYIK GTKGKTDLIS VAVEPTDSPV IAQALAGEEI KPGPHKIQGI GAGFIPANLD 
LKLVDKVIGI TNEEAISTAR RLMEEEGILA GISSGAAVAA ALKLQEDESF TNKNIVVILP 
SSGERYLSTA LFADLFTEKE LQQ