Gene EcolC_1264 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1264
Symbol
ID	6064830
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1381855
End bp	1382826
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	50%
IMG OID	641600679
Product	cysteine synthase A
Protein accession	YP_001724257
Protein GI	170019303
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID	[TIGR01136] cysteine synthases [TIGR01139] cysteine synthase A

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000422758
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000025009
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAGTAAGA TTTTTGAAGA TAACTCGCTG ACTATCGGTC ACACGCCGCT GGTTCGCCTG 
AATCGCATCG GTAACGGACG CATTCTGGCG AAGGTGGAAT CTCGTAACCC CAGCTTCAGC 
GTTAAGTGCC GTATCGGTGC CAACATGATT TGGGATGCCG AAAAGCGCGG CGTGCTGAAA 
CCAGGCGTTG AACTGGTTGA ACCGACCAGC GGTAATACCG GGATTGCACT GGCCTATGTA 
GCTGCCGCTC GCGGTTACAA ACTCACCCTG ACCATGCCAG AAACCATGAG TATTGAACGC 
CGCAAGCTGC TGAAAGCGTT AGGTGCAAAC CTGGTGCTGA CGGAAGGTGC TAAAGGCATG 
AAAGGCGCAA TCCAAAAAGC AGAAGAAATT GTCGCCAGCA ATCCAGAGAA ATACCTGCTG 
CTGCAACAAT TCAGCAATCC GGCAAACCCT GAAATTCACG AAAAGACCAC CGGTCCGGAG 
ATATGGGAAG ATACCGACGG TCAGGTTGAT GTATTTATTG CTGGCGTTGG GACTGGCGGT 
ACGCTGACTG GCGTCAGCCG CTACATTAAA GGCACCAAAG GCAAGACCGA TCTTATCTCT 
GTCGCCGTTG AGCCAACCGA TTCTCCAGTT ATCGCCCAGG CGCTGGCAGG TGAAGAGATT 
AAACCTGGCC CGCATAAAAT TCAGGGTATT GGCGCTGGTT TTATCCCGGC TAACCTCGAT 
CTCAAGCTGG TCGATAAAGT CATTGGCATC ACCAATGAAG AAGCGATTTC TACCGCGCGT 
CGTCTGATGG AAGAAGAAGG TATTCTTGCA GGTATCTCTT CTGGAGCAGC TGTTGCCGCG 
GCGTTGAAAC TACAAGAAGA TGAAAGCTTT ACCAACAAGA ATATTGTGGT TATTCTACCA 
TCATCGGGTG AGCGTTATTT AAGCACCGCA TTGTTTGCCG ATCTCTTCAC TGAGAAAGAA 
TTGCAACAGT AA

Protein sequence

MSKIFEDNSL TIGHTPLVRL NRIGNGRILA KVESRNPSFS VKCRIGANMI WDAEKRGVLK 
PGVELVEPTS GNTGIALAYV AAARGYKLTL TMPETMSIER RKLLKALGAN LVLTEGAKGM 
KGAIQKAEEI VASNPEKYLL LQQFSNPANP EIHEKTTGPE IWEDTDGQVD VFIAGVGTGG 
TLTGVSRYIK GTKGKTDLIS VAVEPTDSPV IAQALAGEEI KPGPHKIQGI GAGFIPANLD 
LKLVDKVIGI TNEEAISTAR RLMEEEGILA GISSGAAVAA ALKLQEDESF TNKNIVVILP 
SSGERYLSTA LFADLFTEKE LQQ