Gene EcE24377A_3707 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_3707
Symbol	nanA
ID	5588958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	3702813
End bp	3703706
Gene Length	894 bp
Protein Length	297 aa
Translation table	11
GC content	52%
IMG OID	640927330
Product	N-acetylneuraminate lyase
Protein accession	YP_001464697
Protein GI	157158110
COG category	[E] Amino acid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0329] Dihydrodipicolinate synthase/N-acetylneuraminate lyase
TIGRFAM ID	[TIGR00683] N-acetylneuraminate lyase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0487465
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACGA ATTTACGTGG CGTAATGGCT GCACTCCTGA CTCCTTTTGA CCAACAACAA 
GCACTGGATA AAGCGAGTCT GCGTCGCCTG GTTCAGTTCA ATATTCAGCA GGGCATCGAC 
GGTTTATACG TGGGTGGTTC GACCGGCGAG GCCTTTGTAC AAAGCCTTTC CGAGCGTGAA 
CAGGTACTGG AAATCGTCGC CGAAGAGGCG AAAGGTAAGA TTAAACTCAT CGCCCACGTC 
GGTTGCGTCA GCACCGCCGA AAGCCAACAA CTTGCGGCAT CGGCTAAACG TTATGGCTTC 
GATGCCGTCT CCGCCGTCAC GCCGTTCTAC TATCCTTTCA GCTTTGAAGA ACACTGCGAT 
CACTATCGGG CAATTATTGA TTCGGCGGAT GGTTTGCCGA TGGTGGTGTA CAACATTCCA 
GCCCTGAGTG GGGTAAAACT GACCCTGGAT CAGATCAACA CACTTGTTAC ATTGCCTGGC 
GTAGGTGCGC TGAAACAGAC CTCTGGCGAT CTCTATCAGA TGGAGCAGAT CCGTCGTGAA 
CATCCTGATC TTGTGCTCTA TAACGGTTAC GACGAAATCT TCGCCTCTGG TCTGCTGGCG 
GGCGCTGATG GTGGTATCGG TAGTACCTAC AACATCATGG GCTGGCGCTA TCAGGGGATC 
GTTAAGGCGC TGAAAGAAGG CGATATCCAG ACCGCGCAGA AACTGCAAAC TGAATGCAAT 
AAAGTCATTG ATTTACTGAT CAAAACGGGC GTATTCCGCG GCCTGAAAAC TGTCCTCCAT 
TATATGGATG TCGTTTCTGT GCCGCTGTGC CGCAAACCGT TTGGACCGGT AGATGAAAAA 
TATCTGCCAG AACTGAAGGC GCTGGCCCAG CAGTTGATGC AAGAGCGCGG GTGA

Protein sequence

MATNLRGVMA ALLTPFDQQQ ALDKASLRRL VQFNIQQGID GLYVGGSTGE AFVQSLSERE 
QVLEIVAEEA KGKIKLIAHV GCVSTAESQQ LAASAKRYGF DAVSAVTPFY YPFSFEEHCD 
HYRAIIDSAD GLPMVVYNIP ALSGVKLTLD QINTLVTLPG VGALKQTSGD LYQMEQIRRE 
HPDLVLYNGY DEIFASGLLA GADGGIGSTY NIMGWRYQGI VKALKEGDIQ TAQKLQTECN 
KVIDLLIKTG VFRGLKTVLH YMDVVSVPLC RKPFGPVDEK YLPELKALAQ QLMQERG