Gene SeHA_C3637 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3637
Symbol	nanA
ID	6488024
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3523433
End bp	3524326
Gene Length	894 bp
Protein Length	297 aa
Translation table	11
GC content	54%
IMG OID	642743755
Product	N-acetylneuraminate lyase
Protein accession	YP_002047367
Protein GI	194448719
COG category	[E] Amino acid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0329] Dihydrodipicolinate synthase/N-acetylneuraminate lyase
TIGRFAM ID	[TIGR00683] N-acetylneuraminate lyase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.905763
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	82
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAAG CATTGCAAGG CGTAATGGCG GCGTTGTTGA CCCCATTTGA TCATCAGCAG 
CAACTGGATA GCGAAAGCCT GCGCCGTCTG GTGCGTTTTA ACATCGGGCA GGGTATCGAC 
GGGCTGTACG TTGGCGGTTC CACCGGGGAA GCATTTGTAC AGAGCCTTGC TGAAAGAGAG 
CAGGTACTGG AGATTGTCGC CGAAGAGGCG AAGGGAAAAA TCACGTTGAT CGCCCATGTC 
GGGACAGTAA GCACCGCAGA AAGCCAGCAG CTTGCCAGCG CCGCAAAGCG TTACGGTTTT 
GATGCGGTCT CTGCGGTGAC GCCTTTTTAT TACCCTTTCA GTTTTGAAGA GCACTGTGAC 
CATTATCGGG CAATCATTGA TTCCGCAGAT GGATTGCCGA TGGTGGTATA CAACATTCCG 
GCGTTAAGCG GCGTAAAACT TACCCTCGAT CAGATCAATA CGCTGGTGAC ATTACCGGGC 
GTGAGCGCGC TGAAGCAAAC CTCCGGCGAT CTCTTCCAGA TGGAGCAGAT CCGCCGCGCG 
CATCCGGATC TGGTGCTGTA CAACGGTTAT GACGAAATCT TCGCTTCCGG TCTGCTGGCG 
GGCGCGGACG GCGGTATCGG CAGCACATAC AACATTATGG GCTGGCGTTA TCAGGGAATT 
GTTCAGGCAT TGCGTGAGGG CGATGTGGCG AAAGCGCAGC GTCTGCAAAC CGAGTGCAAT 
AAGGTTATTG ATTTACTGAT TAAAACCGGC GTATTCCGCG GCCTGAAAAC GGTCCTGCAT 
TATATGGACG TGCTATCGGT GCCGCTGTGT CGTAAACCGT TTGCGCCTGT TGATGAAAAA 
TACCTGCCGG CGCTCAAGGC GCTGGCTCAA CAACTGATGG AAGAAAAGGC GTAA

Protein sequence

MAKALQGVMA ALLTPFDHQQ QLDSESLRRL VRFNIGQGID GLYVGGSTGE AFVQSLAERE 
QVLEIVAEEA KGKITLIAHV GTVSTAESQQ LASAAKRYGF DAVSAVTPFY YPFSFEEHCD 
HYRAIIDSAD GLPMVVYNIP ALSGVKLTLD QINTLVTLPG VSALKQTSGD LFQMEQIRRA 
HPDLVLYNGY DEIFASGLLA GADGGIGSTY NIMGWRYQGI VQALREGDVA KAQRLQTECN 
KVIDLLIKTG VFRGLKTVLH YMDVLSVPLC RKPFAPVDEK YLPALKALAQ QLMEEKA