Gene SeD_A3699 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3699
Symbol	nanA
ID	6875705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	3548953
End bp	3549846
Gene Length	894 bp
Protein Length	297 aa
Translation table	11
GC content	54%
IMG OID	642786675
Product	N-acetylneuraminate lyase
Protein accession	YP_002217309
Protein GI	198242925
COG category	[E] Amino acid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0329] Dihydrodipicolinate synthase/N-acetylneuraminate lyase
TIGRFAM ID	[TIGR00683] N-acetylneuraminate lyase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	81
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAAG CATTGCAAGG CGTAATGGCG GCGTTGTTGA CCCCATTTGA TCATCAGCAG 
CAACTGGATA GCGAAAGCCT GCGCCGTCTG GTGCGTTTTA ACATTGGGCA GGGTATCGAC 
GGGCTGTACG TTGGCGGTTC CACCGGGGAA GCATTCGTAC AGAGCCTTGC TGAAAGAGAG 
CAGGTACTGG AGATTGTCGC CGAAGAGGCG AAGGGAAAAA TCACGTTGAT CGCCCATGTC 
GGGACAGTAA GCACCGCAGA AAGCCAGCAG CTTGCCAGCG CCGCAAAGCG TTACGGTTTT 
GATGCGGTCT CTGCGGTGAC GCCTTTTTAT TACCCTTTCA GTTTTGAAGA GCACTGTGAC 
CATTATCGGG CAATCATTGA TTCCGCAGAT GGATTGCCGA TGGTGGTATA CAACATTCCG 
GCGTTAAGCG GCGTAAAACT TACCCTCGAT CAGATCAATA CGCTGGTGAC ATTACCGGGC 
GTGAGCGCGC TGAAGCAAAC CTCCGGCGAT CTCTTCCAGA TGGAGCAGAT CCGCCGCGCG 
CATCCGGATC TGGTGCTGTA CAACGGTTAT GACGAAATCT TCGCTTCCGG TCTGCTGGCG 
GGCGCGGACG GCGGTATCGG CAGCACATAC AACATTATGG GCTGGCGTTA TCAGGGGATT 
GTTCAGGCAT TACGTGAGGG CGATGTGGCG AAAGCGCAGC GCCTGCAAAC CGAGTGCAAT 
AAGGTTATTG ATTTACTGAT TAAAACCGGC GTATTCCGCG GCCTGAAAAC GGTCCTGCAT 
TATATGGACG TGCTATCGGT GCCGCTGTGT CGTAAACCGT TTGCGCCTGT TGATGAAAAA 
TACCTGCCGG CGCTCAAGGC GCTGGCTCAA CAACTGATGG AAGAAAAGGC GTAA

Protein sequence

MAKALQGVMA ALLTPFDHQQ QLDSESLRRL VRFNIGQGID GLYVGGSTGE AFVQSLAERE 
QVLEIVAEEA KGKITLIAHV GTVSTAESQQ LASAAKRYGF DAVSAVTPFY YPFSFEEHCD 
HYRAIIDSAD GLPMVVYNIP ALSGVKLTLD QINTLVTLPG VSALKQTSGD LFQMEQIRRA 
HPDLVLYNGY DEIFASGLLA GADGGIGSTY NIMGWRYQGI VQALREGDVA KAQRLQTECN 
KVIDLLIKTG VFRGLKTVLH YMDVLSVPLC RKPFAPVDEK YLPALKALAQ QLMEEKA