Gene SNSL254_A3183 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3183
Symbol
ID	6483889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3096239
End bp	3097579
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	57%
IMG OID	642738488
Product	glucarate dehydratase
Protein accession	YP_002042212
Protein GI	194443156
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID	[TIGR03247] glucarate dehydratase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	0.558486
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACGC AATCTAGTCC CGTTATTACG GACATGAAGG TCATTCCGGT TGCCGGACAT 
GACAGTATGC TACTCAACAT CGGCGGCGCG CATAACGCGT ACTTCACCCG TAACATCGTC 
GTCCTCACCG ATAACGCCGG GCATACTGGC GTCGGCGAGG CGCCGGGCGG AGAAGTGATT 
TATCAGACGC TGGTCGATGC TATTCCGATG GTATTAGGCC AGGAAGTCGC CCGCCTGAAC 
AAAGTGGTGC AGCAGGTGCA TAAAGGCAAC CAGGCCGCTG ATTTTGACAC CTTTGGCAAA 
GGCGCATGGA CGTTTGAACT GCGGGTTAAC GCGGTGGCGG CTTTGGAAGC GGCGCTGCTT 
GATCTACTGG GACAGGCGCT TAATGTGCCG GTCTGTGAAC TGTTAGGGCC AGGTAAACAG 
CGCGATGCCG TCACCGTGTT GGGCTATCTC TTCTATATTG GCGATCGCAC TAAAACCGAT 
CTGCCGTATC TGGAAAGCAC GCCGGGCAGT CATGAATGGT ATCGTCTGCG CCATCAGGAA 
GCGCTGAACA GCGACGCGGT CGTGCGGCTG GCGGAAGCGT CTCAGGATCG CTACGGCTTT 
AAAGATTTTA AACTCAAGGG CGGCGTGCTA CCGGGCGAAC AAGAGATTGA TACCGTTCGC 
GCGCTAAAAA AACGCTTCCC GGACGCGCGT ATTACCGTGG ATCCGAACGG CGCCTGGCTA 
CTGGATGAAG CCATTGCGTT GTGCAAAGGG CTGAAAGATG TACTGACCTA CGCGGAAGAT 
CCGTGCGGCG CGGAGCAAGG ATTCTCTGGT CGTGAAGTCA TGGCGGAGTT CCGCCGCGCG 
ACAGGACTGC CGGTGGCGAC CAATATGATT GCCACCAACT GGCGCGAAAT GGGGCATGCA 
GTGATGCTCA ACGCGGTAGA TATTCCTCTT GCCGACCCGC ATTTCTGGAC TCTCACCGGC 
GCCGTTCGCG TGGCGCAACT GTGCGATGAC TGGGGGCTAA CCTGGGGCTG CCATTCGAAT 
AACCATTTTG ATATTTCACT GGCGATGTTT ACCCATGTCG GCGCGGCGGC GCCAGGCAAA 
CCCACCGCTA TTGATACGCA CTGGATCTGG CAGGAGGGCG ATTGCCGCCT GACTAAAAAT 
CCGCTGGAAA TTAAAAACGG CAAAATTGCC GTTCCGGATG CGCCAGGACT GGGCGTGGAG 
CTTGACTGGG AACAGGTGCG AAAAGCGCAT GACGCGTATA AAAAGCTGCC AGGCGGCGCG 
CGTAATGATG CAGGCCCGAT GCAATACCTG ATCCCCGGCT GGACTTTTGA CCGCAAACGC 
CCTGTTTTTG GTCGTCACTA A

Protein sequence

MTTQSSPVIT DMKVIPVAGH DSMLLNIGGA HNAYFTRNIV VLTDNAGHTG VGEAPGGEVI 
YQTLVDAIPM VLGQEVARLN KVVQQVHKGN QAADFDTFGK GAWTFELRVN AVAALEAALL 
DLLGQALNVP VCELLGPGKQ RDAVTVLGYL FYIGDRTKTD LPYLESTPGS HEWYRLRHQE 
ALNSDAVVRL AEASQDRYGF KDFKLKGGVL PGEQEIDTVR ALKKRFPDAR ITVDPNGAWL 
LDEAIALCKG LKDVLTYAED PCGAEQGFSG REVMAEFRRA TGLPVATNMI ATNWREMGHA 
VMLNAVDIPL ADPHFWTLTG AVRVAQLCDD WGLTWGCHSN NHFDISLAMF THVGAAAPGK 
PTAIDTHWIW QEGDCRLTKN PLEIKNGKIA VPDAPGLGVE LDWEQVRKAH DAYKKLPGGA 
RNDAGPMQYL IPGWTFDRKR PVFGRH