Gene SeSA_A3120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A3120
Symbol
ID	6517688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	3016175
End bp	3017515
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	57%
IMG OID	642748136
Product	glucarate dehydratase
Protein accession	YP_002115913
Protein GI	194737255
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID	[TIGR03247] glucarate dehydratase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.796929
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACGC AATCCAGTCC CGTGATTACG GACATGAAGG TCATTCCGGT TGCCGGACAT 
GACAGTATGC TACTCAACAT CGGCGGCGCG CATAACGCGT ACTTCACCCG TAACATCGTC 
GTCCTCACCG ATAACGCCGG GCATACTGGC GTCGGCGAGG CGCCGGGCGG AGAAGTGATT 
TATCAGACGC TGGTCGATGC TATTCCGATG GTATTAGGCC AGGAAGTCGC CCGCCTGAAC 
AAAGTGGTGC AGCAGGTGCA TAAAGGCAAC CAGGCCGCTG ATTTTGACAC CTTTGGTAAA 
GGCGCATGGA CGTTTGAACT GCGGGTTAAC GCGGTGGCGG CTTTGGAAGC GGCGCTGCTT 
GATCTACTGG GACAGGCGCT TAATGTGCCG GTCTGTGAAC TGTTAGGACC CGGTAAACAG 
CGCGATGCCG TCACCGTGTT AGGCTATCTC TTCTATATTG GCGATCGTAC TAAAACCGAT 
CTGCCGTATC TGGAAAGCAC GCCGGGCAGT CATGAATGGT ACCGTCTGCG CCATCAGGAA 
GCGCTGAACA GCGACGCGGT CGTGCGGCTG GCGGAAGCGT CTCAGGATCG CTACGGTTTT 
AAAGATTTTA AACTCAAGGG CGGCGTGCTG CCGGGCGAAC AAGAGATTGA TACCGTTCGC 
GCGCTAAAAA AACGCTTCCC GGACGCGCGT ATTACCGTGG ATCCGAACGG CGCCTGGCTA 
CTGGATGAAG CCATTGCGTT GTGCAAAGGG CTGAATGATG TACTGACCTA CGCGGAAGAT 
CCGTGCGGCG CGGAGCAAGG ATTCTCTGGT CGTGAAGTCA TGGCGGAGTT CCGCCGTGCT 
ACAGGACTGC CGGTGGCGAC CAATATGATT GCCACCAACT GGCGTGAAAT GGGACACGCG 
GCGATGCTCA ATGCGGTAGA CATCCCTCTT GCCGACCCGC ATTTCTGGAC TCTCACCGGC 
GCCGTTCGCG TGGCGCAACT GTGCGATGAC TGGGGGCTAA CCTGGGGCTG CCATTCGAAT 
AACCATTTTG ATATTTCACT GGCGATGTTT ACCCATGTCG GCGCGGCGGC GCCAGGCAAA 
CCCACCGCTA TTGATACGCA CTGGATCTGG CAGGAGGGCG ATTGCCGCCT GACTAAAAAT 
CCGCTGGAAA TTAAAAACGG CAAAATTGCC GTTCCGGATG CGCCAGGACT GGGCGTGGAG 
CTTGACTGGG AACAGGTGCG AAAAGCGCAT GACGCGTATA AAACGCTGCC AGGCGGCGCG 
CGTAATGATG CAGGCCCGAT GCAATACCTG ATCCCCGGCT GGACTTTTGA CCGCAAACGC 
CCTGTTTTTG GTCGTCACTA A

Protein sequence

MTTQSSPVIT DMKVIPVAGH DSMLLNIGGA HNAYFTRNIV VLTDNAGHTG VGEAPGGEVI 
YQTLVDAIPM VLGQEVARLN KVVQQVHKGN QAADFDTFGK GAWTFELRVN AVAALEAALL 
DLLGQALNVP VCELLGPGKQ RDAVTVLGYL FYIGDRTKTD LPYLESTPGS HEWYRLRHQE 
ALNSDAVVRL AEASQDRYGF KDFKLKGGVL PGEQEIDTVR ALKKRFPDAR ITVDPNGAWL 
LDEAIALCKG LNDVLTYAED PCGAEQGFSG REVMAEFRRA TGLPVATNMI ATNWREMGHA 
AMLNAVDIPL ADPHFWTLTG AVRVAQLCDD WGLTWGCHSN NHFDISLAMF THVGAAAPGK 
PTAIDTHWIW QEGDCRLTKN PLEIKNGKIA VPDAPGLGVE LDWEQVRKAH DAYKTLPGGA 
RNDAGPMQYL IPGWTFDRKR PVFGRH