Gene SeAg_B3102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B3102
Symbol
ID	6792958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	-
Start bp	3029328
End bp	3030668
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	57%
IMG OID	642777262
Product	glucarate dehydratase
Protein accession	YP_002147871
Protein GI	197251459
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID	[TIGR03247] glucarate dehydratase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACGC AATCCAGTCC CGTTATTACG GACATGAAGG TCATTCCGGT TGCCGGACAT 
GACAGTATGC TACTCAACAT CGGCGGCGCG CATAACGCGT ACTTCACCCG TAACATCGTC 
GTCCTCACCG ATAACGCCGG GCATACTGGC GTCGGCGAGG CGCCGGGCGG AGAAGTGATT 
TATCAGACGC TGGTCGATGC TATTCCGATG GTATTAGGCC AGGAAGTCGC CCGCCTGAAC 
AAAGTGGTGC AGCAGGTGCA TAAAGGCAAC CAGGCCGCTG ATTTTGACAC CTTTGGTAAA 
GGCGCATGGA CGTTTGAACT GCGGGTTAAC GCGGTGGCGG CTTTGGAAGC GGCGCTGCTT 
GATCTACTGG GACAGGCGCT TAATGTGCCG GTCTGTGAAC TGTTAGGGCC CGGTAAACAG 
CGCGATGCCG TCACCGTGCT GGGCTATCTC TTCTATATTG GCGATCGCAC TAAAACCGAT 
CTGCCGTATC TGGAAAGCAC GCCGGGCAGT CATGAATGGT ATCACCTGCG CCATCAGGAA 
GCGCTGAACA GCGACGCGGT CGTGCGGCTG GCGGAAGCGT CTCAGGATCG CTACGGCTTT 
AAAGATTTTA AACTCAAGGG CGGCGTGCTG CCGGGCGAAC AAGAGATTGA TACCGTTCGC 
GCGCTAAAAA AACGCTTCCC GGACGCGCGT ATTACCGTGG ATCCGAACGG CGCCTGGCTA 
CTGGATGAAG CCATTGCGTT GTGCAAAGGG CTGAATGATG TACTGACCTA CGCGGAAGAT 
CCGTGCGGCG CGGAGCAAGG ATTCTCTGGT CGTGAAGTCA TGGCGGAGTT CCGCCGCGCG 
ACAGGACTGC CGGTGGCGAC CAATATGATT GCCACCAACT GGCGTGAAAT GGGACACGCG 
GTGATGCTCA ACGCGGTAGA TATTCCTCTT GCCGATCCGC ATTTCTGGAC CCTCACCGGC 
GCCGTTCGCG TGGCGCAACT GTGCGATGAC TGGGGGCTAA CCTGGGGCTG CCATTCGAAT 
AACCATTTTG ATATTTCACT GGCGATGTTT ACCCATGTCG GCGCGGCGGC GCCAGGCAAA 
CCCACCGCTA TTGATACGCA CTGGATCTGG CAGGAGGGCG ATTGCCGCCT GACTAAAAAT 
CCGCTGGAAA TTAAAAACGG CAAAATTGCC GTTCCGGATG CGCCAGGACT GGGCGTGGAG 
CTTGACTGGG AACAGGTGCG AAAAGCGCAT GACGCGTATA AAACGCTGCC AGGCGGCGCG 
CGTAATGATG CAGGCCCGAT GCAATACCTG ATCCCCGGCT GGACTTTTGA CCGCAAACGC 
CCTGTTTTTG GTCGTCACTA A

Protein sequence

MTTQSSPVIT DMKVIPVAGH DSMLLNIGGA HNAYFTRNIV VLTDNAGHTG VGEAPGGEVI 
YQTLVDAIPM VLGQEVARLN KVVQQVHKGN QAADFDTFGK GAWTFELRVN AVAALEAALL 
DLLGQALNVP VCELLGPGKQ RDAVTVLGYL FYIGDRTKTD LPYLESTPGS HEWYHLRHQE 
ALNSDAVVRL AEASQDRYGF KDFKLKGGVL PGEQEIDTVR ALKKRFPDAR ITVDPNGAWL 
LDEAIALCKG LNDVLTYAED PCGAEQGFSG REVMAEFRRA TGLPVATNMI ATNWREMGHA 
VMLNAVDIPL ADPHFWTLTG AVRVAQLCDD WGLTWGCHSN NHFDISLAMF THVGAAAPGK 
PTAIDTHWIW QEGDCRLTKN PLEIKNGKIA VPDAPGLGVE LDWEQVRKAH DAYKTLPGGA 
RNDAGPMQYL IPGWTFDRKR PVFGRH