Gene SeAg_B3101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B3101
Symbol
ID	6796951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	-
Start bp	3027967
End bp	3029307
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	55%
IMG OID	642777261
Product	glucarate dehydratase
Protein accession	YP_002147870
Protein GI	197250815
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID	[TIGR03247] glucarate dehydratase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTACTC AATTTACGAC GCCTGTAGTG ACTGAAATGC AGGTTATCCC GGTTGCGGGT 
CATGACAGTA TGCTGATGAA CCTGAGCGGC GCGCACGCCC CGTTCTTCAC GCGCAACATC 
GTCATTATTA AAGATAACTC CGGCCATACC GGGGTCGGCG AGATTCCGGG CGGCGAAAAA 
ATCCGCAAAA CGCTGGAAGA TGCGATCCCA CTGGTGGTGG GAAAAACGCT GGGTGAATAT 
AAAAATGTCC TGACCGCCGT TCGCAACCAG TTTGCCGATC GCGATGCGGG CGGACGCGGT 
TTACAAACGT TCGATCTCCG TACCACTATC CATGTGGTGA CTGGTATTGA AGCGGCAATG 
CTTGATCTTT TGGGCCAACA CCTGGGCGTC AACGTCGCTT CGCTGTTAGG CGACGGTCAG 
CAGCGCAGCG AAGTCGAAAT GCTGGGTTAT CTGTTCTTTG TCGGCAATCG CAAGGCCACG 
CCGCTGCCGT ATCAGAGCCA GCCGGATGAG CAATGCGACT GGTATCGTCT GCGCCATGAA 
GAGGCGATGA CGCCGGAAAC GGTAGTACGT CTGGCGGAAG CCGCCTATGA AAAATACGGC 
TTCAACGACT TCAAACTGAA AGGCGGCGTG CTGGCGGGCG AAGAAGAGGC CGAGTCAATC 
GTGGCGCTGG CGAAACGTTT CCCACAAGCG CGCGTTACGC TCGATCCAAA CGGTGCCTGG 
TCGTTGAACG AAGCGATCAG CATTGGTAAA TACCTGAAAG GTTCTCTGGC CTATGCAGAA 
GATCCGTGCG GCGCGGAGCA GGGTTTTTCT GGTCGTGAAG TGATGGCGGA ATTCCGTCGC 
GCGACCGGAT TACCGACGGC CACCAATATG ATAGCGACCG ATTGGCGTCA AATGGGGCAT 
ACGCTGTCGC TGCAATCTGT AGATATCCCG CTGGCGGACC CGCACTTCTG GACTATGCAA 
GGCTCTGTAC GCGTGGCGCA AATGTGTCAT GAGTTCGGTC TGACCTGGGG ATCGCACTCT 
AACAACCACT TTGATATTTC GTTGGCGATG TTTACCCATG TTGCCGCGGC GGCGCCGGGC 
AAGATCACCG CGATCGATAC CCACTGGATC TGGCAGGAAG GCAACCAACG TCTGACTAAA 
GAACCGTTTG AAATTAAAGG CGGCATGGTG CAAGTACCGG CCAAACCGGG TCTGGGCGTT 
GAGCTCGATA TGGATCAGGT GATGAAAGCG CATGAGCTCT ATCAAAAGCA TGGCTTAGGC 
GCGCGTGACG ACGCGATGGG AATGCAGTAC TTAATTCCTG GCTGGACGTT TGATAATAAG 
CGTCCTTGCA TGGTGCGTTA A

Protein sequence

MSTQFTTPVV TEMQVIPVAG HDSMLMNLSG AHAPFFTRNI VIIKDNSGHT GVGEIPGGEK 
IRKTLEDAIP LVVGKTLGEY KNVLTAVRNQ FADRDAGGRG LQTFDLRTTI HVVTGIEAAM 
LDLLGQHLGV NVASLLGDGQ QRSEVEMLGY LFFVGNRKAT PLPYQSQPDE QCDWYRLRHE 
EAMTPETVVR LAEAAYEKYG FNDFKLKGGV LAGEEEAESI VALAKRFPQA RVTLDPNGAW 
SLNEAISIGK YLKGSLAYAE DPCGAEQGFS GREVMAEFRR ATGLPTATNM IATDWRQMGH 
TLSLQSVDIP LADPHFWTMQ GSVRVAQMCH EFGLTWGSHS NNHFDISLAM FTHVAAAAPG 
KITAIDTHWI WQEGNQRLTK EPFEIKGGMV QVPAKPGLGV ELDMDQVMKA HELYQKHGLG 
ARDDAMGMQY LIPGWTFDNK RPCMVR