Gene SeHA_C3167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3167
Symbol
ID	6490977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3094539
End bp	3095879
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	57%
IMG OID	642743311
Product	glucarate dehydratase
Protein accession	YP_002046930
Protein GI	194449559
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID	[TIGR03247] glucarate dehydratase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	0.153553
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACGC AATCCAGTCC CGTTATTACG GACATGAAGG TCATTCCGGT TGCCGGACAT 
GACAGTATGC TACTCAACAT CGGCGGCGCG CATAACGCGT ACTTCACCCG TAACATCGTC 
GTCCTCACCG ATAACGCCGG GCATACTGGC GTCGGCGAGG CGCCGGGCGG AGAAGTGATT 
TATCAGACGC TGGTCGATGC TATTCCGATG GTATTAGGCC AGGAAGTCGC CCGCCTGAAC 
AAAGTGGTGC AGCAGGTGCA TAAAGGCAAC CAGGCTGCTG ATTTTGACAC CTTTGGTAAA 
GGCGCATGGA CGTTTGAACT GCGGGTTAAC GCGGTGGCAG CTTTGGAAGC GGCGCTGCTT 
GATCTACTGG GGCAGGCGCT TAATGTGCCG GTCTGTGAAC TGTTAGGACC CGGTAAACAG 
CGCGATGCCG TCACCGTGTT GGGCTATCTC TTCTATATTG GCGATCGCAC TAAAACCGAT 
CTGCCGTATC TGGAAAGCAC GCCGGGCAGT CATGAATGGT ATCGCCTGCG CCATCAGGAA 
GCGCTGAACA GCGACGCGGT CGTGCGGCTG GCGGAAGCGT CTCAGGATCG CTACGGCTTT 
AAAGATTTTA AACTCAAGGG CGGCGTGCTG CCGGGCGAAC AAGAGATTGA TACCGTTCGC 
GCGCTAAAAA AACGCTTCCC GGACGCACGT ATCACCGTGG ATCCGAACGG CGCCTGGCTA 
CTGGATGAAG CCATTGCGTT GTGCAAAGGG CTGAATGATG TACTGACCTA CGCGGAAGAT 
CCGTGCGGCG CGGAGCAAGG ATTCTCTGGT CGTGAAGTCA TGGCGGAGTT CCGCCGCGCT 
ACAGGACTGC CGGTGGCGAC CAATATGATT GCCACCAACT GGCGTGAAAT GGGACATGCA 
GTGATGCTCA ACGCGGTAGA TATTCCTCTT GCCGACCCGC ATTTCTGGAC TCTCACCGGC 
GCCGTTCGCG TGGCGCAACT GTGCGATGAC TGGGGGCTAA CCTGGGGCTG CCATTCGAAT 
AACCATTTTG ATATTTCACT GGCGATGTTT ACCCATGTCG GCGCGGCGGC GCCAGGCAAA 
CCCACCGCTA TTGATACGCA CTGGATCTGG CAGGAGGGCG ATTGCCGCCT GACTAAAAAT 
CCGCTGGAAA TTAAAAACGG CAAAATTGCC GTTCCGGATG CGCCAGGACT GGGCGTAGAG 
CTTGACTGGG AACAGGTGCG AAAAGCGCAT GACGCGTATA AAAAGCTGCC AGGCGGCGCG 
CGTAATGATG CAGGCCCGAT GCAATACCTG ATCCCCGGCT GGACTTTTGA CCGCAAACGC 
CCTGTTTTTG GTCGTCACTA A

Protein sequence

MTTQSSPVIT DMKVIPVAGH DSMLLNIGGA HNAYFTRNIV VLTDNAGHTG VGEAPGGEVI 
YQTLVDAIPM VLGQEVARLN KVVQQVHKGN QAADFDTFGK GAWTFELRVN AVAALEAALL 
DLLGQALNVP VCELLGPGKQ RDAVTVLGYL FYIGDRTKTD LPYLESTPGS HEWYRLRHQE 
ALNSDAVVRL AEASQDRYGF KDFKLKGGVL PGEQEIDTVR ALKKRFPDAR ITVDPNGAWL 
LDEAIALCKG LNDVLTYAED PCGAEQGFSG REVMAEFRRA TGLPVATNMI ATNWREMGHA 
VMLNAVDIPL ADPHFWTLTG AVRVAQLCDD WGLTWGCHSN NHFDISLAMF THVGAAAPGK 
PTAIDTHWIW QEGDCRLTKN PLEIKNGKIA VPDAPGLGVE LDWEQVRKAH DAYKKLPGGA 
RNDAGPMQYL IPGWTFDRKR PVFGRH