Gene SNSL254_A3758 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3758
Symbol	aroB
ID	6486898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3622363
End bp	3623451
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	56%
IMG OID	642739025
Product	3-dehydroquinate synthase
Protein accession	YP_002042736
Protein GI	194444819
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0998523
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	85
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGAGGA TTACAGTCAC TCTCGGGGAA CGTAGTTACC CGATCACCAT CGCGGCTGGT 
TTGTTTAACG AACCAGCTTC ATTCTTGCCG CTGAAATCAG GCGATCAGGT CATGTTAGTG 
ACCAACGAAA CCCTGGCGCC GCTTTATCTG GACAAGGTTC GCGGCGTACT CGAACGGGCG 
GGCGTTAACG TAGACAGCGT GATTCTTCCT GACGGCGAGC AGTATAAGAG CCTGACGGTG 
CTGGATACGG TGTTTACGGC GTTACTGAAA AAACCGCATG GTCGTGATAC CACTCTGGTC 
GCGCTTGGCG GCGGCGTGAT TGGCGATCTC ACCGGTTTTG CGGCGGCCAG CTACCAGCGA 
GGCGTACGTT TCATCCAGGT ACCAACTACC TTACTGTCGC AGGTTGATTC TTCCGTGGGC 
GGGAAAACCG CCGTCAACCA TCCCCTTGGC AAAAACATGA TTGGCGCGTT TTACCAACCC 
GCTTCTGTGG TTGTCGATCT TGATTGCCTG AAAACGCTTC CCGCACGCGA ACTGGCATCG 
GGGCTGGCAG AGGTGATCAA ATACGGCATT ATACTCGACG CAGACTTCTT CACCTGGCTT 
GAGGGTAATC TGGATGCGCT ATTGCGTCTG GACGGCCCGG CGATGGCGTA CTGTATTCGC 
CGTTGTTGCG AGCTGAAAGC CGAAGTTGTT GCCGCCGACG AGCGTGAAGC GGGCTTACGT 
GCTTTACTGA ATCTTGGACA TACCTTTGGC CACGCCATTG AAGCGGAAAT GGGATATGGC 
AATTGGTTAC ATGGTGAAGC CGTTGCCGCA GGTATAGTGA TGGCTGCGCG CGCATCCGAG 
CGTTTGGGGC AGTTCAGTTC TGCTGATACG CAGCGCATCA TCGCTCTACT CGAACGGGCC 
GGGCTGCCAG TCAATGGCCC TTGCGAGATG TCCGCGCAGG ACTATTTGCC GCACATGCTG 
CGAGATAAAA AAGTGTTAGC GGGGGAGCTG CGTTTAGTGC TTCCGCTGGC CATAGGGAAA 
AGTGAAGTGC GCGGCGGAGT GTCGCACGAA GTCGTTCTTA GCGCGATTGC TGACTGTCAG 
CAGGCGTAA

Protein sequence

MERITVTLGE RSYPITIAAG LFNEPASFLP LKSGDQVMLV TNETLAPLYL DKVRGVLERA 
GVNVDSVILP DGEQYKSLTV LDTVFTALLK KPHGRDTTLV ALGGGVIGDL TGFAAASYQR 
GVRFIQVPTT LLSQVDSSVG GKTAVNHPLG KNMIGAFYQP ASVVVDLDCL KTLPARELAS 
GLAEVIKYGI ILDADFFTWL EGNLDALLRL DGPAMAYCIR RCCELKAEVV AADEREAGLR 
ALLNLGHTFG HAIEAEMGYG NWLHGEAVAA GIVMAARASE RLGQFSSADT QRIIALLERA 
GLPVNGPCEM SAQDYLPHML RDKKVLAGEL RLVLPLAIGK SEVRGGVSHE VVLSAIADCQ 
QA