Gene SeHA_C3551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3551
Symbol	gatY
ID	6487616
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3442387
End bp	3443379
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	50%
IMG OID	642743674
Product	tagatose-bisphosphate aldolase
Protein accession	YP_002047288
Protein GI	194449436
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0191] Fructose/tagatose bisphosphate aldolase
TIGRFAM ID	[TIGR00167] ketose-bisphosphate aldolases [TIGR01858] class II aldolase, tagatose bisphosphate family

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.207369
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	84
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTTTTT TACGCCTGAC TTTCGATAAC TTCCATTTTA TTTCGAAACT TTCATTTATC 
AGATCAAAAT CACAAAAAAA CATTCCGAAA GCCTATAAAT TCTTTCAAAG AAAACAAACG 
AAAGATTTCG GAGGAAGGAT GTTTATCATT TCAGGCAGAA CAATGCTAAA GAAGGCGCAG 
CAGGAAGGTT ATGCTGTGCC GGCGTTTAAC ATCCACAACC TGGAGACATT GCAAGTGGTG 
GTGGAAACCG CCGCAGAATT GCGCTCTCCG CTGATTGTCG CCGGTACGCC AGGCACCTTT 
AGCTACGCAG GCGTCGGTAA TATCGTGGCC ATCGCCGCAG AACTGGCGAA AAGCTGGAAC 
CATCCTCTCG CGGTACATCT CGATCATCAT GAAAAACTGG CCGACATCAA AATGAAAGTC 
GCCGCCGGGG TACGCTCGGT CATGATCGAC GGGTCGCATT TCCCCTTTGC CGACAATATT 
GCGCTGGTGA AAAGTGTGGT TGATTACTGT CATCGCTACG ATGTCAGCGT TGAAGCTGAA 
CTTGGGCGTC TCGGCGGGCA GGAAGACGAT CTTATCGTTG ACGGTAAAGA TGCGCTTTAT 
ACCCATCCGG AACAGGCCCG GGAATTTGTA GAAAAAACGG GTATCGACTC GTTAGCCATT 
GCTATCGGCA CCGCTCACGG CCTCTACACC GCTGAACCAA AACTTGATTT TGAACGACTG 
ACGGAAATTC GTCAGCGGGT TGATGTCCCC TTAGTCCTTC ACGGCGCCTC TGGCCTGCCG 
ACCCGCGATA TTACCCGCGC TATTTCGCTG GGCATCTGCA AAGTTAACGT CGCGACCGAG 
CTTAAAATCG CCTTTTCCGG CGCGCTTAAA AACTATTTAA CGCAACACGC AGAGGCCAGC 
GATCCCCGCC ATTACATGAT CCCGGCGAAA GCGGCCATGA AAGAGGTTGT ACGTAAAGTG 
ATTGCCGACT GCGGTTGTGA AGGGAAGCTC TAA

Protein sequence

MLFLRLTFDN FHFISKLSFI RSKSQKNIPK AYKFFQRKQT KDFGGRMFII SGRTMLKKAQ 
QEGYAVPAFN IHNLETLQVV VETAAELRSP LIVAGTPGTF SYAGVGNIVA IAAELAKSWN 
HPLAVHLDHH EKLADIKMKV AAGVRSVMID GSHFPFADNI ALVKSVVDYC HRYDVSVEAE 
LGRLGGQEDD LIVDGKDALY THPEQAREFV EKTGIDSLAI AIGTAHGLYT AEPKLDFERL 
TEIRQRVDVP LVLHGASGLP TRDITRAISL GICKVNVATE LKIAFSGALK NYLTQHAEAS 
DPRHYMIPAK AAMKEVVRKV IADCGCEGKL