Gene SNSL254_A2368 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2368
Symbol	gtdA
ID	6484033
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	2285573
End bp	2286610
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	56%
IMG OID	642737708
Product	gentisate 1,2-dioxygenase
Protein accession	YP_002041450
Protein GI	194444288
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3435] Gentisate 1,2-dioxygenase
TIGRFAM ID	[TIGR02272] gentisate 1,2-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0793193
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	73
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAA TAAATCAGAA CGTAAAAGAT AGCCGTCAAC AGTATTACCA GCATATTTCC 
GGGCAGAATC TGACGCCGCT GTGGGAGTCG TTACATCACC TGGTACCGCA GACGCCAAAC 
GCCAACTGCG CGCCGGCCTA CTGGAATTAT CAGGAAATTC GTCCGCTACT GATGGAAAGC 
GGCAATGTCA TTGGCGCGAA AGAGGCGATC CGCCGGGTGC TGGTGCTGGA AAATCCGGCA 
TTGCGCGGTC AGTCGTCGAT TACGGCGACC TTATACGCTG GTTTACAGCT GATCCTGCCC 
GGCGAAGTCG CGCCGAGTCA TCGCCATAAC CAGTCGGCGC TGCGTTTTAT CGTCGAAGGT 
AAAGGCGCAT TTACCGCGGT GGACGGCGAG CGCACGCCAA TGCATACCGG CGATTTTATC 
CTGACGCCGC AGTGGCGCTG GCACGATCAT GGTAATCCGG GATCAGAGCC GGTGGTATGG 
CTGGATGGTC TGGATCTGCC GTTAGTCAAT CTCCTGGGCT GTGGTTTTGC GGAAGACTAT 
CCCGAAGATC AGCAGCCGGT GACGCGAAAA GAGGGCGATT ATCTGCCGCG CTATGCAGCG 
AATATGCTGC CGCTGCGCCA CCAGCGCGGG AACTCGTCGC CGATTTTCAA CTACCGTTAC 
GACCGCAGTC GCGAGGCGTT GCACGATCTG ACCCGTATGG GCGATCCGGA TGAGTGGGAA 
GGTTACAAGC TGCGTTACGT TAATCCCGTC ACCGGCGGTT ATCCGATGCC GTCGATGGGC 
GCGTTCCTGC AACTGTTGCC AAAAGGCTTT GCCTCGCGTG TGGCGCGGAG CACCGACAGC 
ACTATCTACC ACGTCGTTGA AGGGGCAGGA CTGGTCACTA TCGGCAACGA AACTTTTCAT 
TTTTCCGCAA AAGACATTTT TGTGGCGCCG ACCTGGCATG AGGTGTCGTT TCGCAGCAGC 
GAAGACACAG TGTTATTCAG TTTTTCGGAC AAGCCGGTTC AGGAAGCCCT GGGGCTGTTC 
CGCGAAGCAC GTTATTAA

Protein sequence

MSEINQNVKD SRQQYYQHIS GQNLTPLWES LHHLVPQTPN ANCAPAYWNY QEIRPLLMES 
GNVIGAKEAI RRVLVLENPA LRGQSSITAT LYAGLQLILP GEVAPSHRHN QSALRFIVEG 
KGAFTAVDGE RTPMHTGDFI LTPQWRWHDH GNPGSEPVVW LDGLDLPLVN LLGCGFAEDY 
PEDQQPVTRK EGDYLPRYAA NMLPLRHQRG NSSPIFNYRY DRSREALHDL TRMGDPDEWE 
GYKLRYVNPV TGGYPMPSMG AFLQLLPKGF ASRVARSTDS TIYHVVEGAG LVTIGNETFH 
FSAKDIFVAP TWHEVSFRSS EDTVLFSFSD KPVQEALGLF REARY