Gene SNSL254_A2987 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2987
Symbol
ID	6483950
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	2915485
End bp	2916753
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	59%
IMG OID	642738303
Product	hydroxyglutarate oxidase
Protein accession	YP_002042032
Protein GI	194443509
COG category	[R] General function prediction only
COG ID	[COG0579] Predicted dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0612118
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	0.154389
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATGATT TTGTGATTAT CGGCGGCGGC ATTATCGGCA TGTCGACCGC CATGCAACTT 
ATTGATGTCT ACCCGGATGC GCGCATCGCA TTGCTGGAAA AAGAGTCCGC GCCAGCCTGC 
CACCAGACCG GGCATAACAG CGGCGTGATC CATGCCGGGG TGTACTACAC GCCCGGCAGC 
CTCAAAGCGC GGTTTTGTCT GGCGGGCAAT CAGGCGACCA AAACCTTTTG CGATCAAAAC 
AACATCTGCT ACGACACCTG CGGCAAAATG TTGGTCGCCA CCTCGGAGCT GGAAATGGCG 
CGGATGCGCG CGCTCTGGGA GCGGACGGCG GCCAACGGCT TAGAGCGCGA GTGGTTAAGC 
GCGGCGGAGC TGCGTGAACG CGAACCCAAT ATCATTGGCC TGGGCGGAAT TTTTGTCCCT 
TCCAGCGGGA TTGTCAGCTA TCGCGATGTC GCGACGGCCA TGGCGAACCG CTTTCAGGCC 
AAAGGCGGCG AGATCATCTA CCATGCCGAG GTCAGCGCGC TAACAGAACA TGCCGCTGGC 
GTTATCATTC GCACCTCGCA AGGTCGGGAA ATCGAAACCG CTACGCTTAT CGGCTGTGCA 
GGACTGATGG CGGATCGGCT GGTCAAAATG CTGGGCGTGG AGCCCGGTTT TATTATCTGC 
CCTTTCCGCG GCGAGTACTT TCGTCTGGCC CCGCGACACA ACCGGATCGT TAACCATTTG 
ATCTACCCGA TCCCCGATCC GGCAATGCCG TTTCTCGGCG TCCATCTTAC CCGCATGATC 
GACGGCAGCG TTACGGTCGG GCCGAATGCG GTGCTGGCGC TTAAACGCGA AGGCTACCGT 
AAGCGCGACG TTTCCTTCAC CGACACCCTG GAGATTTTCC GCTCCGCCGG CATTCGCCGC 
GTACTGCAAA ACCATCTGCT TTCCGGACTG GGCGAGATGA AAAACTCGCT GTGCAAAAGC 
GGCTATTTGC GGCGAGTACA AAAGTATTGC CCCAGCCTGA CCGTCAACGA TCTCCAGCCC 
TGGCCGGCAG GCGTGCGGGC GCAGGCGGTT TCACCGGACG GCAAACTGAT TGATGATTTT 
CTGTTTGTCA CGACGCCGCG TTCCATTCAC ACCTGTAACG CCCCCTCCCC GGCGGCGACA 
TCCGCGATAC CTATCGGCGC GCATATCGTC AGCAAAGTTC AGGCGCTACG CGAAAGCCAG 
AGCAACCCCG GACGTGCGCT GCGTGCGGCA CGCAGCGTGG ACGCACTACA CGCCGCATTT 
ACCCGTTAA

Protein sequence

MYDFVIIGGG IIGMSTAMQL IDVYPDARIA LLEKESAPAC HQTGHNSGVI HAGVYYTPGS 
LKARFCLAGN QATKTFCDQN NICYDTCGKM LVATSELEMA RMRALWERTA ANGLEREWLS 
AAELREREPN IIGLGGIFVP SSGIVSYRDV ATAMANRFQA KGGEIIYHAE VSALTEHAAG 
VIIRTSQGRE IETATLIGCA GLMADRLVKM LGVEPGFIIC PFRGEYFRLA PRHNRIVNHL 
IYPIPDPAMP FLGVHLTRMI DGSVTVGPNA VLALKREGYR KRDVSFTDTL EIFRSAGIRR 
VLQNHLLSGL GEMKNSLCKS GYLRRVQKYC PSLTVNDLQP WPAGVRAQAV SPDGKLIDDF 
LFVTTPRSIH TCNAPSPAAT SAIPIGAHIV SKVQALRESQ SNPGRALRAA RSVDALHAAF 
TR