Gene SNSL254_A2125 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2125
Symbol
ID	6484051
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	2055927
End bp	2057411
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	51%
IMG OID	642737480
Product	cytoplasmic alpha-amylase
Protein accession	YP_002041227
Protein GI	194444955
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.172028
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.0000021601
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAAACC CCACGTTATT GCAGTACTTC CACTGGTATT ATCCCGACGG CGGTAAACTC 
TGGTCTGAGC TGGCGGAACG TGCTGATGGG CTGAATGATA TCGGTATCAA TATGGTCTGG 
CTACCGCCCG CCTGTAAAGG CGCCTCCGGC GGCTATTCCG TAGGCTATGA TAGCTACGAC 
CTGTTTGACC TCGGCGAATT TGACCAAAAA GGAACTATCG CGACAAAGTA CGGCGATAAA 
CGCCAGTTAC TGACGGCGAT AGACGCGCTC AAAAAAAATA ATATTGCGGT GCTGCTCGAC 
GTCGTCGTGA ACCACAAAAT GGGCGCAGAC GAAAAAGAAC GTATCCGCGT TCAGCGCGTG 
AATCAGGATG ACCGCACGCA AATCGATGAC AACATCATTG AATGCGAAGG CTGGACGCGC 
TACACCTTCC CTGCCCGCGC GGGCCAGTAT TCCAACTTTA TTTGGGACTA TCACTGTTTC 
AGCGGCATTG ATCACATCGA GAATCCCGAC GAAGACGGCA TTTTTAAGAT CGTCAATGAC 
TATACCGGCG ATGGCTGGAA CGATCAGGTT GATGATGAGC TGGGTAATTT CGACTATCTG 
ATGGGGGAAA ATATCGATTT TCGCAATCAC GCGGTTACGG AAGAGATTAA ATATTGGGCT 
CGTTGGGTCA TGGAACAAAC CCACTGTGAC GGCTTTCGCC TGGACGCGGT AAAACATATA 
CCCGCCTGGT TTTATAAAGA ATGGATTGAG CATGTACAGG CGGTTGCGCC AAAACCGCTG 
TTTATTGTCG CAGAATACTG GTCGCATGAA GTGGATAAAC TGCAAACGTA CATCGATCAG 
GTCGACGGGA AAACCATGCT GTTCGACGCG CCGTTGCAGA TGAAATTTCA CGAGGCCTCG 
CGCCAGGGCG CGGAGTATGA CATGCGCCAC ATATTCACCG GCACTCTGGT AGAAGCCGAC 
CCTTTTCATG CGGTGACGCT GGTCGCTAAC CACGATACAC AACCGTTACA GGCGCTGGAA 
GCGCCGGTAG AACCCTGGTT CAAACCATTG GCCTATGCGC TGATCCTGCT TCGTGAAAAC 
GGCGTACCGT CAGTGTTTTA TCCCGATTTA TACGGCGCCA GCTATGAAGA TAGCGGCGAA 
AATGGCGAGA CCTGTCGGGT CGACATGCCG GTGATTAACC AACTGGATCG GCTGATCCTC 
GCTCGTCAGC GTTTTGCGCA CGGTATACAA ACACTCTTTT TCGATCATCC TAACTGTATC 
GCCTTTAGTC GCAGCGGTAC TGAAGAGAAT CCAGGCTGTG TGGTTGTACT TTCCAATGGC 
GACGACGGTG AAAAAACCCT CCTGCTCGGC GACAATTACG CTAACAAGAC CTGGCGTGAT 
TTTCTGGGAA ACCGCAGTGA GCATGTTGTA ACTAATGATC AAGGCGAAGC GACGTTCTTC 
TGCAACGCAG GCAGCGTCAG CGTGTGGGTC ATTGAGGACG TGTGA

Protein sequence

MKNPTLLQYF HWYYPDGGKL WSELAERADG LNDIGINMVW LPPACKGASG GYSVGYDSYD 
LFDLGEFDQK GTIATKYGDK RQLLTAIDAL KKNNIAVLLD VVVNHKMGAD EKERIRVQRV 
NQDDRTQIDD NIIECEGWTR YTFPARAGQY SNFIWDYHCF SGIDHIENPD EDGIFKIVND 
YTGDGWNDQV DDELGNFDYL MGENIDFRNH AVTEEIKYWA RWVMEQTHCD GFRLDAVKHI 
PAWFYKEWIE HVQAVAPKPL FIVAEYWSHE VDKLQTYIDQ VDGKTMLFDA PLQMKFHEAS 
RQGAEYDMRH IFTGTLVEAD PFHAVTLVAN HDTQPLQALE APVEPWFKPL AYALILLREN 
GVPSVFYPDL YGASYEDSGE NGETCRVDMP VINQLDRLIL ARQRFAHGIQ TLFFDHPNCI 
AFSRSGTEEN PGCVVVLSNG DDGEKTLLLG DNYANKTWRD FLGNRSEHVV TNDQGEATFF 
CNAGSVSVWV IEDV