Gene SNSL254_A3142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3142
Symbol
ID	6483459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	3053798
End bp	3054844
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	52%
IMG OID	642738453
Product	alkaline phosphatase isozyme conversion aminopeptidase
Protein accession	YP_002042177
Protein GI	194443359
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	0.634375
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTTCCG CAACGCGCCG CTTTGCCGTC ATTCTGGCGC TCGGCGTAGG CTTTATCCTT 
CCTGCACAAG CAGCATCACC AGGGCCTGGT GAAATAGCGA ATACTCAGGC ACGACATATC 
GCCACCTTTT TTCCCGGGAG AATGACGGGC TCCCCCGCCG AGATGTTGTC TGCCGATTAT 
TTACGCCAAC AATTTACCCA GATGGGATAC CAAAGCGATA TTCGAACGTT TAATAGCCGA 
TTTATTTATA CCACGAAGGA TAATCGCAAA AACTGGCATA ACGTGACGGG CAGCACGGTC 
ATCGCCGCCC ATGAAGGGCG CGTGCCGCAA CAGATCATCA TTATGGCGCA TCTGGATACG 
TACGCTCCGC AGAGCGACGC TGATGTCGAT GCCAATCTGG GCGGTTTAAC GTTACAGGGA 
ATGGATGATA ATGCCGCGGG ATTAGGCGTT ATGCTGGAAC TGGCGGCGCG TCTGAAAGAT 
ATACCGACCC ATTATGGGAT TCGTTTTATC GCCACCAGCG GGGAAGAAGA GGGAAAGCTA 
GGCGCGGAAA ATTTACTCAA ACGAATGAGT GACGCTGAGA AGAAAAATAC GCTGCTGGTG 
ATTAATCTCG ATAACCTGAT TGTTGGCGAC AAGCTCTATT TTAATAGCGG GAAAAATACG 
CCGGAAGCGG TGCGTACACT GACCCGCGAT CGAGCATTAG CGATTGCGCG CCGTTATGGT 
ATCGCCGCCA ACACCAATCC GGGACGCAAT CCATCCTACC CCAAAGGAAC GGGTTGCTGT 
AATGATGCGG AGGTTTTCGA TAAAGCGGGA ATATCGGTGC TTTCTGTTGA GGCGACGAAC 
TGGAATCTGG GTAAAAAAGA CGGATACCAG CAACGCGTGA AAAATGCATC CTTCCCGAAC 
GGCAATAGCT GGCACGACGT ACGGCTTGAT AATCAACAGC ATATTGACAA GGCGCTGCCT 
GGGCGAATTG AGCGCCGTAG CCGCGATGTA GTGCGGATAA TGCTGCCGTT GGTAAAAGAG 
CTGGCGAAGG CGGAAAAAAC GTCCTGA

Protein sequence

MFSATRRFAV ILALGVGFIL PAQAASPGPG EIANTQARHI ATFFPGRMTG SPAEMLSADY 
LRQQFTQMGY QSDIRTFNSR FIYTTKDNRK NWHNVTGSTV IAAHEGRVPQ QIIIMAHLDT 
YAPQSDADVD ANLGGLTLQG MDDNAAGLGV MLELAARLKD IPTHYGIRFI ATSGEEEGKL 
GAENLLKRMS DAEKKNTLLV INLDNLIVGD KLYFNSGKNT PEAVRTLTRD RALAIARRYG 
IAANTNPGRN PSYPKGTGCC NDAEVFDKAG ISVLSVEATN WNLGKKDGYQ QRVKNASFPN 
GNSWHDVRLD NQQHIDKALP GRIERRSRDV VRIMLPLVKE LAKAEKTS