Gene SNSL254_A2153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2153
Symbol
ID	6485047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	2077223
End bp	2078143
Gene Length	921 bp
Protein Length	306 aa
Translation table	11
GC content	57%
IMG OID	642737507
Product	hypothetical protein
Protein accession	YP_002041254
Protein GI	194443963
COG category	[R] General function prediction only
COG ID	[COG5006] Predicted permease, DMT superfamily
TIGRFAM ID	[TIGR00950] Carboxylate/Amino Acid/Amine Transporter

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	0.0413496
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTTTCC GGCAGTTATT ACCTCTTTTT GGCGCGCTTT TTGCCTTGTA TATCATTTGG 
GGGTCTACCT ATTTTGTTAT CCGCATAGGC GTTGAAAGCT GGCCGCCGCT GATGATGGCA 
GGCGTACGTT TTCTCTCGGC GGGGATGTTG CTCATGGCGT TTTTGCTGCT GCGCGGCGAA 
AAACTTCCGC CGCTGCGCCA GACCATCAAC GCCGCGCTGA TTGGTCTACT GCTGCTGGCG 
GTGGGTAACG GTCTGGTGAC GGTGGCGGAG CATCAAAACG TGCCATCGGG CATTGCTGCC 
GTCGTGGTCG CCACTGTCCC GCTATTTACG CTGTGCTTTA GCTACTTTTT TGGTATTAAA 
GCGCGCAAAT TAGAATGGGT GGGGATTGCC ATTGGACTTG CCGGGATTAT TCTGCTGAAC 
AGCGGCGGCA ATTTAAGCGG CAATCCGTGG GGCGCGATTT TGATCCTGAT AGGTTCGATG 
AGCTGGGCAT TTGGTTCCGT TTACGGCTCG CGCATCGCCC TCCCTGTGGG CATGATGGCG 
GGTGCGATTG AAATGCTGGC GGCGGGCGTG GTATTGCTTT GCGCGGCGTT TCTTTCCGGC 
GAAAAGCTCG CCACGCTGCC TGGCTTATCG GGGTTTATGG CCGTCGGCTA CCTGGCGTTG 
TTCGGTTCTA TTATCGCCAT TAATGCCTAT ATGTACCTGA TTCGCAACGT CAGTCCGGCG 
CTGGCGACCA GCTACGCCTA TGTGAATCCG GTTGTCGCCG TGTTGCTTGG CACTGGCCTG 
GGCGGCGAGA GGTTATCGCC CGTTGAATGG GCCGCGCTGG GTGTGATTGT GTTTGCCGTA 
GTGCTGGTGA CTCTGGGTAA GTACCTGTTT CCCGCCAGGG CGGTGGTCAC GCCGTGTAAA 
ACGGAAGATT CACGCCAGTA G

Protein sequence

MRFRQLLPLF GALFALYIIW GSTYFVIRIG VESWPPLMMA GVRFLSAGML LMAFLLLRGE 
KLPPLRQTIN AALIGLLLLA VGNGLVTVAE HQNVPSGIAA VVVATVPLFT LCFSYFFGIK 
ARKLEWVGIA IGLAGIILLN SGGNLSGNPW GAILILIGSM SWAFGSVYGS RIALPVGMMA 
GAIEMLAAGV VLLCAAFLSG EKLATLPGLS GFMAVGYLAL FGSIIAINAY MYLIRNVSPA 
LATSYAYVNP VVAVLLGTGL GGERLSPVEW AALGVIVFAV VLVTLGKYLF PARAVVTPCK 
TEDSRQ