Gene SNSL254_A1451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1451
Symbol
ID	6483580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1418985
End bp	1419965
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	59%
IMG OID	642736843
Product	vtamin B12-transporter permease
Protein accession	YP_002040597
Protein GI	194444270
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG4139] ABC-type cobalamin transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	77
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGACTT TTGCCCGCCA ACAACAGCGA CGAAACGTTC GCTGGCTTCT GAGCCTGTCA 
CTGCTGGTGC TACTGGCTAC ACTTCTGAGC TTATGCGCAG GCGAACAGTG GATTGCCCCC 
GGTGACTGGT TAAGCGCCCG GGGGGAACTG TTTGTCTGGC AAATTCGCCT TCCCCGCACG 
CTTGCGGTAT TGCTGGTTGG CGCTGCGCTG GCGCTATCTG GCGCTGTGAT GCAGGCGCTG 
TTTGAAAACC CACTTGCTGA ACCGGGTCTG CTCGGCGTTT CGAATGGGGC CGGTGTTGGG 
CTTATTGCCG CCGTCTTACT GGGGCAGGGG CAACTGCCAG GATGGGCGCT GGGACTGTGC 
GCTATAGCCG GCGCGCTCAT TATTACGTTA ATTCTGCTGC GTTTTGCGCG TCGCCATCTT 
TCTACCAGCC GCTTGTTGTT GGCGGGCGTC GCGCTGGGCA TTATCTGTAG CGCGCTGATG 
ACGTGGGCTA TCTATTTTTC CACCTCTTTC GATCTGCGGC AATTAATGTA CTGGATGATG 
GGAGGATTCG GCGGCGTTGA CTGGCAGCAG AGCTGGCTAA TGATTGCGCT CATCCCGGTA 
CTGATCTGGA TATGTTGCCA GTCGCAACCG CTGAATATGC TGGCGCTAGG GGAAACCTCG 
GCGCGGCAGC TTGGCCTGCC GCTGTGGTTC TGGCGCAATT TGTTGGTCAT CGCCACCGGC 
TGGATGGTGG GCGTCAGCGT GGCGATGGCG GGGGCGATTG GTTTTATCGG TCTGGTTATT 
CCGCACATCC TGCGCTTATG TGGTTTAACC GATCACCGGG TTTTACTTCC CGGCTGCGCG 
CTGGCCGGGG CTATCGCCCT GCTATTGGCT GATGTGGTCG CCCGACTGGC GCTGGCGTCG 
GCTGAACTGC CTATCGGGGT GGTCACCGCC ACATTGGGGG CACCAGTGTT TATCTGGCTG 
CTACTCAAAT CCGCGCGTTA G

Protein sequence

MLTFARQQQR RNVRWLLSLS LLVLLATLLS LCAGEQWIAP GDWLSARGEL FVWQIRLPRT 
LAVLLVGAAL ALSGAVMQAL FENPLAEPGL LGVSNGAGVG LIAAVLLGQG QLPGWALGLC 
AIAGALIITL ILLRFARRHL STSRLLLAGV ALGIICSALM TWAIYFSTSF DLRQLMYWMM 
GGFGGVDWQQ SWLMIALIPV LIWICCQSQP LNMLALGETS ARQLGLPLWF WRNLLVIATG 
WMVGVSVAMA GAIGFIGLVI PHILRLCGLT DHRVLLPGCA LAGAIALLLA DVVARLALAS 
AELPIGVVTA TLGAPVFIWL LLKSAR