Gene SNSL254_A4871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4871
Symbol
ID	6482575
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	4740082
End bp	4741353
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	54%
IMG OID	642740082
Product	hypothetical protein
Protein accession	YP_002043759
Protein GI	194442966
COG category	[S] Function unknown
COG ID	[COG2733] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	0.633189
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAAAA TCGCCGAACT CAAACGCGCC AAACGCCTGG CGCTCTCACT GTTGCTGATA 
GCCGCCGCGA CGTTTGTGAC CACGCTTTTC CTGCCGCCCA GTTTTTGGGT GCTGGGCGTA 
AAAGCAATTG CCGAAGCGGC GATGGTTGGC GCGCTGGCGG ACTGGTTTGC CGTGGTGGCG 
CTGTTTCGCC GCATTCCCAT TCCGTTTATT TCACGACATA CGGCGATTAT TCCCCGTAAT 
AAAGACCGAA TCGGCGAAAA TCTTGGGCAA TTTGTGCAGG AGAAGTTCCT TGATACGCAG 
TCGCTGATCG CGCTAATCCG CCGCCATGAA CCCGCGCTGC TTATCGGAAA CTGGTTCAGC 
CAGCCGGACA ACGCCAGCCG GGTCGGGCAG CATCTGCTGC AAATTATGAG CGGCTTTCTG 
GAACTGACCG ATGACGCCCG TATTCAGCGG CTGCTCAAGC GAGCGGTGCA TAAGGCGATT 
GATAAAGTGG ATCTTTCCGG CACCAGCGCC CTGATGCTGG AAAGCATGAC CAAAAACGAT 
CGTCACCAGG AGTTACTCGA TACGCTGATC GCCCAGCTTA TCGCCCTGTT ACAGCGTGAC 
AGCTCCCGAA CATTTATCGC CAGACAGATC ATACGCTGGC TAGAGACCGA ACATCCGTTA 
AAAGCGAAGA TTCTGCCGAC CGAATGGCTG GGAGAACACA GCGCTGAACT GGTCTCCGAC 
GCGGTAAATT CTCTGCTGGA TGATATCAGT CACGACCGCG CGCATCAGAT TCGTCATGCC 
TTCGATCGCG CGACGTATAA GCTGATCGAT AAACTTAAAC ATGATCCGGA AATGGCTGCC 
CGGGCAGAAA ACATTAAAAG TTACCTGAAG GAAGATGAGG CGTTTAACCG TTATCTCGGC 
GAGATCTGGG CGGATCTACG CCAGTGGTTA AAAACAGATA TCAACGCCGA AGACTCGAAG 
GTGAAGCAGC GCATCGCTCA TGCCGGACAA TGGTTTGGCG AGACGCTTAT CGCCGACGAC 
GCATTACGCG CTTCGCTTAA CGGTCATCTG GAACAGGCCG CGCACCGCGT CGCGCCGGAA 
TTCGCCGCCT TCCTGACGCG CCACATCAGC GATACCGTAA AAGGCTGGGA TGCGCGCGAT 
ATGTCGCAGC AGATTGAGCT TAATATCGGT AAAGATTTGC AGTTTATCCG CGTGAACGGC 
ACGCTGGTCG GCGGCGCTAT CGGTCTGGTG TTATATTTAC TGTCGCAAAT ACCGGCACTG 
CTCAGTATCT AA

Protein sequence

MNKIAELKRA KRLALSLLLI AAATFVTTLF LPPSFWVLGV KAIAEAAMVG ALADWFAVVA 
LFRRIPIPFI SRHTAIIPRN KDRIGENLGQ FVQEKFLDTQ SLIALIRRHE PALLIGNWFS 
QPDNASRVGQ HLLQIMSGFL ELTDDARIQR LLKRAVHKAI DKVDLSGTSA LMLESMTKND 
RHQELLDTLI AQLIALLQRD SSRTFIARQI IRWLETEHPL KAKILPTEWL GEHSAELVSD 
AVNSLLDDIS HDRAHQIRHA FDRATYKLID KLKHDPEMAA RAENIKSYLK EDEAFNRYLG 
EIWADLRQWL KTDINAEDSK VKQRIAHAGQ WFGETLIADD ALRASLNGHL EQAAHRVAPE 
FAAFLTRHIS DTVKGWDARD MSQQIELNIG KDLQFIRVNG TLVGGAIGLV LYLLSQIPAL 
LSI