Gene SNSL254_A4161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4161
Symbol	yieM
ID	6484115
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	4052570
End bp	4054021
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	56%
IMG OID	642739417
Product	hypothetical protein
Protein accession	YP_002043126
Protein GI	194442438
COG category	[R] General function prediction only
COG ID	[COG2425] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	92
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGACGC TGGATACGCT AAATACCATG CTGGCCGTCA GCGAAGAGGG AATGGTCGAA 
GAGATGATCC TCGCGCTACT GGCTTCCCCA CAACTGGTCA TTTTCTTTGA AAAGTTTCCG 
CGTTTAAAAA ACGCCGTGAC CGCCGATCTC CCGCGCTGGC GGGAAGCGCT ACGCAGCCGT 
CTTAAAGACG CACGCGTTCC GCCGGAACTC ACGGAAGAGG TCATGTGTTA TCAGCAAAGC 
CAACTTCTCT CTACCCCACA GTTCATCGTG CAACTGCCGC AAATACTGGC GTTGCTTCAC 
CGCCTGCATT CACCGTATGC CGCGCAGGCG AAGCAGTTGA CGGAGAGCAA CAGTACCTTT 
ACCCCTGCGC TACACACGCT TTTTTTGCAA CGCTGGCGGT TAAGTCTGGT CGTGCAGGCC 
ACCACGTTAA ACCAACAACT ACTGGAAGAA GAGCGCGAGC AGTTGCTGAG TGACGTTCAG 
GAACGGATGA CGCTGAGCGG GCAACTGGAA CCGACGCTGG CGGAAAATGA TAATGCCGCA 
GGCCGCCTGT GGGATATGAG CGCGGGCCAG CTTAAACGTG GTGATTATCA ACTGATCGTA 
AAATACGGCG AATTTCTCGC CGCCCAGCCG GAGCTAATGC AACTGGCGGA ACAACTGGGA 
CGTTCGCGGG AAGCCAAATC GGTACCGAAA AAAGACGCGC CGATGGAAAC CTTTCGTACA 
CTGGTACGCG AACCCGCTAC GGTGCCGGAG CAGGTTGACG GTATTCAGCA AGGCGATGAT 
ATTCTGCGCC TGTTGCCGCC AGAGCTGGCG ACGCTCGGCA TCACCGAGCT GGAATATGAA 
TTCTACCGCC GGTTAGTGGA AAAACAGCTC CTCACCTATC GCCTGCATGG CGAAGCGTGG 
CGTGAGAAAG TGACCGAACG GCCGGTAGTA CACCAGGATG TCGACGAGCA GCCGCGCGGA 
CCGTTTATTG TCTGCGTCGA TACTTCAGGC TCGATGGGAG GATTTAACGA GCAGTGCGCA 
AAAGCGTTCT GCCTGGCGTT GATGCGCGTT GCGCTGGCGG ATAACCGCCG CTGCTTTATT 
ATGCTGTTTT CCACTGACGT TGTGCGCTAT GAACTCTCCG GCCCGGAAGG TATCGAGCAG 
GCCATCCGCT TTTTAAGTCA ACGTTTTCGC GGCGGCACGG ATATCGCCAG CTGTTTTCGC 
GCCATTATTG AAAGAATGCA GGGACGGGAA TGGTTTGATG CCGATGCGGT GGTCATTTCG 
GATTTTATCG CCCAGCGCTT GCCGGATGAC GTGGTGAGCA AAGTGGGAGA GTTGCAGCGT 
CTTCACCAGC ATCGATTCCA TGCGGTGGCG ATGTCGGCGC ACGGCAAACC CGGCATCATG 
CGCATTTTCG ATCATATCTG GCGCTTTGAC ACCGGGATGC GAAGCCGCCT GCTGAGACGC 
TGGCGGCGCT AA

Protein sequence

MLTLDTLNTM LAVSEEGMVE EMILALLASP QLVIFFEKFP RLKNAVTADL PRWREALRSR 
LKDARVPPEL TEEVMCYQQS QLLSTPQFIV QLPQILALLH RLHSPYAAQA KQLTESNSTF 
TPALHTLFLQ RWRLSLVVQA TTLNQQLLEE EREQLLSDVQ ERMTLSGQLE PTLAENDNAA 
GRLWDMSAGQ LKRGDYQLIV KYGEFLAAQP ELMQLAEQLG RSREAKSVPK KDAPMETFRT 
LVREPATVPE QVDGIQQGDD ILRLLPPELA TLGITELEYE FYRRLVEKQL LTYRLHGEAW 
REKVTERPVV HQDVDEQPRG PFIVCVDTSG SMGGFNEQCA KAFCLALMRV ALADNRRCFI 
MLFSTDVVRY ELSGPEGIEQ AIRFLSQRFR GGTDIASCFR AIIERMQGRE WFDADAVVIS 
DFIAQRLPDD VVSKVGELQR LHQHRFHAVA MSAHGKPGIM RIFDHIWRFD TGMRSRLLRR 
WRR