Gene SeD_A1853 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1853
Symbol
ID	6871629
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	1794145
End bp	1795398
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	55%
IMG OID	642784983
Product	inner membrane transport protein YnfM
Protein accession	YP_002215651
Protein GI	198241768
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTCGTA CAACTATTCT CGATGACGCC ACGGCGAGCG ATATCGATGA ACAACGCCAT 
TCTCAGCCGG TTCAATTTAT TAAACGCGGT ACAGCGCCTT TCATGCGCGT CACGCTGGCC 
CTTTTTTCCG CGGGCCTGGC GACTTTCGCG CTCCTTTATT GCGTTCAGCC TATACTACCG 
GTACTTTCCC AGGAGTTTGG CGTCTCCCCC GCCAGCAGCA GCGTTTCACT TTCTATTTCT 
ACCGCCATGC TGGCTATCGG CTTACTTTTT ACCGGCCCGC TTTCTGATGC GATAGGCCGT 
AAACCGGTGA TGGTCACCGC CTTGTTATTA GCCTCCTGCT GCACATTGTT ATCAACCATG 
ATGACCAGCT GGCATGGTAT TCTGATTATG CGCGCGCTGA TCGGTCTGTC GTTAAGCGGC 
GTCGCCGCGG TGGGAATGAC CTACCTGAGC GAAGAAATCC ATCCCAGCTT TGTCGCTTTC 
TCTATGGGGC TTTATATTAG CGGTAATTCC ATCGGCGGGA TGAGCGGGCG TTTATTAAGC 
GGCGTCATGA CCGACTTTTT TAACTGGCGC ATCGCGCTGG CGGCCATCGG ATGCTTTGCG 
CTGGCGTCCG CGCTGATGTT CTGGAAGATT TTACCCGCCT CGCAACATTT CCGTCCCACG 
TCGCTACGGC CTAAAACGCT ATTTATTAAT TTCCGTCTCC ACTGGCGCGA TCGGGGGTTA 
CCTCTACTGT TTGCAGAAGG TTTTTTACTG ATGGGCGCGT TCGTCACCCT GTTTAACTAC 
ATTGGTTATC GCCTGATGCT CTCCCCCTGG GAATTAAGCC AGGCCGTGGT CGGACTGTTA 
TCCGTAGCCT ATCTCACCGG CACATGGAGC TCGCCGAAAG CTGGCGCCAT GACCTCACGC 
TATGGCCGGG GGCCGGTGAT GCTGTTCTCT ACCGCAGTAA TGCTGGGTGG GCTTTTACTG 
ACGCTTTTTA CCTCGCTTTG GCTGATTTTT GCTGGGATGC TGCTTTTTTC CGCCGGCTTT 
TTCGCCGCGC ACTCCGTGGC CAGTAGCTGG ATTGGCCCGC GTGCGCGTCG GGCGAAGGGA 
CAGGCCTCGT CACTTTATCT TTTCAGCTAT TATCTGGGGT CCAGTATTGC CGGGACGCTA 
GGCGGTGTAT TCTGGCATAG TTACGGCTGG AACGGCGTAG GTGGTTTTAT CGCGCTAATG 
CTGGTGCTGG CCATCCTGGT CGGGACGCGG TTACATCACC GTCTTCATGC CTGA

Protein sequence

MSRTTILDDA TASDIDEQRH SQPVQFIKRG TAPFMRVTLA LFSAGLATFA LLYCVQPILP 
VLSQEFGVSP ASSSVSLSIS TAMLAIGLLF TGPLSDAIGR KPVMVTALLL ASCCTLLSTM 
MTSWHGILIM RALIGLSLSG VAAVGMTYLS EEIHPSFVAF SMGLYISGNS IGGMSGRLLS 
GVMTDFFNWR IALAAIGCFA LASALMFWKI LPASQHFRPT SLRPKTLFIN FRLHWRDRGL 
PLLFAEGFLL MGAFVTLFNY IGYRLMLSPW ELSQAVVGLL SVAYLTGTWS SPKAGAMTSR 
YGRGPVMLFS TAVMLGGLLL TLFTSLWLIF AGMLLFSAGF FAAHSVASSW IGPRARRAKG 
QASSLYLFSY YLGSSIAGTL GGVFWHSYGW NGVGGFIALM LVLAILVGTR LHHRLHA