Gene SeD_A4445 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4445
Symbol
ID	6872929
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	4287851
End bp	4288885
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	53%
IMG OID	642787363
Product	rhamnose-proton symporter
Protein accession	YP_002217974
Protein GI	198244223
COG category
COG ID
TIGRFAM ID	[TIGR00776] RhaT L-rhamnose-proton symporter family protein

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	83
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAACG CGATTACGAT GGGTATTTTC TGGCATTTGA TAGGGGCGGC CAGTGCAGCC 
TGCTTCTATG CCCCGTTCAA GCAAGTGAAA CAGTGGTCAT GGGAAACCAT GTGGTCAGTG 
GGCGGCATCG TCTCATGGCT TATTCTGCCG TGGGCAATTA GCGCTCTGTT ACTGCCTGAT 
TTCTGGGCCT ATTATGGGCA GTTTAACCTC TCCACCCTTT TACCGGTTTT TCTGTTCGGC 
GCCATGTGGG GCATCGGCAA TATTAACTAC GGCCTGACCA TGCGTTATCT CGGGATGTCG 
ATGGGTATCG GCATCGCTAT CGGCATTACG CTTATCGTCG GCACGCTGAT GACGCCTATC 
ATCAACGGTA ACTTCGATGT GTTAATCCAT ACCGAAGGGG GGCGCATGAC GCTACTTGGC 
GTTTTTGTCG CGCTGATCGG CGTCGGGATT GTGACGCGCG CCGGACAGTT AAAAGAACGC 
AAAATGGGCA TTAAAGCGGA GGAGTTCAAT CTGAAGAAAG GGCTTCTGCT GGCAGTGATG 
TGCGGTATTT TCTCGGCGGG GATGTCTTTT GCCATGAACG CCGCGAAACC GATGCATGAA 
GCTGCTGCCG CGCTTGGCGT TGACCCGCTC TATGTCGCGC TGCCGAGTTA CGTGGTGATT 
ATGGGCGGCG GCGCGCTGGT GAACCTCGGT TTCTGTTTTA TCCGCCTGGC AAAAGTGCAA 
AATCTGTCGA TAAAAGCCGA CTTCTCGCTG GCAAGACCGT TGATTATCAG CAATATTCTG 
CTGTCCGCGC TTGGCGGTCT GATGTGGTAT TTACAGTTCT TTTTCTACGC CTGGGGTCAC 
GCGCGCATTC CAGCGCAATA TGACTACATG AGCTGGATGC TGCACATGAG CTTCTATGTG 
CTGTGCGGGG GGCTTGTCGG TCTGGTGCTA AAAGAGTGGA AAAATGCTGG CCGCCGTCCC 
GTTGCTGTAT TAAGCCTCGG CTGCGTGGTA ATTATTATCG CGGCGAATAT TGTCGGTTTA 
GGCATGGCCA GTTAA

Protein sequence

MSNAITMGIF WHLIGAASAA CFYAPFKQVK QWSWETMWSV GGIVSWLILP WAISALLLPD 
FWAYYGQFNL STLLPVFLFG AMWGIGNINY GLTMRYLGMS MGIGIAIGIT LIVGTLMTPI 
INGNFDVLIH TEGGRMTLLG VFVALIGVGI VTRAGQLKER KMGIKAEEFN LKKGLLLAVM 
CGIFSAGMSF AMNAAKPMHE AAAALGVDPL YVALPSYVVI MGGGALVNLG FCFIRLAKVQ 
NLSIKADFSL ARPLIISNIL LSALGGLMWY LQFFFYAWGH ARIPAQYDYM SWMLHMSFYV 
LCGGLVGLVL KEWKNAGRRP VAVLSLGCVV IIIAANIVGL GMAS