Gene SeD_A4224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4224
Symbol
ID	6871798
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	4068402
End bp	4069664
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	47%
IMG OID	642787157
Product	putative permease
Protein accession	YP_002217783
Protein GI	198242407
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGATGG CCCTTACCGC CCCCCCAACC AGGAAAAGAT TTTTAATCGT TGCCTGTCTG 
TTTATTGGAA TATTTATTGC TTATCTCGAT CGCGTTAATG TTTCGGTATT AGCCGCGAAT 
GAACCCTTCT TAGCCTATAT GGGTATTGAA GGTATGCCAT TGCAAATCGG CATGATGATG 
ACCGTCTTTC TGGCCGCTTA TGGTATCGCT AACGTTGTAT TATCACCGCT TGGTGATTAT 
CTCGGCCCCA GAAAAGCAAT GATGCTTTGT ATTCTGATCT GGACTATCGC TTTAATGATT 
GGCGGAGTCG CTACATCATT CGCTCTAATT ATTATTTGCC GTATATTACT GGGCATCGGA 
GAGGGATTTT ATTATCCACT GCAAAGCGTA TTTATTAAAA ACTGGTTCCC GAAGCAGGAA 
CGCGGCAGAG CAAACGCGGC GTGGATCGTC GGCCAGTCAG TCGCTCCCGC CATTGCGATG 
CCTTTTTTCA CCTGGTGGAT AGGCACCCAC GGCTGGCGCT CCAACTTCTT TTTATGCGCC 
GCTCTTGGGT TAATCCCACT CTGGCTACTT TGGCGATATG TTGCTGATAA ACCAGAACAA 
CATAAAAGTA TCAGCGAGCA GGAACTGGCT TATATCAAAG CCGGGCAGGA AACGGAAAGC 
GCAGGCAGCA GCGAAAGTTT TATGTTGCGG GTAAAACCGG TGATTACCAA CTACAGCTAT 
TGGTTGCTGG TGCTGTGGTA TCTGTGTCTG CAATGCCTGT ACTGGGGGAT GATTACCTGG 
CTGCCGACCT ATCTAAAATC AGCCAGAGGG TTCAGTTGGG CGGAAATGGG CTGGCTGGCG 
TCGCTTCCCT TTGTCCTGTC GATATTTGCC AAAGCGGCCG CAGGCGTCTT CGTCGATAAA 
ATAGGACGCA GCGCCCCCAT ATTAATGGTA TTAATGTTTT TCGCTGGCGT CAGTATCTAT 
TTCGGCACCA TAACCGAACA TAAATATATG TCAGCGGTAC TCCTCTCCTT TGCTGTTGCT 
TTCTGTACGA TGGGTACACC CGTTGCCTGG ACGTTATTAC AGGGAATGAT ACCCGGAAAA 
TCTATTTCCG CCGCCAGCGG CGTAATGAAC GGCGTCGCCA ATGGACTCTC TTCATTATCC 
CCCGTATTTA TCGGCTTATT TATTTCTATC ACTGGAACTT ATACCGGCGG CTTACTATGC 
CTGGTTTTTA TCAGCGCTAT CGCCGTGGTA TCGGCATTAA TCTTAACGAT TAAAAAATAT 
TAA

Protein sequence

MSMALTAPPT RKRFLIVACL FIGIFIAYLD RVNVSVLAAN EPFLAYMGIE GMPLQIGMMM 
TVFLAAYGIA NVVLSPLGDY LGPRKAMMLC ILIWTIALMI GGVATSFALI IICRILLGIG 
EGFYYPLQSV FIKNWFPKQE RGRANAAWIV GQSVAPAIAM PFFTWWIGTH GWRSNFFLCA 
ALGLIPLWLL WRYVADKPEQ HKSISEQELA YIKAGQETES AGSSESFMLR VKPVITNYSY 
WLLVLWYLCL QCLYWGMITW LPTYLKSARG FSWAEMGWLA SLPFVLSIFA KAAAGVFVDK 
IGRSAPILMV LMFFAGVSIY FGTITEHKYM SAVLLSFAVA FCTMGTPVAW TLLQGMIPGK 
SISAASGVMN GVANGLSSLS PVFIGLFISI TGTYTGGLLC LVFISAIAVV SALILTIKKY