Gene EcSMS35_1621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1621
Symbol	ydfJ
ID	6146155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1610990
End bp	1612357
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	47%
IMG OID	641616497
Product	inner membrane metabolite transport protein ydfJ
Protein accession	YP_001743675
Protein GI	170680764
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00883] metabolite-proton symporter

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00533306
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	73
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAATAG AAAAACACGA AAGAAGCACT AAGGATTTGG TGAAAGCAGC AGTATCGGGA 
TGGCTGGGCA CTGCGCTTGA ATTTATGGAT TTCCAGTTAT ATTCGCTCGG CGCAGCGTTA 
GTGTTTCATG AAATATTTTT TCCTGAATCA TCAACGGCAA TGGCGTTAAT TCTGGCAATG 
GGAACCTACG GTGCAGGTTA TGTGGCGCGT ATTGTCGGAG CATTTATTTT CGGCAAAATG 
GGCGACAGAA TCGGGCGTAA AAAAGTGCTC TTTATTACCA TAACTATGAT GGGGATCTGT 
ACCACCTTAA TTGGTGTGCT GCCGACCTAT GCACAAATTG GTGTGTTTGC GCCAATTTTG 
CTGGTGACGC TGCGTATTAT TCAGGGGCTG GGGGCAGGCG CGGAAATTTC CGGTGCCGGT 
ACGATGCTGG CGGAATATGC GCCAAAAGGT AAGCGCGGAA TTATCTCCTC ATTTGTTGCT 
ATGGGGACTA ACTGCGGAAC CTTGAGCGCA ACGGCAATCT GGGCCTTTAT GTTCTTCATT 
CTCAGTAAAG AGGAACTGTT GGCGTGGGGA TGGCGTATAC CGTTCCTGGC GAGCGTTGTC 
GTGATGGTCT TTGCTATCTG GTTGCGTATG AATCTGAAAG AAAGCCCGGT CTTTGAGAAG 
GTTAACGACA GCAACCAACC TACAGCAAAA CCTGCACCTG CTGGTAGCAT GTTCCAGAGC 
AAATCCTTCT GGCTGGCAAC AGGGCTGCGT TTTGGTCAGG CTGGTAACTC AGGTTTAATT 
CAGACTTTCC TTGCAGGCTA TTTAGTGCAG ACGTTATTGT TTAACAAAGC AATTCCAACA 
GATGCATTGA TGATCAGTTC GATTCTCGGC TTTATGACCA TTCCGTTCCT TGGTTGGTTA 
TCCGATAAAA TTGGTCGCCG GATCCCGTAT ATTATTATGA ATACCTCTGC GATTGTGCTG 
GCATGGCCAA TGCTTTCTAT CATCGTAGAT AAAAGCTATG CCCCGAGCAC CATTATGGTT 
GCACTGATTG TGATTCATAA CTGTGCGGTG CTGGGATTAT TTGCTCTGGA AAACATTACC 
ATGGCAGAAA TGTTCGGCTG TAAAAACCGC TTTACCCGGA TGGCCATTTC TAAAGAAATT 
GGTGGTCTTA TCGCTTCCGG TTTTGGTCCT ATCCTGGCGG GTATTTTCTG CACCATGACG 
GAATCCTGGT ATCCGATCGC AATTATGATC ATGGCATATT CAGTGATTGG TTTAATTTCT 
GCGCTGAAAA TGCCAGAAGT GAAAGACCGT GATTTAAGTG CGCTGGAAGA CGCTGCGGAA 
GATCAACCGC ATGTTGTCAG AGCTGCGCAA CCTTCCAGAA GTCTTTAA

Protein sequence

MTIEKHERST KDLVKAAVSG WLGTALEFMD FQLYSLGAAL VFHEIFFPES STAMALILAM 
GTYGAGYVAR IVGAFIFGKM GDRIGRKKVL FITITMMGIC TTLIGVLPTY AQIGVFAPIL 
LVTLRIIQGL GAGAEISGAG TMLAEYAPKG KRGIISSFVA MGTNCGTLSA TAIWAFMFFI 
LSKEELLAWG WRIPFLASVV VMVFAIWLRM NLKESPVFEK VNDSNQPTAK PAPAGSMFQS 
KSFWLATGLR FGQAGNSGLI QTFLAGYLVQ TLLFNKAIPT DALMISSILG FMTIPFLGWL 
SDKIGRRIPY IIMNTSAIVL AWPMLSIIVD KSYAPSTIMV ALIVIHNCAV LGLFALENIT 
MAEMFGCKNR FTRMAISKEI GGLIASGFGP ILAGIFCTMT ESWYPIAIMI MAYSVIGLIS 
ALKMPEVKDR DLSALEDAAE DQPHVVRAAQ PSRSL