Gene EcolC_4110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4110
Symbol
ID	6065918
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4534775
End bp	4535809
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	52%
IMG OID	641603532
Product	rhamnose-proton symporter
Protein accession	YP_001727035
Protein GI	170022081
COG category
COG ID
TIGRFAM ID	[TIGR00776] RhaT L-rhamnose-proton symporter family protein

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAACG CGATTACGAT GGGGATATTT TGGCATTTGA TCGGCGCGGC CAGTGCAGCC 
TGTTTTTACG CTCCGTTCAA AAAAGTAAAA AAATGGTCAT GGGAAACCAT GTGGTCAGTC 
GGTGGGATTG TTTCGTGGAT TATTCTGCCG TGGGCCATCA GCGCCCTGTT ACTACCGAAT 
TTCTGGGCGT ATTACAGCTC GTTTAGTCTC TCTACGCTAC TGCCTGTTTT TCTGTTCGGC 
GCTATGTGGG GGATCGGTAA TATCAACTAC GGCCTGACCA TGCGTTATCT CGGCATGTCG 
ATGGGAATTG GCATCGCCAT TGGCATTACG TTGATTGTCG GTACGCTGAT GACGCCAATT 
ATCAACGGCA ATTTCGATGT GTTGATTAGC ACCGAAGGCG GACGCATGAC GTTGCTCGGC 
GTTCTGGTGG CGCTGATTGG CGTAGGGATT GTAACTCGCG CCGGGCAGTT GAAAGAGCGC 
AAGATGGGCA TTAAAGCCGA AGAGTTCAAT CTGAAAAAAG GGCTGGTGCT GGCGGTGATG 
TGCGGCATTT TCTCTGCCGG GATGTCCTTT GCGATGAACG CCGCAAAACC GATGCATGAA 
GCCGCTGCCG CACTTGGCGT CGATCCACTG TATGTCGCTC TGCCAAGCTA TGTTGTCATC 
ATGGGCGGCG GCGCGATCAT TAACCTCGGT TTCTGTTTTA TTCGTCTGGC AAAAGTGAAG 
GATTTGTCGC TAAAAGCCGA CTTCTCGCTG GCAAAATCGC TGATCATTCA CAATGTGTTA 
CTCTCGACAC TGGGCGGGTT GATGTGGTAT CTGCAATTCT TTTTCTATGC CTGGGGCCAC 
GCCCCCATTC CGGCGCAGTA TGACTACATC AGTTGGATGC TGCATATGAG TTTCTATGTA 
TTGTGCGGCG GTATCGTCGG GCTGGTGCTG AAAGAGTGGA ACAATGCAGG ACGCCGTCCG 
GTAACGGTGT TGAGCCTCGG TTGTGTGGTG ATTATTGTCG CCGCTAACAT CGTCGGCATC 
GGCATGGCGA ATTAA

Protein sequence

MSNAITMGIF WHLIGAASAA CFYAPFKKVK KWSWETMWSV GGIVSWIILP WAISALLLPN 
FWAYYSSFSL STLLPVFLFG AMWGIGNINY GLTMRYLGMS MGIGIAIGIT LIVGTLMTPI 
INGNFDVLIS TEGGRMTLLG VLVALIGVGI VTRAGQLKER KMGIKAEEFN LKKGLVLAVM 
CGIFSAGMSF AMNAAKPMHE AAAALGVDPL YVALPSYVVI MGGGAIINLG FCFIRLAKVK 
DLSLKADFSL AKSLIIHNVL LSTLGGLMWY LQFFFYAWGH APIPAQYDYI SWMLHMSFYV 
LCGGIVGLVL KEWNNAGRRP VTVLSLGCVV IIVAANIVGI GMAN