Gene EcSMS35_2119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2119
Symbol
ID	6144652
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	2126966
End bp	2128294
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	54%
IMG OID	641616995
Product	putative purine permease ycdG
Protein accession	YP_001744170
Protein GI	170680995
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG2233] Xanthine/uracil permeases
TIGRFAM ID	[TIGR00801] uracil-xanthine permease [TIGR03616] pyrimidine utilization transport protein G

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATGT TCGGTTTTCC TCACTGGCAG TTAAAATCGA CCTCTACAGA GAGCGGCGTG 
GTCGCGCCGG ATGAACGATT GCCGTTTGCT CAGACGGCAA TAATGGGCGT TCAACACGCG 
GTGGCGATGT TTGGCGCGAC GGTGTTAATG CCTATTCTGA TGGGGCTGGA TCCCAATCTT 
TCCATTTTGA TGTCGGGGAT CGGCACGTTA CTGTTTTTCT TTATTACCGG CGGGCGCGTC 
CCCAGTTATC TCGGCTCCAG CGCGGCTTTT GTCGGCGTGG TGATTGCCGC GACGGGCTTT 
AACGGTCAGG GCATTAACCC GAATATCAGC ATTGCGCTGG GCGGGATTAT CGCCTGTGGG 
CTGGTTTATA CCGTCATTGG CCTGGTGGTG ATGAAAATCG GTACGCGCTG GATTGAACGG 
CTAATGCCGC CGGTGGTGAC GGGTGCGGTG GTGATGGCGA TTGGCCTGAA CTTAGCGCCT 
ATCGCAGTGA AAAGTGTATC GGCTTCGGCC TTTGATAGCT GGATGGCGGT AATGACGGTG 
CTGTGTATTG GGCTGGTAGC GGTATTTACC CGTGGCATGA TCCAGCGGTT ATTGATTCTC 
GTAGGATTAA TTGTCGCCTG TCTGCTGTAT GGCGTGATGA CCAACGTTTT AGGGCTGGGA 
AAAGCCGTCG ATTTTACTCT CGTCAGCCAT GCTGCCTGGT TCGGTCTGCC GCATTTTTCC 
ACTCCTGGTT TTAATAGCCA GGCGATGATG TTGATTGCGC CCGTGGCGGT GATTCTGGTG 
GCGGAAAACT TAGGTCATCT CAAGGCGGTC GCCGGGATGA CCGGACGCAA TATGGATCCG 
TATATGGGAC GGGCATTCGT CGGTGATGGT CTGGCAACGA TGCTTTCCGG CTCTGTCGGC 
GGTAGCGGCG TCACCACCTA TGCTGAAAAT ATCGGTGTGA TGGCCGTGAC CAAAGTCTAC 
TCGACGCTGG TGTTTGTTGC TGCTGCCGTC ATCGCCATGC TGTTGGGCTT TTCGCCGAAA 
TTTGGCGCGC TGATCCATAC CATTCCGGCC GCGGTGATTG GTGGTGCATC AATTGTTGTG 
TTCGGGCTGA TTGCCGTCGC AGGCGCAAGG ATCTGGGTAC AAAACCGTAT CGATTTAAGC 
CAGAACGGTA ATTTGATTAT GGTCGCAGTA ACCTTAGTGC TGGGCGCGGG TGATTTTGCT 
CTCACGCTGG GCGGTTTTAC GTTGGGAGGG ATCGGTACAG CAACCTTTGG CGCGATTTTA 
CTCAATGCGT TATTAAGCAG AAGGTTGGTT GACGTTCCAC CGCCAGAAGT TATTCATCAG 
GAGCCATAA

Protein sequence

MAMFGFPHWQ LKSTSTESGV VAPDERLPFA QTAIMGVQHA VAMFGATVLM PILMGLDPNL 
SILMSGIGTL LFFFITGGRV PSYLGSSAAF VGVVIAATGF NGQGINPNIS IALGGIIACG 
LVYTVIGLVV MKIGTRWIER LMPPVVTGAV VMAIGLNLAP IAVKSVSASA FDSWMAVMTV 
LCIGLVAVFT RGMIQRLLIL VGLIVACLLY GVMTNVLGLG KAVDFTLVSH AAWFGLPHFS 
TPGFNSQAMM LIAPVAVILV AENLGHLKAV AGMTGRNMDP YMGRAFVGDG LATMLSGSVG 
GSGVTTYAEN IGVMAVTKVY STLVFVAAAV IAMLLGFSPK FGALIHTIPA AVIGGASIVV 
FGLIAVAGAR IWVQNRIDLS QNGNLIMVAV TLVLGAGDFA LTLGGFTLGG IGTATFGAIL 
LNALLSRRLV DVPPPEVIHQ EP