Gene EcHS_A1121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1121
Symbol
ID	5595295
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1130809
End bp	1132137
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	54%
IMG OID	640920284
Product	putative purine permease ycdG
Protein accession	YP_001457848
Protein GI	157160530
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG2233] Xanthine/uracil permeases
TIGRFAM ID	[TIGR00801] uracil-xanthine permease [TIGR03616] pyrimidine utilization transport protein G

Plasmid Coverage information

Num covering plasmid clones	64
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAATGT TCGGTCTTCC TCACTGGCAG TTAAAATCGA CCTCTACAGA GAGCGGCGTG 
GTCGCGCCGG ATGAACGATT GCCGTTTGCT CAGACGGCAA TAATGGGCGT TCAACACGCG 
GTGGCGATGT TTGGCGCGAC GGTGTTAATG CCGATTCTGA TGGGGCTGGA TCCCAATCTT 
TCCATTTTAA TGTCGGGGAT CGGCACATTA CTGTTTTTCT TTATTACCGG CGGGCGCGTC 
CCCAGTTATC TCGGTTCCAG CGCGGCTTTT GTCGGCGTGG TGATTGCCGC GACGGGCTTT 
AACGGTCAGG GCATTAACCC GAATATCAGC ATTGCGCTGG GCGGGATTAT CGCCTGTGGG 
CTGGTTTATA CCGTCATTGG CCTGGTGGTG ATGAAAATCG GTACACGCTG GATTGAACGG 
CTAATGCCGC CGGTGGTGAC GGGTGCGGTG GTGATGGCGA TTGGCCTGAA CTTAGCGCCT 
ATCGCAGTGA AAAGTGTATC GGCTTCGGCC TTTGATAGCT GGATGGCGGT AATGACGGTG 
CTGTGTATTG GGCTGGTGGC GGTGTTTACC CGTGGCATGA TCCAGCGATT ATTGATTCTC 
GTAGGATTAA TTGTCGCCTG TCTGCTGTAT GGCGTGATGA CCAACGTTTT AGGGCTGGGA 
AAAGCCGTCG ATTTTACTCT CGTCAGCCAT GCTGCCTGGT TCGGTTTGCC ACATTTTTCC 
ACTCCTGCTT TTAATGGTCA GGCAATGATG CTGATTGCGC CCGTGGCGGT GATTCTGGTG 
GCGGAAAACT TAGGCCATCT CAAGGCGGTC GCCGGGATGA CCGGACGCAA TATGGATCCA 
TATATGGGAC GGGCATTCGT CGGTGATGGG CTGGCGACGA TGCTTTCTGG TTCTGTCGGT 
GGCAGCGGCG TAACCACCTA CGCCGAGAAT ATCGGTGTAA TGGCCGTGAC AAAAGTCTAC 
TCGACGCTGG TGTTTGTCGC TGCTGCCGCC ATCGCCATGC TGTTGGGCTT TTCACCGAAA 
TTTGGCGCGC TGATTCATAC CATTCCGGCC GCGGTGATTG GTGGTGCATC AATTGTTGTG 
TTCGGGCTGA TTGCCGTCGC AGGCGCAAGG ATCTGGGTAC AAAACCGTGT CGATTTAAGC 
CAGAACGGTA ATTTGATTAT GGTCGCAGTA ACCTTAGTGC TGGGCGCGGG TGATTTTGCT 
CTCACGCTGG GCGGTTTTAC GTTGGGAGGG ATTGGTACAG CAACCTTTGG CGCGATTTTA 
CTCAATGCGT TGTTAAGCAG AAAGTTGGTT GACGTTCCAC CGCCAGAAGT TGTTCATCAG 
GAGCCATAA

Protein sequence

MAMFGLPHWQ LKSTSTESGV VAPDERLPFA QTAIMGVQHA VAMFGATVLM PILMGLDPNL 
SILMSGIGTL LFFFITGGRV PSYLGSSAAF VGVVIAATGF NGQGINPNIS IALGGIIACG 
LVYTVIGLVV MKIGTRWIER LMPPVVTGAV VMAIGLNLAP IAVKSVSASA FDSWMAVMTV 
LCIGLVAVFT RGMIQRLLIL VGLIVACLLY GVMTNVLGLG KAVDFTLVSH AAWFGLPHFS 
TPAFNGQAMM LIAPVAVILV AENLGHLKAV AGMTGRNMDP YMGRAFVGDG LATMLSGSVG 
GSGVTTYAEN IGVMAVTKVY STLVFVAAAA IAMLLGFSPK FGALIHTIPA AVIGGASIVV 
FGLIAVAGAR IWVQNRVDLS QNGNLIMVAV TLVLGAGDFA LTLGGFTLGG IGTATFGAIL 
LNALLSRKLV DVPPPEVVHQ EP