Gene EcDH1_1497 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1497
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	1622714
End bp	1623964
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	50%
IMG OID
Product	nucleoside transporter
Protein accession	ACX39167
Protein GI	260448745
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0000293356
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATGTCA TGAGAAGTGT TCTGGGAATG GTGGTATTGC TGACGATTGC GTTTTTACTG 
TCAGTAAACA AGAAGAAGAT CAGCCTGCGT ACCGTTGGCG CGGCGTTAGT GTTACAGGTC 
GTGATTGGCG GCATTATGCT TTGGTTACCG CCAGGGCGTT GGGTCGCTGA AAAAGTCGCT 
TTTGGCGTGC ATAAAGTGAT GGCGTACAGC GACGCGGGTA GCGCATTTAT CTTCGGTTCT 
CTGGTCGGAC CGAAAATGGA TACCTTATTT GATGGTGCAG GATTTATCTT TGGTTTCAGG 
GTGTTACCGG CAATTATCTT CGTCACCGCG CTGGTGAGTA TTCTCTACTA CATCGGTGTG 
ATGGGGATTT TAATTCGAAT TCTCGGCGGT ATCTTCCAGA AAGCATTAAA TATCAGCAAG 
ATCGAGTCAT TCGTCGCGGT CACCACCATT TTCCTCGGGC AAAACGAAAT TCCGGCAATC 
GTCAAACCCT TTATCGATCG TCTGAATCGC AATGAATTAT TTACAGCGAT TTGTAGTGGC 
ATGGCCTCGA TTGCTGGTTC GACAATGATT GGTTACGCCG CACTGGGCGT GCCTGTGGAA 
TATCTGCTGG CGGCATCATT AATGGCGATC CCTGGCGGGA TCTTGTTTGC CCGCCTGTTA 
AGCCCGGCAA CGGAATCTTC GCAGGTTTCC TTTAATAACC TCTCTTTCAC CGAAACACCG 
CCAAAAAGCA TTATTGAAGC CGCTGCGACA GGGGCAATGA CCGGGCTGAA AATCGCCGCA 
GGTGTGGCAA CAGTGGTGAT GGCATTTGTT GCAATAATTG CGTTGATTAA CGGTATTATC 
GGCGGCGTTG GTGGCTGGTT TGGTTTTGAA CATGCCTCGC TGGAGTCCAT TTTAGGTTAC 
CTGCTGGCTC CACTGGCGTG GGTGATGGGT GTGGACTGGA GTGATGCGAA TCTTGCCGGG 
AGTTTGATTG GACAGAAACT GGCAATAAAT GAATTTGTCG CTTATCTCAA TTTCTCACCC 
TATCTGCAAA CGGCTGGCAC TCTCGATGCT AAAACTGTGG CGATTATTTC CTTCGCGTTG 
TGCGGTTTCG CTAACTTTGG TTCTATCGGG GTGGTGGTGG GGGCGTTTTC TGCGGTTGCG 
CCACACCGTG CGCCGGAAAT CGCCCAGCTT GGTTTACGGG CGCTGGCGGC GGCGACGCTT 
TCCAACTTGA TGAGTGCGAC CATTGCCGGG TTCTTTATTG GTTTAGCTTG A

Protein sequence

MDVMRSVLGM VVLLTIAFLL SVNKKKISLR TVGAALVLQV VIGGIMLWLP PGRWVAEKVA 
FGVHKVMAYS DAGSAFIFGS LVGPKMDTLF DGAGFIFGFR VLPAIIFVTA LVSILYYIGV 
MGILIRILGG IFQKALNISK IESFVAVTTI FLGQNEIPAI VKPFIDRLNR NELFTAICSG 
MASIAGSTMI GYAALGVPVE YLLAASLMAI PGGILFARLL SPATESSQVS FNNLSFTETP 
PKSIIEAAAT GAMTGLKIAA GVATVVMAFV AIIALINGII GGVGGWFGFE HASLESILGY 
LLAPLAWVMG VDWSDANLAG SLIGQKLAIN EFVAYLNFSP YLQTAGTLDA KTVAIISFAL 
CGFANFGSIG VVVGAFSAVA PHRAPEIAQL GLRALAAATL SNLMSATIAG FFIGLA