Gene EcDH1_3102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3102
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	3331868
End bp	3333322
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	47%
IMG OID
Product	NCS1 nucleoside transporter family
Protein accession	ACX40728
Protein GI	260450306
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACATC AGAGAAAACT ATTCCAGCAA CGCGGCTATA GCGAAGATCT ATTGCCGAAA 
ACGCAAAGCC AGCGGACCTG GAAAACATTT AACTATTTTA CCTTATGGAT GGGTTCGGTT 
CATAACGTTC CCAATTATGT GATGGTCGGC GGCTTTTTTA TTCTCGGCTT GTCTACCTTT 
AGTATTATGC TGGCAATTAT CCTCAGCGCC TTTTTCATTG CCGCGGTAAT GGTATTAAAC 
GGTGCTGCGG GCAGTAAATA CGGTGTGCCT TTTGCCATGA TCCTGCGTGC TTCTTACGGT 
GTACGTGGTG CACTGTTTCC CGGATTATTA AGGGGCGGAA TTGCCGCCAT CATGTGGTTT 
GGTTTGCAAT GTTACGCGGG GTCACTGGCC TGCTTGATTC TGATTGGCAA AATCTGGCCG 
GGATTTTTAA CTCTCGGTGG TGATTTCACT CTGTTAGGCC TTTCTCTACC GGGCTTAATT 
ACTTTCTTAA TCTTCTGGCT GGTCAACGTT GGTATAGGTT TTGGCGGTGG CAAAGTTTTA 
AATAAATTCA CTGCCATTCT TAACCCGTGC ATCTATATCG TTTTCGGCGG TATGGCGATT 
TGGGCGATTT CACTGGTCGG GATCGGTCCA ATCTTTGACT ACATTCCGAG CGGTATTCAG 
AAAGCAGAAA ACGGTGGCTT CCTGTTCCTG GTGGTGATTA ACGCGGTAGT TGCGGTCTGG 
GCGGCACCGG CGGTGAGCGC ATCCGACTTT ACGCAAAACG CCCACTCGTT TCGTGAGCAG 
GCGCTGGGGC AAACGCTGGG TTTAGTTGTG GCCTATATTC TGTTTGCGGT CGCCGGGGTA 
TGTATTATTG CCGGAGCCAG TATTCACTAC GGCGCTGATA CCTGGAACGT GCTGGATATT 
GTTCAGCGTT GGGACAGCCT GTTCGCCTCG TTCTTTGCGG TACTGGTTAT TCTGATGACA 
ACTATCTCCA CTAACGCGAC CGGTAATATT ATTCCAGCCG GTTATCAGAT TGCCGCCATT 
GCACCGACAA AACTGACCTA TAAAAACGGC GTACTGATTG CCAGTATTAT CAGCTTGCTG 
ATCTGCCCGT GGAAATTAAT GGAAAATCAG GACAGCATTT ATCTTTTCCT CGATATTATC 
GGCGGAATGC TTGGTCCGGT AATTGGTGTC ATGATGGCGC ATTATTTTGT GGTGATGCGC 
GGACAAATTA ATCTTGATGA ACTGTATACC GCACCTGGCG ATTATAAATA TTACGATAAC 
GGTTTTAACC TCACTGCGTT TTCAGTAACT CTGGTGGCCG TTATTTTATC TCTTGGCGGT 
AAGTTTATTC ACTTTATGGA ACCGTTATCG CGTGTTTCAT GGTTTGTCGG CGTCATCGTC 
GCCTTTGCGG CCTACGCCTT ATTAAAGAAA CGTACAACAG CAGAAAAAAC AGGAGAGCAA 
AAAACCATAG GTTAA

Protein sequence

MEHQRKLFQQ RGYSEDLLPK TQSQRTWKTF NYFTLWMGSV HNVPNYVMVG GFFILGLSTF 
SIMLAIILSA FFIAAVMVLN GAAGSKYGVP FAMILRASYG VRGALFPGLL RGGIAAIMWF 
GLQCYAGSLA CLILIGKIWP GFLTLGGDFT LLGLSLPGLI TFLIFWLVNV GIGFGGGKVL 
NKFTAILNPC IYIVFGGMAI WAISLVGIGP IFDYIPSGIQ KAENGGFLFL VVINAVVAVW 
AAPAVSASDF TQNAHSFREQ ALGQTLGLVV AYILFAVAGV CIIAGASIHY GADTWNVLDI 
VQRWDSLFAS FFAVLVILMT TISTNATGNI IPAGYQIAAI APTKLTYKNG VLIASIISLL 
ICPWKLMENQ DSIYLFLDII GGMLGPVIGV MMAHYFVVMR GQINLDELYT APGDYKYYDN 
GFNLTAFSVT LVAVILSLGG KFIHFMEPLS RVSWFVGVIV AFAAYALLKK RTTAEKTGEQ 
KTIG