Gene EcDH1_3928 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3928
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	4234642
End bp	4235991
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	56%
IMG OID
Product	Xanthine/uracil/vitamin C permease
Protein accession	ACX41528
Protein GI	260451106
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTACGT CATCAGCGCG TACCGGCGGT TCACTCGACG CCTGGTTTAA AATTTCACAA 
CGTGGAAGCA CTGTCCGTCA GGAAGTGGTT GCCGGGTTAA CAACGTTTCT GGCGATGGTC 
TACTCGGTCA TCGTCGTTCC AGGTATGTTG GGTAAAGCAG GCTTCCCGCC TGCGGCAGTT 
TTCGTTGCAA CCTGTCTGGT TGCCGGACTC GGTTCTATCG TGATGGGTCT GTGGGCTAAT 
CTGCCGTTGG CGATTGGTTG CGCCATCTCC CTGACAGCGT TTACCGCATT CAGCCTGGTG 
CTGGGGCAAC ATATTAGCGT ACCTGTCGCG CTGGGTGCCG TGTTCCTGAT GGGTGTGCTG 
TTTACGGTAA TTTCTGCCAC GGGTATCCGT AGCTGGATTT TGCGCAACTT GCCTCACGGT 
GTGGCGCACG GCACGGGGAT TGGTATCGGT CTGTTCCTGC TGCTCATTGC CGCTAACGGT 
GTCGGTCTGG TGATTAAAAA CCCGCTTGAT GGTCTGCCCG TTGCGCTGGG TGATTTCGCG 
ACCTTCCCGG TGATTATGTC ACTGGTAGGT CTGGCGGTGA TCATCGGCCT GGAAAAACTG 
AAAGTCCCTG GTGGCATTCT GCTGACCATT ATCGGTATCT CAATTGTCGG TTTGATCTTC 
GATCCTAACG TCCATTTCTC CGGCGTTTTC GCCATGCCTT CATTGAGCGA TGAAAACGGC 
AATTCACTGA TTGGCAGCCT GGACATTATG GGCGCGCTGA ATCCTGTAGT CCTGCCAAGC 
GTTCTGGCGC TGGTGATGAC GGCAGTATTT GATGCCACCG GAACTATCCG TGCCGTCGCC 
GGCCAGGCGA ACCTGCTGGA TAAAGATGGG CAGATCATCG ACGGTGGGAA AGCACTGACC 
ACTGACTCCA TGAGCAGCGT TTTCTCTGGC CTGGTGGGTG CGGCTCCGGC AGCGGTATAC 
ATCGAGTCTG CGGCGGGTAC GGCGGCGGGC GGTAAAACCG GTTTGACGGC TATCACCGTT 
GGCGTGCTGT TCCTCCTGAT TCTGTTCCTC TCTCCGCTCT CTTACCTCGT TCCGGGGTAT 
GCAACGGCTC CGGCGCTGAT GTACGTTGGC CTGCTGATGC TGAGCAACGT GGCGAAAATC 
GACTTTGCTG ATTTTGTTGA TGCGATGGCG GGTCTGGTTA CGGCTGTATT CATCGTGCTG 
ACCTGTAACA TCGTAACAGG CATCATGATC GGCTTCGCGA CTCTGGTGAT TGGTCGTCTG 
GTTTCCGGCG AATGGCGCAA GTTGAACATC GGTACGGTCG TTATCGCCGT GGCGCTGGTG 
ACCTTCTATG CGGGTGGCTG GGCTATCTAA

Protein sequence

MSTSSARTGG SLDAWFKISQ RGSTVRQEVV AGLTTFLAMV YSVIVVPGML GKAGFPPAAV 
FVATCLVAGL GSIVMGLWAN LPLAIGCAIS LTAFTAFSLV LGQHISVPVA LGAVFLMGVL 
FTVISATGIR SWILRNLPHG VAHGTGIGIG LFLLLIAANG VGLVIKNPLD GLPVALGDFA 
TFPVIMSLVG LAVIIGLEKL KVPGGILLTI IGISIVGLIF DPNVHFSGVF AMPSLSDENG 
NSLIGSLDIM GALNPVVLPS VLALVMTAVF DATGTIRAVA GQANLLDKDG QIIDGGKALT 
TDSMSSVFSG LVGAAPAAVY IESAAGTAAG GKTGLTAITV GVLFLLILFL SPLSYLVPGY 
ATAPALMYVG LLMLSNVAKI DFADFVDAMA GLVTAVFIVL TCNIVTGIMI GFATLVIGRL 
VSGEWRKLNI GTVVIAVALV TFYAGGWAI