Gene EcDH1_3785 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3785
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	4083305
End bp	4084717
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	53%
IMG OID
Product	amino acid permease-associated region
Protein accession	ACX41388
Protein GI	260450966
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00000255253
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAGATC AGGTAAAAGT CGTTGCCGAT GATCAGGCTC CGGCTGAACA GTCGCTACGG 
CGCAATCTCA CAAACCGACA TATTCAGCTT ATTGCCATTG GCGGTGCCAT TGGTACGGGG 
TTGTTTATGG GGTCTGGCAA AACGATTAGC CTTGCCGGGC CGTCGATCAT TTTCGTTTAT 
ATGATCATTG GTTTTATGCT CTTTTTCGTG ATGCGGGCAA TGGGGGAATT GCTGCTTTCG 
AATCTGGAAT ACAAATCTTT TAGTGACTTC GCTTCCGATT TACTCGGGCC GTGGGCAGGA 
TATTTCACCG GCTGGACTTA CTGGTTCTGC TGGGTTGTAA CCGGTATGGC AGACGTGGTG 
GCGATCACGG CTTATGCTCA GTTCTGGTTC CCCGATCTCT CCGACTGGGT CGCCTCGCTG 
GCGGTGATAG TGCTGCTGCT GACGCTCAAT CTCGCCACCG TGAAAATGTT CGGTGAGATG 
GAGTTCTGGT TTGCGATGAT CAAAATCGTC GCCATTGTGT CGCTGATTGT CGTCGGCCTG 
GTCATGGTGG CGATGCACTT TCAGTCACCG ACTGGTGTGG AAGCGTCATT CGCGCATTTG 
TGGAATGACG GCGGCTGGTT CCCGAAAGGT TTAAGTGGCT TCTTTGCCGG ATTCCAGATA 
GCGGTTTTCG CTTTCGTGGG GATTGAGCTG GTAGGTACAA CAGCTGCGGA AACCAAAGAT 
CCAGAGAAAT CACTGCCACG CGCGATTAAC TCCATTCCGA TCCGTATCAT TATGTTCTAC 
GTCTTCGCGC TGATTGTGAT TATGTCCGTG ACGCCGTGGA GTTCGGTAGT CCCGGAGAAA 
AGCCCGTTTG TTGAACTGTT CGTGTTGGTA GGGCTGCCTG CTGCCGCAAG CGTGATCAAC 
TTTGTGGTGC TGACCTCTGC GGCGTCTTCC GCTAACAGCG GCGTCTTCTC TACCAGCCGT 
ATGCTGTTTG GTCTGGCGCA GGAAGGTGTG GCACCGAAAG CGTTCGCTAA ACTTTCTAAG 
CGCGCAGTAC CCGCGAAAGG GCTGACGTTC TCGTGTATCT GTCTGCTCGG CGGCGTGGTG 
ATGTTGTATG TGAATCCTAG TGTGATTGGC GCGTTCACGA TGATTACAAC CGTTTCCGCG 
ATTCTGTTTA TGTTCGTCTG GACGATTATC CTTTGCTCGT ACCTTGTGTA TCGCAAACAG 
CGTCCTCATC TACATGAGAA GTCGATCTAC AAGATGCCGC TCGGCAAGCT GATGTGCTGG 
GTATGTATGG CGTTCTTTGT GTTCGTGGTC GTGTTGCTGA CACTGGAAGA TGACACTCGC 
CAGGCGCTGC TGGTTACCCC GCTGTGGTTT ATCGCGCTGG GGTTGGGCTG GCTGTTTATT 
GGTAAGAAGC GGGCTGCTGA ACTGCGGAAA TAA

Protein sequence

MVDQVKVVAD DQAPAEQSLR RNLTNRHIQL IAIGGAIGTG LFMGSGKTIS LAGPSIIFVY 
MIIGFMLFFV MRAMGELLLS NLEYKSFSDF ASDLLGPWAG YFTGWTYWFC WVVTGMADVV 
AITAYAQFWF PDLSDWVASL AVIVLLLTLN LATVKMFGEM EFWFAMIKIV AIVSLIVVGL 
VMVAMHFQSP TGVEASFAHL WNDGGWFPKG LSGFFAGFQI AVFAFVGIEL VGTTAAETKD 
PEKSLPRAIN SIPIRIIMFY VFALIVIMSV TPWSSVVPEK SPFVELFVLV GLPAAASVIN 
FVVLTSAASS ANSGVFSTSR MLFGLAQEGV APKAFAKLSK RAVPAKGLTF SCICLLGGVV 
MLYVNPSVIG AFTMITTVSA ILFMFVWTII LCSYLVYRKQ RPHLHEKSIY KMPLGKLMCW 
VCMAFFVFVV VLLTLEDDTR QALLVTPLWF IALGLGWLFI GKKRAAELRK