Gene EcDH1_3345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3345
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	3595426
End bp	3596853
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	54%
IMG OID
Product	amino acid permease-associated region
Protein accession	ACX40965
Protein GI	260450543
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCATAC GTTTAGAAGG TTATATGCAA ACAACACAAC AAAATGCGCC ACTGAAGCGC 
ACAATGAAAA CGCGTCACCT GATTATGCTT TCCTTGGGCG GCGTGATTGG CACAGGATTA 
TTCTTCAATA CCGGGTACAT CATTTCCACC ACTGGAGCGG CGGGAACGCT GCTGGCCTAT 
CTGATTGGTG CGCTGGTGGT CTGGCTGGTT ATGCAGTGTC TGGGCGAGCT GTCGGTCGCG 
ATGCCGGAGA CCGGAGCGTT TCACGTTTAT GCCGCGCGCT ATCTTGGTCC GGCTACCGGG 
TATACCGTGG CCTGGCTTTA CTGGCTGACC TGGACCGTGG CGCTGGGTTC GAGCTTTACC 
GCCGCTGGAT TCTGTATGCA GTACTGGTTT CCACAGGTGC CGGTATGGGT CTGGTGCGTG 
GTGTTCTGCG CGATTATTTT TGGTCTGAAT GTTATCTCCA CGCGCTTTTT TGCCGAAGGG 
GAGTTCTGGT TCTCGCTGGT CAAAGTGGTC ACTATCATCG CCTTTATCAT CCTCGGTGGG 
GCGGCGATTT TCGGCTTTAT TCCGATGCAG GATGGCTCGC CCGCGCCGGG GCTGAGTAAT 
ATCACGGCAG AAGGCTGGTT CCCGCACGGT GGCTTACCGA TTTTGATGAC TATGGTGGCA 
GTGAACTTTG CTTTTTCGGG TACCGAGCTT ATCGGCATTG CCGCCGGTGA AACGGAAAAC 
CCGCGCAAAG TTATCCCGGT AGCGATTCGT ACTACCATCG CGCGACTGAT TATTTTCTTT 
ATCGGCACCG TGTTTGTGCT GGCAGCGCTG ATCCCGATGC AGCAGGTGGG CGTGGAGAAA 
AGCCCGTTTG TGCTGGTATT TGAGAAAGTA GGGATCCCGT ACGCCGCTGA TATTTTTAAC 
TTCGTGATCC TGACGGCTAT TCTTTCTGCA GCGAACTCCG GGTTATATGC CTCCGGGCGC 
ATGCTGTGGT CGTTGTCGAA TGAACGTACG CTACCGGCCT GTTTTGCGCG AGTAACGAAA 
AACGGCGTGC CACTGACGGC GCTGTCGGTC AGTATGCTCG GTGGTGTGCT GGCGCTGTTT 
TCCAGCGTGG TGGCCCCGGA CACGGTATTT GTTGCGCTGT CGGCAATCTC CGGGTTTGCG 
GTGGTAGCGG TGTGGCTGAG TATCTGCGCC TCGCATTTTG TTTTTCGTCG CCGTCATCTG 
CAACAAGGTA AGGCATTGAG TGAATTACAT TATCGCGCGC CGTGGTATCC GCTGGTGCCA 
GTATTAGGTT TTGTGCTGTG CCTGGTGGCC TGTGTTGGGC TGGCATTCGA TCCAGCGCAG 
AGAATTGCGT TGTGGTGCGG GTTACCGTTT GTTGCGTTGT GCTATGGTGC TTATTTCCTT 
ACTCAACCCC GAAACGCAAA ACAGGAGCCA GAACATGTCG CAGAATAA

Protein sequence

MSIRLEGYMQ TTQQNAPLKR TMKTRHLIML SLGGVIGTGL FFNTGYIIST TGAAGTLLAY 
LIGALVVWLV MQCLGELSVA MPETGAFHVY AARYLGPATG YTVAWLYWLT WTVALGSSFT 
AAGFCMQYWF PQVPVWVWCV VFCAIIFGLN VISTRFFAEG EFWFSLVKVV TIIAFIILGG 
AAIFGFIPMQ DGSPAPGLSN ITAEGWFPHG GLPILMTMVA VNFAFSGTEL IGIAAGETEN 
PRKVIPVAIR TTIARLIIFF IGTVFVLAAL IPMQQVGVEK SPFVLVFEKV GIPYAADIFN 
FVILTAILSA ANSGLYASGR MLWSLSNERT LPACFARVTK NGVPLTALSV SMLGGVLALF 
SSVVAPDTVF VALSAISGFA VVAVWLSICA SHFVFRRRHL QQGKALSELH YRAPWYPLVP 
VLGFVLCLVA CVGLAFDPAQ RIALWCGLPF VALCYGAYFL TQPRNAKQEP EHVAE