Gene EcDH1_4248 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_4248
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	4613892
End bp	4615061
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	50%
IMG OID
Product	glycoside hydrolase family 13 domain protein
Protein accession	ACX41846
Protein GI	260451424
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	57
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATAA AAATTGCTGC TTTAACGCTG GCTATTGCCA GCGGTATTTC TGCTCAGTGG 
GCCATAGCAG CGGATATGCC AGCCAGCCCG GCACCCACTA TCCCGGTGAA ACAGTATGTG 
ACTCAGGTCA ATGCCGATAA CAGCGTGACC TTTCGCTACT TTGCCCCTGG GGCAAAAAAT 
GTCTCTGTAG TGGTGGGTGT TCCGGTTCCG GACAATATTC ACCCGATGAC CAAAGACGAA 
GCAGGAGTCT GGTCGTGGCG CACACCTATC CTGAAAGGCA ACCTGTACGA GTATTTTTTC 
AATGTTGATG GTGTACGCAG CATTGATACA GGCACCGCAA TGACTAATCC TCAGCGCCAG 
GTTAACTCCA GTATGATTCT GGTGCCAGGC AGTTATCTGG ATACGCGTTC TGTTGCGCAT 
GGTGATTTGA TCGCCATAAC TTACCACTCC AACGCATTGC AATCTGAACG TCAGATGTAT 
GTCTGGACCC CGCCAGGATA CACCGGCATG GGCGAGCCTT TGCCAGTGCT CTATTTCTAT 
CACGGCTTTG GTGATACCGG ACGTTCCGCT ATCGATCAGG GGCGTATCCC GCAAATCATG 
GATAACCTGC TTGCTGAAGG GAAAATTAAA CCGATGCTGG TGGTGATCCC GGATACAGAA 
ACCGATGCGA AGGGCATTAT TCCCGAAGAT TTCGTGCCTC AGGAAAGACG TAAAGTCTTT 
TATCCGCTGA ATGCTAAAGC GGCAGATCGC GAACTGATGA ACGATATTAT CCCGCTGATT 
AGCAAGCGTT TTAATGTCCG TAAAGATGCC GATGGCCGCG CGCTGGCAGG GCTTTCACAA 
GGCGGGTACC AGGCGCTGGT TTCCGGAATG AATCATCTGG AAAGCTTTGG CTGGCTGGCC 
ACATTCAGTG GTGTTACCAC GACAACCGTA CCGGATGAAG GTGTCGCGGC CCGACTGAAC 
GATCCGGCAG CTATCAACCA GCAACTACGT AATTTTACTG TGGTTGTGGG GGATAAAGAT 
GTCGTAACCG GCAAGGATAT CGCCGGGCTG AAAACTGAGC TTGAGCAGAA AAAAATTAAC 
TTTGATTACC AGGAATATCC GGGTCTGAAC CATGAAATGG ATGTCTGGCG ACCAGCCTAT 
GCAGCCTTTG TACAGAAATT ATTTAAATAA

Protein sequence

MNIKIAALTL AIASGISAQW AIAADMPASP APTIPVKQYV TQVNADNSVT FRYFAPGAKN 
VSVVVGVPVP DNIHPMTKDE AGVWSWRTPI LKGNLYEYFF NVDGVRSIDT GTAMTNPQRQ 
VNSSMILVPG SYLDTRSVAH GDLIAITYHS NALQSERQMY VWTPPGYTGM GEPLPVLYFY 
HGFGDTGRSA IDQGRIPQIM DNLLAEGKIK PMLVVIPDTE TDAKGIIPED FVPQERRKVF 
YPLNAKAADR ELMNDIIPLI SKRFNVRKDA DGRALAGLSQ GGYQALVSGM NHLESFGWLA 
TFSGVTTTTV PDEGVAARLN DPAAINQQLR NFTVVVGDKD VVTGKDIAGL KTELEQKKIN 
FDYQEYPGLN HEMDVWRPAY AAFVQKLFK