Gene EcDH1_1941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1941
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	2093801
End bp	2095447
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	50%
IMG OID
Product	AMP-dependent synthetase and ligase
Protein accession	ACX39598
Protein GI	260449176
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.889751
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTGA CATTAACGTT TAACGAACAA CGTCGTGCGG CGTATCGTCA GCAAGGGTTA 
TGGGGCGATG CTTCGCTGGC CGATTACTGG CAGCAGACCG CTCGTGCGAT GCCAGACAAA 
ATTGCCGTGG TCGATAATCA TGGTGCATCG TACACCTATA GCGCGCTCGA TCACGCCGCG 
AGCTGTCTGG CAAACTGGAT GTTAGCGAAG GGTATTGAAT CAGGCGATCG CATCGCATTT 
CAACTGCCTG GCTGGTGTGA ATTTACCGTT ATCTATCTTG CCTGCCTGAA AATCGGTGCA 
GTTTCCGTGC CGCTGTTGCC TTCCTGGCGG GAAGCAGAAC TGGTGTGGGT GCTCAATAAG 
TGTCAGGCAA AAATGTTCTT TGCACCGACG TTGTTTAAAC AAACGCGTCC GGTAGATTTA 
ATCCTGCCGC TGCAAAATCA GCTTCCACAA CTACAACAAA TTGTCGGCGT GGACAAACTG 
GCTCCCGCCA CCTCTTCCCT CTCATTAAGT CAGATTATCG CCGACAATAC CTCACTGACC 
ACGGCGATAA CGACCCACGG CGATGAATTA GCTGCGGTGC TGTTTACCTC CGGAACCGAG 
GGTCTGCCAA AGGGCGTGAT GCTAACGCAT AACAATATTC TCGCCAGTGA GCGGGCTTAT 
TGCGCGCGAC TGAATCTGAC CTGGCAGGAT GTCTTTATGA TGCCTGCGCC ACTTGGTCAC 
GCAACGGGCT TTCTGCATGG CGTAACGGCA CCATTCTTAA TTGGCGCTCG CAGCGTGTTG 
TTAGATATTT TCACTCCTGA TGCGTGTCTC GCGCTGCTTG AGCAGCAGCG TTGCACCTGT 
ATGCTCGGCG CAACGCCGTT TGTCTATGAT CTTTTGAATG TACTAGAGAA ACAACCCGCG 
GACCTTTCAG CGCTGCGTTT CTTTCTTTGC GGCGGAACCA CAATCCCCAA AAAAGTGGCG 
CGTGAATGCC AGCAGCGCGG CATTAAATTA TTAAGTGTTT ATGGTTCCAC AGAAAGTTCG 
CCGCATGCGG TGGTGAATCT CGATGATCCT TTGTCGCGCT TTATGCACAC CGATGGTTAC 
GCTGCCGCAG GTGTAGAGAT TAAAGTGGTC GATGACGCAC GCAAGACCTT ACCGCCAGGT 
TGCGAAGGTG AAGAAGCCTC GCGTGGCCCC AATGTGTTTA TGGGGTATTT TGATGAACCT 
GAATTAACCG CCCGTGCCCT GGATGAAGAA GGCTGGTATT ACAGCGGCGA TCTCTGCCGT 
ATGGATGAGG CTGGCTATAT AAAAATTACC GGACGCAAAA AAGATATTAT TGTCCGCGGC 
GGCGAAAATA TTAGCAGCCG TGAAGTGGAA GATATTTTAT TGCAGCATCC TAAAATTCAC 
GATGCCTGTG TGGTTGCAAT GTCCGATGAA CGTTTAGGTG AACGATCATG CGCTTATGTC 
GTGCTGAAAG CGCCGCATCA TTCATTATCG CTGGAAGAGG TAGTGGCTTT TTTTAGCCGT 
AAACGGGTCG CAAAATATAA ATATCCTGAA CATATCGTGG TAATCGAAAA ACTACCGCGA 
ACTACCTCAG GTAAAATACA AAAGTTTTTG TTAAGAAAAG ATATTATGCG GCGTTTAACG 
CAGGATGTCT GTGAAGAGAT TGAATAA

Protein sequence

MKVTLTFNEQ RRAAYRQQGL WGDASLADYW QQTARAMPDK IAVVDNHGAS YTYSALDHAA 
SCLANWMLAK GIESGDRIAF QLPGWCEFTV IYLACLKIGA VSVPLLPSWR EAELVWVLNK 
CQAKMFFAPT LFKQTRPVDL ILPLQNQLPQ LQQIVGVDKL APATSSLSLS QIIADNTSLT 
TAITTHGDEL AAVLFTSGTE GLPKGVMLTH NNILASERAY CARLNLTWQD VFMMPAPLGH 
ATGFLHGVTA PFLIGARSVL LDIFTPDACL ALLEQQRCTC MLGATPFVYD LLNVLEKQPA 
DLSALRFFLC GGTTIPKKVA RECQQRGIKL LSVYGSTESS PHAVVNLDDP LSRFMHTDGY 
AAAGVEIKVV DDARKTLPPG CEGEEASRGP NVFMGYFDEP ELTARALDEE GWYYSGDLCR 
MDEAGYIKIT GRKKDIIVRG GENISSREVE DILLQHPKIH DACVVAMSDE RLGERSCAYV 
VLKAPHHSLS LEEVVAFFSR KRVAKYKYPE HIVVIEKLPR TTSGKIQKFL LRKDIMRRLT 
QDVCEEIE