Gene EcDH1_3561 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3561
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	3832262
End bp	3833479
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	53%
IMG OID
Product	L-carnitine dehydratase/bile acid-inducible protein F
Protein accession	ACX41175
Protein GI	260450753
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCATC TACCCATGCC GAAATTCGGG CCGTTGGCCG GATTGCGCGT TGTCTTCTCC 
GGTATCGAAA TCGCCGGACC GTTTGCCGGG CAAATGTTCG CAGAATGGGG CGCGGAAGTT 
ATCTGGATCG AGAACGTCGC CTGGGCCGAC ACCATTCGCG TTCAACCGAA CTACCCGCAA 
CTCTCCCGCC GCAATTTGCA CGCGCTGTCG TTAAATATTT TCAAAGATGA AGGCCGCGAA 
GCGTTTCTGA AATTAATGGA AACCACCGAT ATCTTCATCG AAGCCAGTAA AGGTCCGGCC 
TTTGCCCGTC GTGGCATTAC CGATGAAGTA CTGTGGCAGC ACAACCCGAA ACTGGTTATC 
GCTCACCTGT CCGGTTTTGG TCAGTACGGC ACCGAGGAGT ACACCAATCT TCCGGCCTAT 
AACACTATCG CCCAGGCCTT TAGTGGTTAC CTGATTCAGA ACGGTGATGT TGACCAGCCA 
ATGCCTGCCT TCCCGTATAC CGCCGATTAC TTTTCTGGCC TGACCGCCAC CACGGCGGCG 
CTGGCAGCAC TGCATAAAGT GCGTGAAACC GGTAAAGGCG AAAGTATCGA CATCGCCATG 
TATGAAGTGA TGCTGCGTAT GGGCCAGTAC TTCATGATGG ATTACTTCAA CGGCGGCGAA 
ATGTGCCCGC GCATGAGCAA AGGTAAAGAT CCCTACTACG CCGGTTGCGG TCTGTATAAA 
TGTGCCGACG GCTACATCGT GATGGAACTG GTGGGCATTA CCCAAATTGA AGAGTGCTTT 
AAAGATATTG GCCTCGCACA TCTGCTTGGC ACGCCAGAAA TCCCGGAAGG CACTCAGCTT 
ATCCACCGTA TCGAATGCCC TTACGGCCCA CTGGTTGAAG AGAAACTCGA TGCCTGGCTG 
GCGACACATA CCATCGCGGA AGTAAAAGAA CGCTTTGCTG AACTGAATAT CGCCTGCGCC 
AAAGTGCTGA CCGTACCGGA ACTGGAAAGC AATCCACAGT ATGTGGCTCG CGAATCAATC 
ACTCAGTGGC AAACGATGGA TGGTCGCACC TGCAAAGGGC CGAACATCAT GCCGAAATTC 
AAAAATAACC CCGGACAAAT CTGGCGCGGA ATGCCCTCAC ATGGCATGGA CACGGCTGCC 
ATTTTGAAAA ATATCGGCTA CAGCGAAAAC GACATTCAGG AGTTGGTCAG CAAAGGTCTG 
GCCAAAGTTG AGGACTAA

Protein sequence

MDHLPMPKFG PLAGLRVVFS GIEIAGPFAG QMFAEWGAEV IWIENVAWAD TIRVQPNYPQ 
LSRRNLHALS LNIFKDEGRE AFLKLMETTD IFIEASKGPA FARRGITDEV LWQHNPKLVI 
AHLSGFGQYG TEEYTNLPAY NTIAQAFSGY LIQNGDVDQP MPAFPYTADY FSGLTATTAA 
LAALHKVRET GKGESIDIAM YEVMLRMGQY FMMDYFNGGE MCPRMSKGKD PYYAGCGLYK 
CADGYIVMEL VGITQIEECF KDIGLAHLLG TPEIPEGTQL IHRIECPYGP LVEEKLDAWL 
ATHTIAEVKE RFAELNIACA KVLTVPELES NPQYVARESI TQWQTMDGRT CKGPNIMPKF 
KNNPGQIWRG MPSHGMDTAA ILKNIGYSEN DIQELVSKGL AKVED