Gene EcDH1_3740 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3740
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	4032879
End bp	4034075
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	37%
IMG OID
Product	protein of unknown function DUF898 transmembrane
Protein accession	ACX41345
Protein GI	260450923
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTCAAG TTATTAATGA AATGGATGTT CCGTCCCATT CGTTTGTTTT TCATGGTACA 
GGTGAGAGAT ATTTTCTTAT TTGTGTGGTG AATGTGTTGT TAACGATTAT AACGCTAGGT 
ATCTATTTAC CATGGGCATT AATGAAATGT AAGCGTTATC TTTATGCTAA TATGGAAGTT 
AACGGACAAC GATTTTCTTA TGGAATTACC GGTGGGAATG TTTTTGTTAG TTGTCTTTTT 
TTTGTTTTTT TCTATTTCGC AATCTTAATG ACAGTGTCAG CAGATATGCC GCTTGTTGGT 
TGTGTTTTGA CTTTGTTACT GTTGGTTTTG CTTATATTTA TGGCAGCAAA AGGACTGCGT 
CATCAGGCCT TAATGACCAG TCTCAACGGC GTAAGATTTA GTTTTAATTG CTCTATGAAA 
GGGTTCTGGT GGGTGACCTT TTTCTTGCCG ATTTTAATGG CCATTGGGAT GGGGACTGTT 
TTCTTTATCT CGACAAAGAT GCTACCTGCC AATAGTTCAA GTAGTGTTAT TATATCCATG 
GTTCTGATGG CAATAGTTGG TATTGTTTCC ATTGGTATTT TTAATGGTAC TTTATATAGT 
CTGGTAATGA GTTTTCTCTG GAGTAATACC AGTTTCGGTA TACATCGTTT CAAGGTGAAA 
TTAGATACTA CGTATTGTAT AAAATATGCC ATTCTCGCAT TTTTAGCTTT ATTGCCTTTT 
CTCGCTGTTG CTGGTTATAT TATCTTCGAT CAAATATTAA ATGCGTATGA TAGTTCTGTA 
TATGCAAATG ATGACATTGA GAATTTACAG CAATTTATGG AAATGCAACG TAAAATGATA 
ATCGCGCAGT TAATCTATTA TTTTGGGATT GCTGTTAGCA CAAGTTATTT AACGGTGTCT 
TTGCGAAACC ATTTTATGAG CAACCTGTCA CTGAATGATG GGCGTATTCG TTTTCGCTTA 
ACTTTAACGT ACCACGGTAT GCTTTATCGC ATGTGTGCGT TGGTGGTGAT ATCCGGGATT 
ACGGGCGGTC TGGCTTATCC ACTGCTGAAA ATATGGATGA TTGACTGGCA GGCAAAAAAT 
ACGTATTTGC TGGGCGATTT GGATGACCTT CCTTTAATCA ATAAAGAAGA ACAACCAGAT 
AAAGGCTTCT TAGCCAGTAT TTCACGGGGA GTTATGCCTT CTTTACCATT TCTGTAA

Protein sequence

MAQVINEMDV PSHSFVFHGT GERYFLICVV NVLLTIITLG IYLPWALMKC KRYLYANMEV 
NGQRFSYGIT GGNVFVSCLF FVFFYFAILM TVSADMPLVG CVLTLLLLVL LIFMAAKGLR 
HQALMTSLNG VRFSFNCSMK GFWWVTFFLP ILMAIGMGTV FFISTKMLPA NSSSSVIISM 
VLMAIVGIVS IGIFNGTLYS LVMSFLWSNT SFGIHRFKVK LDTTYCIKYA ILAFLALLPF 
LAVAGYIIFD QILNAYDSSV YANDDIENLQ QFMEMQRKMI IAQLIYYFGI AVSTSYLTVS 
LRNHFMSNLS LNDGRIRFRL TLTYHGMLYR MCALVVISGI TGGLAYPLLK IWMIDWQAKN 
TYLLGDLDDL PLINKEEQPD KGFLASISRG VMPSLPFL