Gene EcDH1_2000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2000
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	2158876
End bp	2159985
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	55%
IMG OID
Product	protein of unknown function UPF0075
Protein accession	ACX39657
Protein GI	260449235
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.000246481
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATCGG GCCGCTTTAT TGGCGTTATG TCAGGCACCA GCCTTGATGG TGTTGATGTT 
GTGTTGGCGA CAATTGATGA ACACCGGGTC GCACAGCTGG CAAGTTTGAG TTGGCCGATC 
CCGGTATCTC TGAAACAGGC TGTACTGGAT ATTTGCCAGG GCCAGCAGCT TACACTTTCG 
CAGTTTGGAC AGCTTGATAC TCAACTCGGG CAACTTTTTG CTGATGCGGT CAATGCCTTG 
CTTAAGGAAC AAAATCTGCA GGCAAGAGAT ATAGTTGCGA TCGGTTGTCA CGGTCAAACC 
GTCTGGCATG AACCGACGGG CGTGGCACCA CACACTTTAC AGATTGGCGA TAACAATCAA 
ATTGTGGCAC GCACCGGAAT TACGGTTGTC GGTGATTTTC GCCGTCGCGA TATTGCCTTG 
GGAGGACAAG GCGCACCGCT GGTACCTGCG TTCCATCATG CGCTGCTGGC TCACCCAACC 
GAGCGACGAA TGGTGCTCAA TATTGGCGGC ATCGCCAATC TGTCACTGCT CATTCCTGGG 
CAGCCGGTTG GGGGCTACGA TACCGGTCCT GGTAACATGC TGATGGATGC CTGGATCTGG 
CGTCAGGCCG GTAAACCTTA CGATAAAGAT GCCGAGTGGG CACGGGCGGG TAAAGTTATT 
CTCCCACTGC TGCAAAATAT GCTCAGCGAC CCGTATTTCT CGCAACCTGC ACCGAAAAGC 
ACCGGACGCG AATACTTTAA CTATGGTTGG CTGGAGCGCC ATTTGCGCCA TTTTCCGGGT 
GTTGATCCCC GAGATGTGCA GGCGACACTG GCAGAACTCA CCGCCGTGAC CATTTCTGAA 
CAAGTTTTGT TGAGCGGTGG CTGCGAACGA TTGATGGTAT GTGGTGGAGG TAGTCGTAAT 
CCGCTACTCA TGGCGCGTCT GGCGGCATTA CTGCCAGGCA CAGAAGTCAC CACCACCGAT 
GCCGTTGGCA TTAGTGGCGA TGACATGGAA GCATTGGCTT TCGCCTGGCT TGCCTGGCGG 
ACGCTGGCGG GATTACCAGG AAATCTGCCT TCCGTCACTG GCGCAAGCCA GGAGACGGTA 
CTGGGGGCTA TTTTCCCCGC TAACCCGTGA

Protein sequence

MKSGRFIGVM SGTSLDGVDV VLATIDEHRV AQLASLSWPI PVSLKQAVLD ICQGQQLTLS 
QFGQLDTQLG QLFADAVNAL LKEQNLQARD IVAIGCHGQT VWHEPTGVAP HTLQIGDNNQ 
IVARTGITVV GDFRRRDIAL GGQGAPLVPA FHHALLAHPT ERRMVLNIGG IANLSLLIPG 
QPVGGYDTGP GNMLMDAWIW RQAGKPYDKD AEWARAGKVI LPLLQNMLSD PYFSQPAPKS 
TGREYFNYGW LERHLRHFPG VDPRDVQATL AELTAVTISE QVLLSGGCER LMVCGGGSRN 
PLLMARLAAL LPGTEVTTTD AVGISGDDME ALAFAWLAWR TLAGLPGNLP SVTGASQETV 
LGAIFPANP