Gene EcDH1_2520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2520
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	2692669
End bp	2693895
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	50%
IMG OID
Product	peptidase T
Protein accession	ACX40156
Protein GI	260449734
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.00630559
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAAAC TACTTGAGCG ATTTTTGAAC TACGTGTCTC TGGATACCCA ATCAAAAGCA 
GGGGTGAGAC AGGTTCCCAG CACGGAAGGC CAATGGAAGT TATTGCATCT GCTGAAAGAG 
CAGCTCGAAG AGATGGGGCT TATCAATGTG ACCTTAAGTG AGAAGGGCAC TTTGATGGCG 
ACGTTACCGG CTAACGTCCC TGGCGATATC CCGGCGATTG GCTTTATTTC TCATGTGGAT 
ACCTCACCGG ATTGCAGCGG CAAAAATGTG AATCCGCAAA TTGTTGAAAA CTATCGCGGT 
GGCGATATTG CGCTGGGTAT CGGCGATGAA GTTTTATCAC CGGTTATGTT CCCGGTGCTG 
CATCAGCTAC TGGGTCAGAC GCTGATTACC ACCGATGGTA AAACCTTGTT AGGTGCCGAT 
GACAAAGCAG GTATTGCAGA AATCATGACC GCGCTGGCGG TATTGCAACA GAAAAAAATT 
CCGCATGGTG ATATTCGCGT CGCCTTTACC CCGGATGAAG AAGTGGGCAA AGGGGCGAAA 
CATTTTGATG TTGACGCCTT CGATGCCCGC TGGGCTTACA CTGTTGATGG TGGTGGCGTA 
GGCGAACTGG AGTTTGAAAA CTTCAACGCC GCGTCGGTCA ATATCAAAAT TGTCGGTAAC 
AATGTTCATC CGGGCACGGC GAAAGGAGTG ATGGTAAATG CGCTGTCGCT GGCGGCACGT 
ATTCATGCGG AAGTTCCGGC GGATGAAAGC CCGGAAATGA CAGAAGGCTA TGAAGGTTTC 
TATCATCTGG CGAGCATGAA AGGCACCGTT GAACGGGCCG ATATGCACTA CATCATCCGT 
GATTTCGACC GTAAACAGTT TGAAGCGCGT AAACGTAAAA TGATGGAGAT CGCCAAAAAA 
GTGGGCAAAG GGTTACATCC TGATTGCTAC ATTGAACTGG TGATTGAAGA CAGTTACTAC 
AATATGCGCG AGAAAGTGGT TGAGCATCCG CATATTCTCG ATATCGCCCA GCAGGCGATG 
CGCGATTGCG ATATTGAACC GGAACTGAAA CCGATCCGCG GTGGTACCGA CGGCGCGCAG 
TTGTCGTTTA TGGGATTACC GTGCCCGAAC CTGTTCACTG GCGGTTACAA CTATCATGGT 
AAGCATGAGT TTGTGACTCT GGAAGGTATG GAAAAAGCGG TGCAGGTGAT CGTCCGTATT 
GCCGAGTTAA CGGCGCAACG GAAGTAA

Protein sequence

MDKLLERFLN YVSLDTQSKA GVRQVPSTEG QWKLLHLLKE QLEEMGLINV TLSEKGTLMA 
TLPANVPGDI PAIGFISHVD TSPDCSGKNV NPQIVENYRG GDIALGIGDE VLSPVMFPVL 
HQLLGQTLIT TDGKTLLGAD DKAGIAEIMT ALAVLQQKKI PHGDIRVAFT PDEEVGKGAK 
HFDVDAFDAR WAYTVDGGGV GELEFENFNA ASVNIKIVGN NVHPGTAKGV MVNALSLAAR 
IHAEVPADES PEMTEGYEGF YHLASMKGTV ERADMHYIIR DFDRKQFEAR KRKMMEIAKK 
VGKGLHPDCY IELVIEDSYY NMREKVVEHP HILDIAQQAM RDCDIEPELK PIRGGTDGAQ 
LSFMGLPCPN LFTGGYNYHG KHEFVTLEGM EKAVQVIVRI AELTAQRK