Gene EcDH1_1503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1503
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	1630090
End bp	1632081
Gene Length	1992 bp
Protein Length	663 aa
Translation table	11
GC content	53%
IMG OID
Product	TonB-dependent receptor plug
Protein accession	ACX39173
Protein GI	260448751
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.000115095
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTAGGT TGAACCCTTT CGTACGGGTC GGGCTGTGTT TGTCCGCTAT TTCTTGTGCA 
TGGCCTGTGT TAGCGGTCGA TGATGATGGC GAAACGATGG TTGTCACTGC ATCTTCCGTG 
GAACAAAATC TTAAAGATGC ACCTGCCAGT ATCAGCGTCA TTACCCAGGA AGACCTGCAG 
CGAAAACCGG TACAGAATCT GAAGGATGTC CTCAAAGAAG TGCCTGGCGT ACAACTGACG 
AACGAAGGGG ATAACCGTAA GGGCGTTAGT ATTCGTGGTC TGGACAGCAG CTATACCCTG 
ATTCTCGTCG ACGGTAAACG CGTGAACTCC CGCAATGCCG TCTTCCGCCA CAATGATTTC 
GATCTGAACT GGATCCCGGT CGATTCCATC GAACGTATTG AAGTGGTCCG TGGCCCGATG 
TCGTCGCTGT ACGGTTCCGA TGCGCTCGGC GGTGTAGTGA ATATCATCAC CAAAAAAATC 
GGTCAGAAAT GGTCGGGTAC CGTTACCGTC GATACCACCA TTCAGGAACA TCGCGATCGC 
GGTGACACCT ATAACGGTCA GTTCTTTACC AGTGGACCAT TAATTGATGG TGTGCTGGGA 
ATGAAAGCTT ACGGCAGCCT GGCAAAACGT GAAAAGGATG ACCCGCAAAA CTCAACGACC 
ACCGATACCG GAGAAACGCC GCGTATTGAA GGATTCTCCA GCCGCGACGG CAATGTCGAA 
TTTGCCTGGA CACCGAATCA AAATCACGAT TTTACTGCCG GATACGGTTT CGACCGTCAG 
GATCGTGATT CCGACTCGCT GGACAAAAAC CGCCTGGAAC GCCAGAACTA CTCCGTCAGC 
CATAATGGGC GTTGGGATTA CGGCACCAGC GAACTGAAAT ACTACGGTGA GAAAGTCGAG 
AACAAAAACC CTGGCAACAG CAGCCCGATA ACTTCCGAAA GCAATACGGT CGACGGCAAA 
TACACGTTGC CGCTGACGGC GATTAATCAG TTTCTCACGG TTGGCGGTGA ATGGCGTCAC 
GACAAACTTA GCGATGCGGT GAACCTGACC GGGGGAACCA GCTCCAAAAC GTCTGCCAGC 
CAGTACGCGC TGTTTGTGGA AGATGAATGG CGGATCTTCG AGCCGCTGGC GCTGACGACC 
GGCGTGCGTA TGGACGATCA CGAAACCTAC GGTGAACACT GGAGTCCGCG TGCCTACCTG 
GTTTATAACG CCACCGACAC CGTAACGGTG AAAGGGGGCT GGGCGACGGC ATTTAAAGCA 
CCTTCTCTGT TGCAACTTAG CCCTGACTGG ACGAGCAATT CCTGCCGTGG CGCATGTAAG 
ATTGTGGGTA GCCCGGATCT GAAACCAGAA ACCAGCGAAA GTTGGGAGCT GGGGCTTTAC 
TACATGGGTG AAGAAGGCTG GCTGGAAGGG GTTGAATCCA GCGTTACCGT TTTCCGTAAC 
GATGTGAAAG ATCGTATCAG CATCAGCCGT ACGTCTGACG TCAACGCTGC ACCGGGCTAC 
CAAAACTTTG TTGGTTTTGA GACGGGCGCT AACGGACGGC GCATACCGGT ATTTAGCTAC 
TACAACGTTA ACAAAGCTCG TATTCAGGGC GTGGAAACCG AACTGAAAAT TCCGTTCAAC 
GATGAATGGA AACTGTCGAT CAACTACACC TACAACGATG GTCGTGATGT CAGCAACGGC 
GAAAACAAAC CGCTATCCGA TCTGCCGTTC CATACTGCTA ACGGTACGCT GGACTGGAAA 
CCGCTGGCGC TGGAAGACTG GTCATTCTAT GTTTCTGGGC ACTATACCGG GCAGAAACGC 
GCCGACAGCG CGACGGCTAA AACACCGGGC GGTTATACCA TCTGGAATAC CGGCGCGGCC 
TGGCAGGTGA CTAAAGACGT CAAACTGCGC GCAGGCGTGC TGAACCTTGG CGACAAGGAT 
CTCAGTCGTG ACGACTACAG CTATAACGAA GACGGACGTC GTTACTTTAT GGCAGTGGAT 
TATCGCTTCT GA

Protein sequence

MFRLNPFVRV GLCLSAISCA WPVLAVDDDG ETMVVTASSV EQNLKDAPAS ISVITQEDLQ 
RKPVQNLKDV LKEVPGVQLT NEGDNRKGVS IRGLDSSYTL ILVDGKRVNS RNAVFRHNDF 
DLNWIPVDSI ERIEVVRGPM SSLYGSDALG GVVNIITKKI GQKWSGTVTV DTTIQEHRDR 
GDTYNGQFFT SGPLIDGVLG MKAYGSLAKR EKDDPQNSTT TDTGETPRIE GFSSRDGNVE 
FAWTPNQNHD FTAGYGFDRQ DRDSDSLDKN RLERQNYSVS HNGRWDYGTS ELKYYGEKVE 
NKNPGNSSPI TSESNTVDGK YTLPLTAINQ FLTVGGEWRH DKLSDAVNLT GGTSSKTSAS 
QYALFVEDEW RIFEPLALTT GVRMDDHETY GEHWSPRAYL VYNATDTVTV KGGWATAFKA 
PSLLQLSPDW TSNSCRGACK IVGSPDLKPE TSESWELGLY YMGEEGWLEG VESSVTVFRN 
DVKDRISISR TSDVNAAPGY QNFVGFETGA NGRRIPVFSY YNVNKARIQG VETELKIPFN 
DEWKLSINYT YNDGRDVSNG ENKPLSDLPF HTANGTLDWK PLALEDWSFY VSGHYTGQKR 
ADSATAKTPG GYTIWNTGAA WQVTKDVKLR AGVLNLGDKD LSRDDYSYNE DGRRYFMAVD 
YRF