Gene EcDH1_2692 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2692
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	2866220
End bp	2867860
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	50%
IMG OID
Product	Mammalian cell entry related domain protein
Protein accession	ACX40325
Protein GI	260449903
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.000000610454
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATCTA ATAATGGGGA AGCCAAAATC CAGAAAGTGA AGAACTGGTC TCCCGTGTGG 
ATATTTCCTA TCGTCACGGC GCTCATTGGG GCCTGGGTTC TTTTTTATCA TTACAGCCAT 
CAGGGACCGG AAGTGACCCT GATCACCGCG AATGCGGAAG GAATTGAAGG TGGCAAAACC 
ACCATTAAAA GCCGTAGCGT TGACGTCGGC GTGGTTGAAA GCGCCACACT GGCTGATGAT 
TTGACGCACG TTGAAATCAA AGCGCGGCTG AATTCCGGTA TGGAAAAATT GCTGCATAAA 
GACACCGTCT TTTGGGTGGT GAAACCGCAG ATTGGTCGCG AAGGGATTAG CGGCCTGGGA 
ACGCTGCTGT CTGGAGTTTA TATCGAACTG CAGCCAGGCG CGAAAGGCAG CAAAATGGAT 
AAATACGATT TGCTGGACTC GCCACCGTTG GCCCCGCCTG ATGCGAAAGG TATCCGTGTG 
ATTCTCGATA GCAAAAAAGC CGGGCAGCTC TCGCCAGGAG ATCCGGTGCT GTTCCGTGGC 
TATCGGGTAG GTTCGGTTGA AACCAGCACC TTCGATACAC AAAAACGCAA TATCAGCTAT 
CAACTGTTCA TCAATGCACC TTATGACCGA CTGGTGACCA ACAATGTTCG CTTCTGGAAA 
GATAGTGGCA TTGCGGTTGA TCTGACGTCA GCAGGGATGC GTGTGGAGAT GGGCTCATTG 
ACAACGCTGC TGAGTGGCGG TGTCAGCTTT GATGTGCCGG AAGGTCTGGA TTTAGGGCAG 
CCAGTGGCAC CGAAAACAGC TTTCGTTTTG TATGATGATC AGAAGAGCAT TCAGGATTCG 
TTGTACACCG ATCACATTGA TTATCTGATG TTCTTTAAAG ATTCGGTACG CGGTCTGCAA 
CCGGGAGCTC CGGTAGAGTT CCGGGGTATT CGCCTGGGTA CCGTAAGCAA AGTGCCATTC 
TTTGCGCCGA ATATGCGTCA GACATTTAAC GATGATTACC GTATTCCGGT ACTGATTCGT 
ATCGAGCCAG AGCGGCTGAA AATGCAGCTT GGCGAAAATG CGGATGTTGT TGAGCACCTT 
GGCGAATTGT TGAAACGTGG TTTACGCGGA TCGCTGAAAA CCGGAAACCT GGTCACTGGT 
GCACTGTATG TTGATCTCGA TTTCTATCCA AATACGCCTG CAATAACCGG TATTCGTGAA 
TTTAATGGTT ATCAGATTAT CCCGACCGTT AGCGGCGGCC TGGCGCAAAT CCAGCAACGA 
CTGATGGAAG CGTTGGATAA GATCAACAAA CTGCCATTGA ATCCGATGAT TGAACAGGCA 
ACCAGTACGC TTTCTGAAAG TCAGCGCACA ATGAAAAACC TGCAAACGAC GCTGGATAGC 
ATGAACAAGA TCCTCGCTAG CCAGTCGATG CAGCAGTTGC CGACGGATAT GCAGTCAACG 
TTGCGTGAAT TGAATCGCAG CATGCAGGGC TTCCAGCCTG GCTCCGCAGC CTACAACAAG 
ATGGTGGCGG ATATGCAGCG CCTTGATCAG GTGTTGCGAG AACTGCAACC GGTGCTGAAA 
ACGCTCAATG AGAAGAGTAA CGCGCTGGTA TTTGAAGCGA AGGACAAAAA AGATCCAGAG 
CCGAAGAGGG CGAAACAATG A

Protein sequence

MESNNGEAKI QKVKNWSPVW IFPIVTALIG AWVLFYHYSH QGPEVTLITA NAEGIEGGKT 
TIKSRSVDVG VVESATLADD LTHVEIKARL NSGMEKLLHK DTVFWVVKPQ IGREGISGLG 
TLLSGVYIEL QPGAKGSKMD KYDLLDSPPL APPDAKGIRV ILDSKKAGQL SPGDPVLFRG 
YRVGSVETST FDTQKRNISY QLFINAPYDR LVTNNVRFWK DSGIAVDLTS AGMRVEMGSL 
TTLLSGGVSF DVPEGLDLGQ PVAPKTAFVL YDDQKSIQDS LYTDHIDYLM FFKDSVRGLQ 
PGAPVEFRGI RLGTVSKVPF FAPNMRQTFN DDYRIPVLIR IEPERLKMQL GENADVVEHL 
GELLKRGLRG SLKTGNLVTG ALYVDLDFYP NTPAITGIRE FNGYQIIPTV SGGLAQIQQR 
LMEALDKINK LPLNPMIEQA TSTLSESQRT MKNLQTTLDS MNKILASQSM QQLPTDMQST 
LRELNRSMQG FQPGSAAYNK MVADMQRLDQ VLRELQPVLK TLNEKSNALV FEAKDKKDPE 
PKRAKQ