Gene EcDH1_1595 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1595
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	1740813
End bp	1741952
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	54%
IMG OID
Product	polysaccharide export protein
Protein accession	ACX39260
Protein GI	260448838
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.249253
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAAAT CCAAAATGAA ATTGATGCCA TTATTGGTGT CAGTAACCTT GATAAGCGGT 
TGCACAGTAC TTCCGGGCAG CAATATGTCG ACGATGGGCA AAGACGTCAT CAAACAGCAG 
GACGCTGATT TCGATCTCGA CAAAATGGTG AATGTTTATC CGCTGACCCC GCGCCTGATT 
GACCAATTAC GCCCACGCCC GAATGTAGCG CGCCCCAATA TGACGCTGGA AAGTGAGATC 
GCGAATTACC AGTATCGCGT CGGGCCGGGG GACGTTCTTA ATGTCACCGT CTGGGATCAC 
CCGGAACTCA CCACGCCAGC CGGTCAGTAC CGCAGCTCCA GCGACACCGG CAACTGGGTA 
CAGCCTGACG GCACTATGTT TTACCCGTAT ATCGGCAAGG TCCACGTAGT CGGGAAAACG 
CTCGCTGAAA TCCGCAGTGA TATTACCGGG CGCTTAGCGA CGTACATCGC TGACCCGCAG 
GTGGACGTTA ATATCGCCGC CTTCCGCTCA CAAAAGGCCT ATATCTCCGG TCAGGTGAAT 
AAATCCGGTC AACAGGCGAT CACCAACGTG CCACTGACTA TTCTCGACGC CATCAACGCC 
GCAGGTGGCC TGACCGACAC CGCTGACTGG CGCAACGTGG TGCTAACACA CAATGGTCGT 
GAAGAGCGCA TTTCTTTGCA GGCGCTGATG CAAAACGGCG ACCTCAACCA GAATCGCCTG 
CTTTACCCCG GCGATATTCT CTACGTGCCA CGTAATGATG ATCTGAAAGT ATTTGTGATG 
GGTGAAGTGA AGAAACAGAG CACCCTGAAA ATGGACTTTA GCGGCATGAC CCTGACTGAA 
GCCCTGGGCA ATGCTGAAGG CATCGACATG ACCACCTCCA ACGCCAGCGG CATCTTTGTC 
ATTCGTCCGC TGAAAGGCGA GGGCGGGCGT AACGGCAAGA TTGCCAATAT CTACCAGCTG 
GATATGTCCG ATGCCACGTC GCTGGTGATG GCGACAGAAT TCCGCCTGCA ACCTTATGAC 
GTGGTGTATG TCACCACCGC CCCGGTTTCC CGCTGGAACC GTCTGATCAA TCAGTTGCTG 
CCAACTATTA GCGGTGTCCG TTACATGACG GATACAGCCA GCGACATTCA TAACTGGTAA

Protein sequence

MMKSKMKLMP LLVSVTLISG CTVLPGSNMS TMGKDVIKQQ DADFDLDKMV NVYPLTPRLI 
DQLRPRPNVA RPNMTLESEI ANYQYRVGPG DVLNVTVWDH PELTTPAGQY RSSSDTGNWV 
QPDGTMFYPY IGKVHVVGKT LAEIRSDITG RLATYIADPQ VDVNIAAFRS QKAYISGQVN 
KSGQQAITNV PLTILDAINA AGGLTDTADW RNVVLTHNGR EERISLQALM QNGDLNQNRL 
LYPGDILYVP RNDDLKVFVM GEVKKQSTLK MDFSGMTLTE ALGNAEGIDM TTSNASGIFV 
IRPLKGEGGR NGKIANIYQL DMSDATSLVM ATEFRLQPYD VVYVTTAPVS RWNRLINQLL 
PTISGVRYMT DTASDIHNW