Gene EcDH1_1905 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1905
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	2057264
End bp	2058622
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	49%
IMG OID
Product	PTS system, lactose/cellobiose family IIC subunit
Protein accession	ACX39563
Protein GI	260449141
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0104161
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAATG TTATTGCATC GCTTGAAAAG GTACTCCTCC CTTTTGCAGT TAAAATAGGA 
AAGCAGCCAC ACGTTAATGC AATCAAAAAT GGCTTTATTC GCTTAATGCC GTTAACCCTT 
GCGGGGGCCA TGTTTGTATT AATTAACAAC GTTTTTCTAA GCTTTGGGGA GGGGTCGTTT 
TTTTATTCCT TAGGTATTCG CCTCGACGCC TCAACCATTG AAACACTTAA TGGTCTGAAA 
GGTATTGGCG GCAACGTATA TAACGGAACA TTAGGAATAA TGTCTTTAAT GGCACCGTTC 
TTTATTGGCA TGGCGCTGGC AGAAGAGCGT AAAGTCGATG CGCTGGCGGC TGGGTTGTTA 
TCCGTTGCAG CATTTATGAC CGTCACCCCA TATAGTGTCG GTGAGGCCTA TGCGGTTGGT 
GCAAACTGGT TAGGTGGGGC GAATATCATC TCCGGGATTA TTATTGGCCT GGTGGTGGCA 
GAAATGTTTA CCTTTATTGT CCGCCGCAAT TGGGTCATTA AACTGCCCGA CAGCGTACCT 
GCTTCAGTAT CGCGTTCCTT CTCGGCATTA ATTCCCGGCT TTATTATTCT TTCCGTGATG 
GGGATTATTG CCTGGGCGTT GAATACCTGG GGCACCAACT TCCATCAGAT CATTATGGAT 
ACCATCTCAA CCCCACTGGC ATCGTTGGGT AGCGTGGTGG GCTGGGCCTA TGTGATCTTT 
GTTCCACTGC TCTGGTTCTT CGGTATTCAT GGCGCGCTGG CGCTGACCGC ACTGGACAAC 
GGCATTATGA CGCCGTGGGC ACTGGAAAAT ATCGCGACCT ATCAGCAATA TGGTTCCGTC 
GAAGCGGCGC TGGCAGCCGG TAAGACCTTC CATATCTGGG CCAAGCCGAT GCTGGACTCC 
TTTATTTTCC TTGGGGGCAG TGGTGCGACT TTAGGCCTGA TCCTGGCTAT CTTTATCGCC 
TCTCGCCGTG CTGATTATCG TCAGGTGGCA AAACTGGCGC TGCCGTCCGG CATCTTCCAG 
ATTAACGAAC CGATTCTGTT TGGTCTGCCA ATTATCATGA ACCCGGTGAT GTTTATCCCG 
TTTGTACTGG TACAACCGAT TCTGGCGGCA ATCACCCTCG CAGCGTACTA CATGGGCATT 
ATTCCTCCGG TGACCAATAT TGCACCGTGG ACCATGCCAA CCGGTCTGGG AGCCTTCTTT 
AACACCAACG GTAGCGTCGC CGCATTGCTG GTCGCACTCT TCAACCTTGG CATCGCAACG 
TTAATTTATC TGCCCTTTGT TGTGGTGGCT AACAAAGCAC AAAATGCGAT TGATAAAGAA 
GAGAGCGAAG AAGATATCGC TAACGCCCTG AAATTTTAA

Protein sequence

MSNVIASLEK VLLPFAVKIG KQPHVNAIKN GFIRLMPLTL AGAMFVLINN VFLSFGEGSF 
FYSLGIRLDA STIETLNGLK GIGGNVYNGT LGIMSLMAPF FIGMALAEER KVDALAAGLL 
SVAAFMTVTP YSVGEAYAVG ANWLGGANII SGIIIGLVVA EMFTFIVRRN WVIKLPDSVP 
ASVSRSFSAL IPGFIILSVM GIIAWALNTW GTNFHQIIMD TISTPLASLG SVVGWAYVIF 
VPLLWFFGIH GALALTALDN GIMTPWALEN IATYQQYGSV EAALAAGKTF HIWAKPMLDS 
FIFLGGSGAT LGLILAIFIA SRRADYRQVA KLALPSGIFQ INEPILFGLP IIMNPVMFIP 
FVLVQPILAA ITLAAYYMGI IPPVTNIAPW TMPTGLGAFF NTNGSVAALL VALFNLGIAT 
LIYLPFVVVA NKAQNAIDKE ESEEDIANAL KF