Gene EcDH1_3039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3039
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	3261732
End bp	3262865
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	45%
IMG OID
Product	lipopolysaccharide biosynthesis protein
Protein accession	ACX40667
Protein GI	260450245
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.443281
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCATCAC TGAATATTAA ACAGGGAAGT GACGCTCATT TTCCCGATTA TCCTCTGGCG 
TCGCCCAGTA ATAATGAAAT TGATTTACTT AATCTAATCT CAGTTTTATG GCGGGCCAAA 
AAAACGGTCA TGGCGGTCGT TTTTGCGTTT GCCTGCGCAG GCTTGCTGAT CTCTTTCATC 
CTGCCGCAAA AATGGACCAG CGCGGCGGTT GTCACGCCTC CAGAACCTGT TCAGTGGCAA 
GAGTTGGAGA AATCATTCAC TAAGCTTCGT GTGCTGGATC TGGATATCAA AATTGATCGT 
ACAGAAGCAT TTAACCTGTT TATCAAGAAG TTTCAGTCGG TTAGCTTGCT GGAAGAGTAC 
CTGCGTTCAT CACCTTATGT GATGGACCAA TTAAAAGAGG CGAAAATCGA CGAACTGGAT 
TTGCATCGCG CAATTGTCGC ATTGAGCGAA AAAATGAAAG CGGTTGATGA CAATGCCAGT 
AAGAAAAAAG ATGAACCGTC ACTGTATACC TCCTGGACGC TAAGTTTTAC CGCGCCAACC 
AGTGAAGAGG CGCAGACCGT TTTGAGCGGG TATATCGATT ATATCTCTAC GTTGGTGGTG 
AAAGAGTCGC TAGAAAACGT CCGTAATAAA CTGGAGATCA AAACCCAGTT TGAAAAAGAA 
AAACTGGCTC AGGATCGCAT TAAAACGAAA AATCAACTTG ATGCAAACAT TCAGCGCCTC 
AATTATTCAC TCGACATTGC CAACGCGGCA GGAATTAAAA AGCCCGTTTA CAGTAATGGT 
CAGGCCGTTA AAGATGACCC CGATTTTTCT ATTTCTCTCG GTGCAGACGG TATTGAACGC 
AAACTGGAAA TAGAAAAAGC GGTCACTGAC GTTGCGGAAC TGAACGGTGA ATTACGTAAT 
CGGCAGTATC TTGTCGAGCA ATTAACAAAA GCACATGTCA ACGATGTGAA TTTTACGCCG 
TTTAAATATC AGTTAAGCCC GTCATTGCCA GTGAAAAAAG ACGGTCCGGG TAAGGCGATT 
ATTGTGATCC TTTCCGCGTT GATCGGCGGG ATGGTGGCTT GTGGTGGCGT GCTGTTGCGC 
TATGCGATGG CATCCAGAAA ACAGGATGCC ATGATGGCAG ACCACTTAGT TTAA

Protein sequence

MSSLNIKQGS DAHFPDYPLA SPSNNEIDLL NLISVLWRAK KTVMAVVFAF ACAGLLISFI 
LPQKWTSAAV VTPPEPVQWQ ELEKSFTKLR VLDLDIKIDR TEAFNLFIKK FQSVSLLEEY 
LRSSPYVMDQ LKEAKIDELD LHRAIVALSE KMKAVDDNAS KKKDEPSLYT SWTLSFTAPT 
SEEAQTVLSG YIDYISTLVV KESLENVRNK LEIKTQFEKE KLAQDRIKTK NQLDANIQRL 
NYSLDIANAA GIKKPVYSNG QAVKDDPDFS ISLGADGIER KLEIEKAVTD VAELNGELRN 
RQYLVEQLTK AHVNDVNFTP FKYQLSPSLP VKKDGPGKAI IVILSALIGG MVACGGVLLR 
YAMASRKQDA MMADHLV