Gene EcDH1_0083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_0083
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	85556
End bp	86815
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	32%
IMG OID
Product	O-antigen polymerase
Protein accession	ACX37781
Protein GI	260447359
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.0973021
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTAACAT CCTTTAAACT TCATTCATTG AAACCTTACA CTCTGAAATC ATCAATGATT 
TTAGAGATAA TAACTTATAT ATTATGTTTT TTTTCAATGA TAATTGCATT CGTCGATAAT 
ACTTTCAGCA TAAAAATATA TAATATCACT GCTATAGTTT GCTTATTGTC ACTAATTTTA 
CGTGGCAGAC AAGAAAATTA TAATATAAAA AACCTTATTC TTCCCCTTTC TATATTTTTA 
ATAGGCTTGC TTGATTTAAT TTGGTATTCT GCGTTTAAAG TAGATAATTC GCCATTTCGT 
GCTACTTACC ATAGTTATTT AAATACTGCC AAAATATTTA TATTTGGTTC TTTTATTGTT 
TTCTTGACAC TAACTAGCCA GCTAAAATCA AAAAAAGAGA GTGTATTATA CACTTTGTAT 
TCTCTGTCAT TTCTAATTGC TGGATATGCA ATGTATATTA ATAGCATTCA TGAAAATGAC 
CGCATTTCTT TTGGTGTAGG AACGGCAACA GGAGCAGCAT ATTCAACAAT GCTAATAGGG 
ATAGTTAGTG GCGTTGCGAT TCTTTATACT AAGAAAAATC ATCCTTTTTT ATTTTTATTA 
AATAGTTGCG CGGTACTTTA TGTTCTGGCG CTAACACAAA CCAGAGCAAC CCTACTCCTG 
TTCCCTATAA TTTGTGTTGC TGCATTAATA GCTTATTATA ATAAATCACC CAAGAAATTC 
ACTTCCTCTA TTGTTCTACT AATTGCTATA TTAGCTAGCA TTGTTATTAT ATTTAATAAA 
CCAATACAGA ATCGCTATAA TGAAGCATTA AATGACTTAA ACAGTTATAC CAATGCTAAT 
AGTGTTACTT CCCTAGGTGC AAGACTGGCA ATGTACGAAA TTGGTTTAAA TATATTCATA 
AAGTCACCTT TTTCATTTAG ATCAGCAGAG TCACGCGCTG AAAGTATGAA TTTGTTAGTT 
GCAGAACACA ATAGGCTAAG AGGGGCATTG GAGTTTTCTA ACGTACATCT ACATAATGAG 
ATAATTGAAG CAGGGTCACT GAAAGGTCTG ATGGGAATTT TTTCCACACT TTTCCTCTAT 
TTTTCACTAT TTTATATAGC ATATAAAAAA CGAGCTTTGG GTTTGTTGAT ATTAACGCTT 
GGCATTGTGG GGATTGGACT CAGTGATGTG ATCATATGGG CACGCAGCAT TCCAATTATC 
ATTATATCCG CTATAGTCCT CTTACTCGTC ATTAATAATC GTAACAATAC AATTAATTAA

Protein sequence

MLTSFKLHSL KPYTLKSSMI LEIITYILCF FSMIIAFVDN TFSIKIYNIT AIVCLLSLIL 
RGRQENYNIK NLILPLSIFL IGLLDLIWYS AFKVDNSPFR ATYHSYLNTA KIFIFGSFIV 
FLTLTSQLKS KKESVLYTLY SLSFLIAGYA MYINSIHEND RISFGVGTAT GAAYSTMLIG 
IVSGVAILYT KKNHPFLFLL NSCAVLYVLA LTQTRATLLL FPIICVAALI AYYNKSPKKF 
TSSIVLLIAI LASIVIIFNK PIQNRYNEAL NDLNSYTNAN SVTSLGARLA MYEIGLNIFI 
KSPFSFRSAE SRAESMNLLV AEHNRLRGAL EFSNVHLHNE IIEAGSLKGL MGIFSTLFLY 
FSLFYIAYKK RALGLLILTL GIVGIGLSDV IIWARSIPII IISAIVLLLV INNRNNTIN