Gene EcDH1_0474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_0474
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	503767
End bp	504894
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	52%
IMG OID
Product	AFG1-family ATPase
Protein accession	ACX38162
Protein GI	260447740
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0000000087327
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAGCG TTACCCCAAC ATCGCAATAC CTGAAGGCGC TTAATGAAGG CAGCCATCAA 
CCCGACGACG TTCAAAAAGA GGCCGTCAGC CGCCTGGAAA TTATTTATCA GGAACTCATC 
AATAGCACGC CACCAGCCCC CAGGACGAGT GGGCTAATGG CGCGGGTCGG TAAGCTGTGG 
GGTAAACGCG AAGACACAAA GCATACGCCA GTGCGTGGCT TATATATGTG GGGCGGTGTA 
GGACGCGGGA AAACCTGGCT GATGGACCTT TTCTATCAAA GCCTGCCGGG AGAGCGGAAA 
CAGCGCCTGC ACTTTCACCG TTTTATGCTG CGGGTGCATG AAGAGCTAAC TGCCTTACAG 
GGGCAGACCG ATCCGCTGGA AATTATTGCC GATCGCTTTA AAGCCGAAAC TGACGTGCTC 
TGTTTTGACG AATTTTTTGT TTCTGATATT ACCGATGCCA TGCTACTTGG CGGTCTGATG 
AAAGCCCTGT TCGCTCGCGG TATTACCCTG GTAGCGACGT CAAATATTCC GCCGGATGAA 
CTTTATCGAA ATGGCCTGCA ACGTGCGCGT TTTCTGCCTG CAATCGATGC CATTAAACAG 
CATTGTGATG TAATGAACGT GGACGCTGGT GTTGATTATC GTCTGCGTAC ACTCACTCAG 
GCGCATCTGT GGCTTTCGCC ACTTCACGAT GAAACCCGGG CGCAAATGGA TAAACTATGG 
TTGGCGCTGG CGGGGGGGAA ACGAGAAAAT TCACCGACGT TAGAAATCAA CCATCGGCCA 
TTAGCAACAA TGGGCGTCGA GAACCAGACG CTGGCGGTCT CTTTTACTAC GCTGTGCGTC 
GACGCCCGCA GTCAGCATGA CTATATTGCG CTCTCACGTC TCTTTCATAC GGTCATGTTG 
TTTGATGTAC CAGTTATGAC GCGGTTGATG GAGAGCGAAG CGCGGCGCTT TATTGCGCTG 
GTGGATGAGT TTTACGAGCG CCATGTCAAA TTAGTGGTGA GTGCAGAAGT GCCGCTGTAT 
GAAATTTATC AGGGCGATCG GCTGAAGTTT GAGTTCCAGC GTTGCCTGTC ACGTCTGCAA 
GAGATGCAAA GCGAAGAGTA TCTGAAGCGC GAGCATTTGG CGGGTTAA

Protein sequence

MQSVTPTSQY LKALNEGSHQ PDDVQKEAVS RLEIIYQELI NSTPPAPRTS GLMARVGKLW 
GKREDTKHTP VRGLYMWGGV GRGKTWLMDL FYQSLPGERK QRLHFHRFML RVHEELTALQ 
GQTDPLEIIA DRFKAETDVL CFDEFFVSDI TDAMLLGGLM KALFARGITL VATSNIPPDE 
LYRNGLQRAR FLPAIDAIKQ HCDVMNVDAG VDYRLRTLTQ AHLWLSPLHD ETRAQMDKLW 
LALAGGKREN SPTLEINHRP LATMGVENQT LAVSFTTLCV DARSQHDYIA LSRLFHTVML 
FDVPVMTRLM ESEARRFIAL VDEFYERHVK LVVSAEVPLY EIYQGDRLKF EFQRCLSRLQ 
EMQSEEYLKR EHLAG