Gene EcolC_0474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0474
Symbol
ID	6068433
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	515700
End bp	516827
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	52%
IMG OID	641599879
Product	AFG1 family ATPase
Protein accession	YP_001723478
Protein GI	170018524
COG category	[R] General function prediction only
COG ID	[COG1485] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000625697
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.126668
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAGCG TTACCCCAAC ATCGCAATAC CTGAAGGCGC TCAATGAAGG CAGCCATCAA 
CCCGACGACG TTCAAAAAGA GGCCGTCAGC CGCCTGGAAA TTATTTATCA AGAACTCATC 
AATAGCAGGC CACCAGCCCC CAGGACGAGT GGGCTAATGG CGCGGGTCGG TAAGCTGTGG 
GGTAAACGCG AAGACACAAA GCATACGCCA GTGCGTGGCT TATATATGTG GGGCGGTGTA 
GGACGCGGGA AAACCTGGCT GATGGACCTT TTCTATCAAA GCCTGCCGGG AGAGCGGAAA 
CAGCGCCTGC ACTTTCACCG TTTTATGCTG CGGGTGCACG AAGAGCTAAC TGCCTTACAG 
GGGCAGACCG ATCCGCTGGA AATTATTGCC GATCGCTTTA AAGCCGAAAC TGACGTGCTC 
TGTTTTGACG AATTTTTTGT TTCTGATATT ACCGACGCCA TGCTACTTGG CGGTCTGATG 
AAAGCCCTGT TCACCCGCGG TATTACCCTG GTAGCGACGT CAAATATTCC GCCGGACGAA 
CTTTATCGAA ATGGCCTGCA ACGTGCGCGT TTTCTGCCTG CAATCGATGC CATTAAACAG 
CATTGTGATG TAATGAACGT GGACGCTGGT GTTGATTATC GACTGCGTAC ACTCACTCAG 
GCGCATCTGT GGCTTTCGCC ACTCAACGAT GAAACCCGGG CGCAGATGGA TAAACTATGG 
TTGGCGCTGG CGGGGGCGAA ACGAGAAAAT TCACCGACGT TAGAAATCAA CCATCGGCCA 
TTGGCGACAA TGGGCGTCGA GAACCAGACG CTGGCGGTCT CTTTTACTAC GCTGTGCGTC 
GACGCCCGCA GTCAGCATGA CTATATTGCG CTCTCACGTC TCTTTCATAC GGTCATGTTG 
TTTGATGTAC CAGTTATGAC GCGGTTGATG GAGAGCGAAG CGCGGCGCTT TATTGCGCTG 
GTGGATGAGT TTTACGAGCG CCATGTCAAA TTAGTGGTGA GTGCAGAAGT GCCGCTGTAT 
GCAATTTATC AGGGCGAGCG GCTGAAATTT GAGTTCCAGC GTTGCCTGTC ACGTCTGCAA 
GAGATGCAAA GCGAAGAGTA TCTGAAGCGC GAGCATTTAG CAGGTTAA

Protein sequence

MQSVTPTSQY LKALNEGSHQ PDDVQKEAVS RLEIIYQELI NSRPPAPRTS GLMARVGKLW 
GKREDTKHTP VRGLYMWGGV GRGKTWLMDL FYQSLPGERK QRLHFHRFML RVHEELTALQ 
GQTDPLEIIA DRFKAETDVL CFDEFFVSDI TDAMLLGGLM KALFTRGITL VATSNIPPDE 
LYRNGLQRAR FLPAIDAIKQ HCDVMNVDAG VDYRLRTLTQ AHLWLSPLND ETRAQMDKLW 
LALAGAKREN SPTLEINHRP LATMGVENQT LAVSFTTLCV DARSQHDYIA LSRLFHTVML 
FDVPVMTRLM ESEARRFIAL VDEFYERHVK LVVSAEVPLY AIYQGERLKF EFQRCLSRLQ 
EMQSEEYLKR EHLAG