Gene EcolC_0052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0052
Symbol
ID	6068439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	52323
End bp	54089
Gene Length	1767 bp
Protein Length	588 aa
Translation table	11
GC content	31%
IMG OID	641599455
Product	hypothetical protein
Protein accession	YP_001723065
Protein GI	170018111
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAAG GTACTATAGT ATCTATATTG ATTCGTATAT TGAAAGAGAA ACGTGATGGT 
CTGATATTAA TAAATGGGGA ATGGGGTGTA GGTAAGACAT ATTTCCTTCG AACTGAATTT 
AGAACACTTT ATTCAGATAC GAGTCATTTT TATTTGTCTG TTCTTGGGTT AAACAGTTTA 
CAAGATTTTA AAGATAGAAT GCTAAGCATA ACGTATCTAA ACACCCCTTC AGAGATAAAA 
AAACTTGGGG ATTTAACCTC AAGCGCTGCA TCAGCATTAA CCCAAGACGA AAGCACTGGA 
AAGTTGACAG AACAAATTAT ATCTACCATT TCAGGTGCAA TGAGAGATTA TGTACTTAAG 
GATCTTTCAG GGGTTTTTGT CATTGATGAT CTAGAAAGAA TCCCTCAATC TTTGAGAGAT 
GAAATAGCAA CCTTTTGCCT ACAAAGTTAT CAAAATGATA ATCGGTTAGA CTTTATTTTA 
GTGGGTAACT TTTCAAAGCA GAGTAGTGAG GTATTAAGTC ATAAAGAAAA AGTTGTAAGC 
GACGAAATAT ATTTCTCTAT TAATAACCTT ACCGATATAT TAGAGCAAAA ACTGGCTCCA 
TTAGAAGAGA GACATAAATA TTTAATCACT CAGGTTATTA TTGGGTTCGA AGAAACAAAC 
CTACGAATTA TTAATAGAGT AATTTCAAAA TTGACACCTC TTTTTGAAAA ACAAGAACCT 
GAGCAAAAAA TCTCTGATAT AGACATCAAA AACCTAGTCA CTTCACTTTG TGCTCATATA 
ATACTAAAAG AGAAATTTTC ATATCAAGAG AATGATTTTC ATCATAATTA TATCACATCT 
TCTTTCAAAA CACTTACGAC TTCATCTGAG AATGATCCAG ATAAAATAAG CGAAGAAGAG 
AGTAACCTTT TAAATATCAC TGCTCATATG ACTTATAACA ACTTAATGGT TCCATATTGT 
TTTAATGAGA TATCTCAAAA GGATATAATT CCATACATAT TCAATTCACA AGAACCTTTA 
AAAAAAAGTG ATTATGCCAC ATTAAAACAA CCGGAATGGT ATAATATACC TGAAAATGAT 
TATTTGGATG AAATTAAAAA AGTAATACTA AAAACTTCAT CACCGACACT ATCTACTTGG 
CTAATCGCTA CAAACAACTA TATTAGACTC TCAAAATCAA AATACATCCC TCGCATAAGA 
GGGTTAACCA ACAAAACCAT TGAAAAAAAC AAACGTAGCT TTAGTAATAA AGAAATAAAA 
GAATATTTCC TAGAATCAAA TCCCAATATT GATAATATTC CACCACATAT ATTAAGGAGA 
GAAGGAAATG AACTTCATAA TTACTTCCTT GATAAATATT GCGATATAAT AAAGGAGGAG 
AAAATAAAAG AATTGAAAGA AAAAATGAAT GTTAACGGTT GGAGTGCTAT TGATATGGAT 
ATTTATCAAT CAAAATTCAA ATTTAATCCA CTTGAAACAT TAGATGTAAA CCTAATCATA 
CATGGAATAA AAAACACTTG GTCCATTCGC GATATTCAGT TGTTTTCAAA CCATCTATCA 
TCACTCTATA ACTTCTCAAA TCTTGCGGAC TACCTTTCTG CTGAACTACC ATACCTTAAG 
AAGCTACATT CAGCCATAAA CGCTCATCAT AAAAAAATTA ACAGTTCTTT TCGACGCGGA 
GCCATAATTG AACTAACAGA ATGCGTTAAA CGCATAAAAG AAGCTTTAGA ACAAAGCATC 
GCTTTAAAAG AAGACGCATC GCAATAA

Protein sequence

MTKGTIVSIL IRILKEKRDG LILINGEWGV GKTYFLRTEF RTLYSDTSHF YLSVLGLNSL 
QDFKDRMLSI TYLNTPSEIK KLGDLTSSAA SALTQDESTG KLTEQIISTI SGAMRDYVLK 
DLSGVFVIDD LERIPQSLRD EIATFCLQSY QNDNRLDFIL VGNFSKQSSE VLSHKEKVVS 
DEIYFSINNL TDILEQKLAP LEERHKYLIT QVIIGFEETN LRIINRVISK LTPLFEKQEP 
EQKISDIDIK NLVTSLCAHI ILKEKFSYQE NDFHHNYITS SFKTLTTSSE NDPDKISEEE 
SNLLNITAHM TYNNLMVPYC FNEISQKDII PYIFNSQEPL KKSDYATLKQ PEWYNIPEND 
YLDEIKKVIL KTSSPTLSTW LIATNNYIRL SKSKYIPRIR GLTNKTIEKN KRSFSNKEIK 
EYFLESNPNI DNIPPHILRR EGNELHNYFL DKYCDIIKEE KIKELKEKMN VNGWSAIDMD 
IYQSKFKFNP LETLDVNLII HGIKNTWSIR DIQLFSNHLS SLYNFSNLAD YLSAELPYLK 
KLHSAINAHH KKINSSFRRG AIIELTECVK RIKEALEQSI ALKEDASQ