Gene EcolC_0053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0053
Symbol
ID	6068469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	54119
End bp	55294
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	41%
IMG OID	641599456
Product	integrase family protein
Protein accession	YP_001723066
Protein GI	170018112
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.613927
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCTAA CCGATACACA GATCAAACGT GCAAAACCAC AAGACAAGCC ATACACATTG 
AACGATGGAC AAGGTCTGTC GTTGCTTATC AATCCAGATG GCACGAAAGG CTGGCGTTTC 
CGTTTCAGAT TTGCTGGGAA AGCGCGGTTA ATGTCATTTG GCAGCTATGA TTTAGTAAGC 
CTCGCAGAAG CACGTGAGAA GCGTGACATC GCCCGTAAGC AGGTTGCTAA TGGCATTGAC 
CCAGTAGAGG AACGCAAAGC TTTAAGACTC GCTCAAAAGC TATCAACAGA AAATTCTTTC 
GAAGCAATAT GTCGAGAATG GCATACCAAC AAAGCTGACC GCTGGACGGT GGCCTATCGA 
GAAGAAATTA TGAAGACTTT TGAGCAAGAT GTATTCCCTT TCATTGGTAA ACGCCCTATC 
AGTGAAATTA AACCATTAGA ACTGCTCGAA GTATTGCGAA GAATAGAAAA GCGTGGGGCA 
TTAGAGAAGA CCAGAAAAGT GCGGCAAAGA TGTGGTGAAG TCTACCGCTA TGCGATCATA 
ACTGGCCGTG CTGAATACAA TCCTGCGCCT GATTTAGCCA TCGCTCTGGC TGTTCCTAAG 
CAAAAACATC ATCCTTTTTT ATCCGCTGAA GAGCTACCTC ATTTCATTCA GGATTTGGAA 
GCGTATACCG GAAGTATCAT TACTAAAAAT GCTACTAAGA TAGTTATGCT GACCGGCGTT 
AGAACGCAGG AAATGCGTTT GGCTACTTGG AATGAGGTTG ATCTTGAGAA AGGCATATGG 
GAAATACCTG CAGAAAGGAT GAAAATGCGT AGGCCACACA TTGTTCCTTT ATCTACTCAG 
GTAATTGCCC TTTTCGAACA ACTCAAGCCT ATTACCGGCC ATTACCCCTA CATATTTATT 
GGAAGGAACA ATCGTAGCAA ACCAATTTCA AAAGAAAGCG TATCTCAAGT AATTGAGTTA 
CTTGGTTACA AAGGACGTGC TACAGGTCAC GGTTTTAGAC ATTCATTATC GACAATCTTA 
CATGAACATG GATTTGATAG TGCATGGATT GAGATGCAAT TAGCACATGT TGATAAAAAC 
AGTATAAGAG GTACTTATAA TCATGCTCAA TATTTAGAGA AAAGATTACA TATGATGCAG 
TGGTATAGTG ACTTACTTTA TCCAAAAATA AAATAA

Protein sequence

MALTDTQIKR AKPQDKPYTL NDGQGLSLLI NPDGTKGWRF RFRFAGKARL MSFGSYDLVS 
LAEAREKRDI ARKQVANGID PVEERKALRL AQKLSTENSF EAICREWHTN KADRWTVAYR 
EEIMKTFEQD VFPFIGKRPI SEIKPLELLE VLRRIEKRGA LEKTRKVRQR CGEVYRYAII 
TGRAEYNPAP DLAIALAVPK QKHHPFLSAE ELPHFIQDLE AYTGSIITKN ATKIVMLTGV 
RTQEMRLATW NEVDLEKGIW EIPAERMKMR RPHIVPLSTQ VIALFEQLKP ITGHYPYIFI 
GRNNRSKPIS KESVSQVIEL LGYKGRATGH GFRHSLSTIL HEHGFDSAWI EMQLAHVDKN 
SIRGTYNHAQ YLEKRLHMMQ WYSDLLYPKI K