Gene EcolC_2069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2069
Symbol
ID	6067550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2274292
End bp	2275605
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	48%
IMG OID	641601477
Product	integrase catalytic region
Protein accession	YP_001725036
Protein GI	170020082
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAAAG AGACTGTTAC GATGAGTCAT AAGGAACTCC ACCGACTTCA GATTATTCAG 
GAACAAGCTG CGGCACGCAT TGGCATTTCT ATTCGGCAGG TTAAACGTCT GGTGCAACGG 
TATAGAAATG AAGGGCCTTC TGGTCTGGTT TCCCACCGAC GTGGAAAGCG TCCTAATAAT 
TCCTTTTCTA CTGAATTCAG AGCAACAGTA ATTTCACTCC TCAAAGGCCG TTACGCTGAT 
TTTGGACCTA CGTTTGCGTG CGAAAAATTG CGCGAGATAC ACGGTTTATC TTTATCCGTT 
GAAACTCTCA GAAAGTGGAT GATAGAAGAG GGGTTATGGC GTGAACGCCG TCGTAAAATT 
GCCCGTATAT ATCAACGCCG CATGCGACGA CCATCTTACG GTGAACTGAT CCAGGTTGAT 
GGCTCACCTC ATGACTGGTT TGAAAATCGA GGCCCCAGAT GTACACTGAT CGTTTTCATT 
GATGATGCCA CCAGTGCGTT GATGGCGTTG CGTTTTGTGC CTGCTGAAAC AACCCGGGCT 
TACATGGAAA CCCTCCGGGG TTACCTTAAT GATCATGGCG TACCGCTCGC TCTCTACTCT 
GATAGACACA GTATATTCAG GGTAAATAAC CCAGAGCGGG AAGGTGAGCT GACCCAGTTC 
ACTCGTGCGA TAAAGACACT GGGCATCGAG CCAATCCATG CCAACAGCCC GCAGGCAAAA 
GGGCGGGTAG AGCGCGCCAA TCAGACACTA CAGGACAGGC TGGTCAAAGA AATGCGGCTT 
CAGAATATCA GTGATATTGA AACAGCAAAT GCATGGTTGC CGACCTTTAT TGAAGCCTAT 
AACAACCGGT TCGCTACGTC GCCTCGTACT ACTGATAATG CTCATCTTGA TGTGCACCAT 
TCTGAAGAGG AACTGGGTTA TATCTTCAGC CTACAGGCGA AGCGCGTTCT GTCTAAAAAT 
CTCACTTTCC AGTACAAAAG CAGTGCGTTT CAGGTACGCA GTGAGGGCCG GGGATATCGA 
CTTAGGCATT CGGTTGTTAC TGTATGCGAG AACTTTGACG GTGAAATTAA CGTTCTGTAT 
GACGGGAAAG CGCTGGGCTG GGAAAAGTAT GTTGATGGCC CGGAGCCTAT ACCACTGGAT 
GATGAAAAGA GTGTCCATGA ACGAGTGGAT AATGCCCGTA TTGATTTACG CTCAAAATAC 
TATGTTAAAC CTAAAGCTGA CCATCCCTGG CTTACGCGCC GAACGCAAAG TCATCAGCAA 
GTTAAGCCCC CGAAGTTACC TAAAAAGAAG CCTGATCCCG ATAAAAAAGA TTGA

Protein sequence

MIKETVTMSH KELHRLQIIQ EQAAARIGIS IRQVKRLVQR YRNEGPSGLV SHRRGKRPNN 
SFSTEFRATV ISLLKGRYAD FGPTFACEKL REIHGLSLSV ETLRKWMIEE GLWRERRRKI 
ARIYQRRMRR PSYGELIQVD GSPHDWFENR GPRCTLIVFI DDATSALMAL RFVPAETTRA 
YMETLRGYLN DHGVPLALYS DRHSIFRVNN PEREGELTQF TRAIKTLGIE PIHANSPQAK 
GRVERANQTL QDRLVKEMRL QNISDIETAN AWLPTFIEAY NNRFATSPRT TDNAHLDVHH 
SEEELGYIFS LQAKRVLSKN LTFQYKSSAF QVRSEGRGYR LRHSVVTVCE NFDGEINVLY 
DGKALGWEKY VDGPEPIPLD DEKSVHERVD NARIDLRSKY YVKPKADHPW LTRRTQSHQQ 
VKPPKLPKKK PDPDKKD