Gene EcolC_1237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1237
Symbol
ID	6067412
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1356303
End bp	1357508
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	54%
IMG OID	641600652
Product	integrase family protein
Protein accession	YP_001724230
Protein GI	170019276
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.184026
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGCAAGA CACCACTGAC AGCAAAGGCC ATAGATGCCG CACAACCACA GGACAAGCCC 
TACAAACTCA CAGATTCACA AACGCCAGGC CTTTTCTTGC TGGTCCATCC CAACGGTAGT 
AAGTACTGGC GATTCCGGTA CTGGATAGAT AAGAAAGAGC GATTACAGGC CGTCGGGGTA 
TATCCGCTGA TTAGCCTCAA GGAAGCCCGC AAACGCGCCA CAGAGAGCCG TTTACTGATA 
GCCCAGGGAA TTGACCCAAT GGAAGAAGCG CGCAAGGAGA AAGCCATTGA TGCGCTCAAC 
ATGGCGGCAA GTTTTAAGAC CGTGGCGGAG GACTGGCTTG CTACCAGGGT TAGCGGTTGG 
TCAGAGTCCT ACACGAAACA GGTCAGATCG GCACTGGAGA AAGACGTTTA TCCGGTACTT 
GGCAAGCGTT CAATCGTCGA TATAACGGCC CGTGATGTTC TGTCATTGCT TCAGAAGAAA 
GAGCGCACCG CACCGGAACA AGCCAGGAAG CTACGCCAGC GTATCGGGGA GATCTTCAAA 
TTTGCCGTTA TCACCGAACT GGTTAACCGG AATCCGGTTG CAGATCTGGA TACGGCATTG 
AAAGCCAGAC GCCCAGGCCA TAACGCATGG ATACCGATTA GTGAAATTCC GGCATTCTAC 
AAAGCCCTTG AGAGAGCCGG GAGCGTCCAG ATTCAGACGG CAATACGTTT GCTTATCCTC 
ACGGCTTTGA GGACGGCAGA GCTTCGTTTA ATGCGCTGGG AGTGGGTGGA TCTGGAGTCG 
GCAACAATCA CCCTACCCGC TGAAGTCATG AAGGCCCGCC GACCGCATGT AGTCCCGTTA 
TCCCGGCAAG CGGTCGAGCT ATTACAGGAC CAGTTTACCC GCAGCGGATA CAGTGCTTTC 
GTCTTTCCGG GCCGATTCAT GGATAAGCCA TTGTCAGCCA GTGCGATCCT TAAAGCCCTG 
GAGCGTATCG GGTACAAGTC GATCGCCACT GGTCATGGCT GGAGGACAAC GTTCAGCACA 
TCACTTAACG AAAGCGGCAG ATACAATCCC GACTGGATCG AAATCCAACT GGCCCACGTT 
CCGAAAGGTG TGCGCGGCGT TTATAACCAG GCGGCCTATC TGAAGCAACG GCGGGCCATG 
ATGCAGAACT ACAGCGACGC CATCGACCAG ATATTGGCTG GTGACGGTAA TCCACTTGAA 
CCGTGA

Protein sequence

MSKTPLTAKA IDAAQPQDKP YKLTDSQTPG LFLLVHPNGS KYWRFRYWID KKERLQAVGV 
YPLISLKEAR KRATESRLLI AQGIDPMEEA RKEKAIDALN MAASFKTVAE DWLATRVSGW 
SESYTKQVRS ALEKDVYPVL GKRSIVDITA RDVLSLLQKK ERTAPEQARK LRQRIGEIFK 
FAVITELVNR NPVADLDTAL KARRPGHNAW IPISEIPAFY KALERAGSVQ IQTAIRLLIL 
TALRTAELRL MRWEWVDLES ATITLPAEVM KARRPHVVPL SRQAVELLQD QFTRSGYSAF 
VFPGRFMDKP LSASAILKAL ERIGYKSIAT GHGWRTTFST SLNESGRYNP DWIEIQLAHV 
PKGVRGVYNQ AAYLKQRRAM MQNYSDAIDQ ILAGDGNPLE P