Gene EcolC_2889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2889
Symbol
ID	6065335
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	3147081
End bp	3148151
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	45%
IMG OID	641602294
Product	lambda integrase
Protein accession	YP_001725843
Protein GI	170020889
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00939202
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0727877
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAAGAA GGCGAAGTCA TGAGCGCCGG GATTTACCCC CTAACCTTTA TATAAGAAAC 
AATGGATATT ACTGCTACAG GGACCCAAGG ACGGGTAAAG AGTTTGGATT AGGCCGAGAC 
AGGCGAATCG CAATCACTGA AGCTATACAG GCCAACATTG AGTTATTTTC AGGACACAAA 
CACAAGCCTC TGACAGCGAG AATCAACAGT GATAATTCCG TTACGTTACA TTCATGGCTT 
GATCGCTACG AAAAAATCCT GGCCAGCAGA GGAATCAAGC AGAAGACACT CATAAATTAC 
ATGAGCAAAA TTAAAGCAAT AAGGAGGGGT CTGCCTGATG CTCCACTTGA AGACATCACC 
ACAAAAGAAA TTGCGGCAAT GCTCAATGGA TACATAGACG AGGGAAAGGC GGCATCAGCC 
AAGTTAATCA GATCAACACT GAGCGATGCA TTCCGAGAGG CTATGGCTGA AGGCCATATA 
ACAACAAACC CGGTCGCAGC CACTCGCGCT GCAAAATCAG AGGTAAGGAG ATCAAGACTT 
ACGGCTGACG AATACCTGAA AATTTATCAA GCAGCAGAAT CATCACCATG TTGGCTTAGA 
CTTGCAATGG AACTGGCTGT TGTTACCGGG CAGCGAGTTG GTGATTTATG CGAAATGAAG 
TGGTCTGATA TCGTAGATGG ATATCTTTAT GTCGAGCAAA GCAAAACAGG CGTAAAAATT 
GCCATCCCAA CAACATTGCA TGTTGATGCT CTCGGGATAT CAATGAAGGA AACACTTGAT 
AAATGCAAAA AGATTCTTGG CGGAGAAACC ATAATTGCAT CTACTCGTCG TGAACCGCTT 
TCATCCGGCA CAGTATCAAG GTATTTTATG CGCGCACGAA AAGCATCAGG TCTCTCCTTC 
GAAGGGGATC CGCCAACCTT TCACGAGTTG CGCAGTTTGT CTGCAAGACT CTATGAGAAG 
CAGATAAGCG ATAAATTTGC TCAACATCTT CTCGGGCATA AGTCGGACAC CATGGCATCA 
CAGTATCGTG ATGACAGAGG CAGGGAGTGG GACAAAATTG AAATCAAATA A

Protein sequence

MGRRRSHERR DLPPNLYIRN NGYYCYRDPR TGKEFGLGRD RRIAITEAIQ ANIELFSGHK 
HKPLTARINS DNSVTLHSWL DRYEKILASR GIKQKTLINY MSKIKAIRRG LPDAPLEDIT 
TKEIAAMLNG YIDEGKAASA KLIRSTLSDA FREAMAEGHI TTNPVAATRA AKSEVRRSRL 
TADEYLKIYQ AAESSPCWLR LAMELAVVTG QRVGDLCEMK WSDIVDGYLY VEQSKTGVKI 
AIPTTLHVDA LGISMKETLD KCKKILGGET IIASTRREPL SSGTVSRYFM RARKASGLSF 
EGDPPTFHEL RSLSARLYEK QISDKFAQHL LGHKSDTMAS QYRDDRGREW DKIEIK