Gene Caul_2217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2217
Symbol
ID	5899672
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2414560
End bp	2415816
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	64%
IMG OID	641562709
Product	integrase family protein
Protein accession	YP_001683843
Protein GI	167646180
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.664863
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.427624
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCACCG ATGCCGCACT CAAGTTTTTG AAACCAAAGA AGAAACCGTA CAAGGTCGCG 
GACCGTGACG GTATTTACGT CGTGGTCTCT CCCGCCGGGT CCATCACCTT CCGGCTCGAC 
TACCGGATCA ACAACCGCCG GGAGACCCTG ACGCTAGGTC GTTACGGGCG CGATGGCGTC 
AGTCTGCTCA AGGCGCGCGA GCTTGGGATG GAAGCTCGGC GCAGGGTGAG GGAAGGGGTC 
TCGCCGGCGA TCGAAAAGCA GCGTGACAAG GCGCGCATCA AGGCGGCCAA GACCTTCGCC 
GATTTCGGGC GCAAGTGGAT CGAGGAAGGC CGCATGGCCG ATAGCACTCG CGCCATGCGC 
CGCGCGATCT ACGAGCGCGA CGTCGAGCCG GCCTTCAAGA ACCGGATGCT GACCGAGATC 
GAACCGGGCG ATGTTCGCGC GCTCTGCCAA CTGGTGAAGG ATCGCGGGGC GCCCGCGACC 
GCCATCCACA TCCGCGATCA GATCAACCTG ATCTTCGCCT TCGCGCGCCT GCACGGCGAG 
AAGGTGGAAA ACCCCGCCAA GGATGTCAGC CCGTCGTCGA TCTGGTCTTT CACGCCGCGC 
GAGCGGGCGT TGTCGCCCAA GGAGATCCGG CTGCTCTATC CGCTCCTTGA GCAGGTCCCG 
ACCTTGCCGA CGATCCGGCT TGGCATGAAG CTCATCCTGC TGACCCTGGT GCGCAAGAGC 
GAGCTGCAGG ACGCCACCTG GGACGAGGTC GACTTCGTCA ACGCGATCTG GAGCATTCCC 
GCCGCCCGGA TGAAGGCCAG CCGGGCCCAC AACATCTACC TGTCGACCCA GGCCCTCGAC 
ATCATGATCG CGCTGAAGAC CTGCGCGGGA AATTCACCGT ACCTCCTGCC TTCGCGCTAT 
GAGGCCGACC AGCCCATGTC GCGGGCTACG TTCAACCGCG TAACCATGAG CATTGCCGAG 
CGGGCCAAGG CGCAGGGGCT CCCGCTCGCG CCGTTCACGG TTCACGACCT GCGCCGGACC 
GGCTCGACCC TGCTCAACGA GATCGGATTC GAAAGCGACT GGATCGAGAA GTGCCTGGCC 
CACGTCGATC GGCGAACCTC CCGTCGCGTC TACAATGTCG CCGAGTACGC CCAGCAGCGC 
CGGCACATGC TTCAGGAGTG GGCGGACATG ATCGACGCCT GGGTGCGGGG CGAGCGGCAT 
GTCCCGACCT TAAAACCGGC TGACATTCAC GGGGTTACGC TGGATCCACG GGCCTGA

Protein sequence

MLTDAALKFL KPKKKPYKVA DRDGIYVVVS PAGSITFRLD YRINNRRETL TLGRYGRDGV 
SLLKARELGM EARRRVREGV SPAIEKQRDK ARIKAAKTFA DFGRKWIEEG RMADSTRAMR 
RAIYERDVEP AFKNRMLTEI EPGDVRALCQ LVKDRGAPAT AIHIRDQINL IFAFARLHGE 
KVENPAKDVS PSSIWSFTPR ERALSPKEIR LLYPLLEQVP TLPTIRLGMK LILLTLVRKS 
ELQDATWDEV DFVNAIWSIP AARMKASRAH NIYLSTQALD IMIALKTCAG NSPYLLPSRY 
EADQPMSRAT FNRVTMSIAE RAKAQGLPLA PFTVHDLRRT GSTLLNEIGF ESDWIEKCLA 
HVDRRTSRRV YNVAEYAQQR RHMLQEWADM IDAWVRGERH VPTLKPADIH GVTLDPRA