Gene Caul_2230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2230
Symbol
ID	5899685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2424807
End bp	2426018
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	63%
IMG OID	641562721
Product	integrase family protein
Protein accession	YP_001683855
Protein GI	167646192
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAAA ACCTGAAAAC CTGCGTCGAG CCGTATCTGG CGGCGTTCGA GCAGACCTAT 
GCCGCAGAGA ACTACCAGAC TCGGACGATC ATCGCTTATC GGTGTCTGGC GAGGAAGTTC 
GGCGCGGTTC TGGACGAAGC GGGTATCGCA CCCCCGTCCG TAACCCTCGA CTGCGTCGAG 
CCGCTGACGC GCGACCTTCC AAGAGAGCGG AAGAATACAA TACGCCTCGA CACCATCGCG 
CGCCGGTTCG TCCAACACTT GGTCGATATC GGCGTGGCGC AGCCGGTACC GCTGACAGAC 
AGTGAGATCG CGCGTGCGAC TTTGCTGGCG GACTTCGAGA CTTATCTCGC CAAACAACGC 
GGCCTCAGTC CGCGCAGTAT TCCGCACTCG GTGGGTTTTG CGCGCCGCTT CCTCGACTAT 
CGGTTTGGCA AGGCATTGCC CGATCCGGGT CGCCTGTGCC CCGCCGACGT AATCGGCTTC 
ATGGAGCATG TGCTGGCCAG CGCGCGTCGC GACAAGACGG TGGCGACCCA CGTCCGTATC 
TTTCTTCAAT ACCTGTTCGC GCGCGGCGCG ACCGCGACCA ATCTGGCGCT GAGCGTTCCG 
AAGACGGCGA AACGCTGGGC TGCACGAATG CCGCGTCACT TGTCGCCCGA TGGTGTCGAG 
GCCGTGCTCG CGTCTGTTCG CGACAATCAC CTGCATGGTG CGCGGGATTA TGCGATGCTG 
TTGGTCATGG CCCGGCTCGG GCTGCGTGCG GCCGAGGTCG TCGCGATCCA ACTCGACGAT 
ATCGACTGGC GCGCGGGCGA ACTGATGGTG CGCGGCAAGG GCAAGCTGCA CGACCGTCTG 
CCGCTCACCG CGGAGGTCGG CGACGCGCTG AGCCGGTATC TTCGTGAGGA GCGAGGACCG 
GCGACCTGTC GCACGCTGTT CGTCGCACAT CGCGCGCCAC ATCGACCGTT CAAGGATGGG 
ACGATCGTCA ACGCCATCCT CAAAGATGCC TTGAAAGCGA CCGGCCAAAA GCCGGTGACG 
CCTTATGTGG GATCGCACCT GCTGCGTCAT AGCCTTGCCA CCCAACTGGT GAACACGGGT 
GCATCGCTCG ACGAAGTGGG TGACATGTTG CGACACCGAT CGCGGTCATC GACGATGATA 
TATGCGCGGC TCGACATCGA CGGGCTGCGG TCGATCGCGC AGCCCTGGCC GGTTGCGGGA 
GGCACGCTAT GA

Protein sequence

MSENLKTCVE PYLAAFEQTY AAENYQTRTI IAYRCLARKF GAVLDEAGIA PPSVTLDCVE 
PLTRDLPRER KNTIRLDTIA RRFVQHLVDI GVAQPVPLTD SEIARATLLA DFETYLAKQR 
GLSPRSIPHS VGFARRFLDY RFGKALPDPG RLCPADVIGF MEHVLASARR DKTVATHVRI 
FLQYLFARGA TATNLALSVP KTAKRWAARM PRHLSPDGVE AVLASVRDNH LHGARDYAML 
LVMARLGLRA AEVVAIQLDD IDWRAGELMV RGKGKLHDRL PLTAEVGDAL SRYLREERGP 
ATCRTLFVAH RAPHRPFKDG TIVNAILKDA LKATGQKPVT PYVGSHLLRH SLATQLVNTG 
ASLDEVGDML RHRSRSSTMI YARLDIDGLR SIAQPWPVAG GTL