Gene Caul_2255 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2255
Symbol
ID	5899710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2448991
End bp	2450499
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	68%
IMG OID	641562746
Product	integrase catalytic region
Protein accession	YP_001683880
Protein GI	167646217
COG category	[L] Replication, recombination and repair
COG ID	[COG4584] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.659658
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTGGAGA CTGTGGTGCG GATTCGCCGC GAGTATGCGG CGGGCAAAGC GATCAAGGCG 
ATCTGCCGGG ATTTGAGACT GTCGCGGAAG GTCGTGCGCA AGGCGATCCG GGCAGAGGAA 
GGCGCGTTCA GCTATCAGCG GACGACGCAG CCGTTTCCGA AGATCGGGCC GGTGCGTGAT 
CGGCTTGTGC AACTTCTGAC GGAGAACGAG GCGCGGCCCC GGCGGGACCG TTTGCGACTG 
ACGCGGGTCT GGGACCTGTT GGTCCAGGAA GGCTACGACG GCTCCTATGA CTCGGTCCGT 
CGTTACGCGG CCCGCTGGCG CGAGGAGACC AAGACGGCCC CAGGCGATGG CGGGACAGCG 
TTCGTGCCGC TGATGTTCGC GCCGGGCGAG GCGTTCCAGT TCGACTTCAG TCATGAGGAC 
GTGGAGGTCG CCGGCCAGCC GATGCGGGTG AAGGCGGCCC ATGTTCGGCT TTGCGCGTCG 
CGTGCGGTCT ACGTCAGGGT TTATCCGCGT GAGACCCAGG AGATGGTGTT CGACGCCCAT 
GCCCGGGCGT TCGCCTTCTT CGGCGGGGTC CCGACGCGGG GCATCTACGA CAACATGAAG 
ACCGCCGTTG ACGCGGTGTT CTTGGGCAAA CAGCGGGTCT TCAACCGTCG CTTCCTGCTG 
ATGGCCGATC ATTACATGTT CGAACCGACT GCTTGCACGC CCGCCGCGGG CTGGGAGAAG 
GGCCAGGTCG AGAACCAGGT GCAGACCAGC CGGGAGCGGT TCTTCAAACC GCGCTTGCGG 
TTCGCCAGCC TCGAAGAGCT GAACGGCTGG CTGGAGGCCG AGTGCCGCCG CTGGGCGCGC 
CTACACCCCC ATCCCGAGCA GCGCGAGATC ACCTTGGCCC AGGCCTTGGA GGCCGAGCGG 
CCGGCGCTGC AGGCGATCCT GGCGCCGTTC GACGGCTTCC ACGAGGTCGA GCACGCGGTG 
ACCGGCACCT GCCTGATCAC CTTCGACCGC AACCGCTACT CGGTGATGGC CAAGGCCGCC 
AAGCGCACGG TGCAGGTGCG CGCTTATGCC GACAAGATCG TCGTACGCTG CGCCGGCGAA 
GTCGTCGCCG AGCATGCCCG GTCCTTCGGC CGGGGCCGGA CGATCTATGA TCCCTGGCAC 
TACCTGCCGG TCCTGGCCCG CAAGCCGGGC GCTCTACGCA ACGGCGCGCC GTTCCAGGAT 
TGGTCCCTGC CGCCGGCCCT GACGCGGCTC AGCAAGAAGC TGGGGCGTGG CGACGAGGCC 
GACCGCCGGT TCGTTCGCGT GCTGGCGGCG GTGCTGATCG ATGGCCTGGA TGTGGTCGAT 
GACGCCGTCC GCGAGGCCCT GGACGCCGGC GCGGCTAGCG ATGAGGTCAT CCTCAACATC 
CTGGCCCGGC GACGCGAGCC GCCAGCGCCA CAGCCGATCA CCACCTGCGA GGCGCTGGTC 
CTGCGCCATC CGCCCATCGC AGACTGCGCC CGCTACGACC TGCTGCGAGG CCCCCGTGCA 
GCGGCATGA

Protein sequence

MVETVVRIRR EYAAGKAIKA ICRDLRLSRK VVRKAIRAEE GAFSYQRTTQ PFPKIGPVRD 
RLVQLLTENE ARPRRDRLRL TRVWDLLVQE GYDGSYDSVR RYAARWREET KTAPGDGGTA 
FVPLMFAPGE AFQFDFSHED VEVAGQPMRV KAAHVRLCAS RAVYVRVYPR ETQEMVFDAH 
ARAFAFFGGV PTRGIYDNMK TAVDAVFLGK QRVFNRRFLL MADHYMFEPT ACTPAAGWEK 
GQVENQVQTS RERFFKPRLR FASLEELNGW LEAECRRWAR LHPHPEQREI TLAQALEAER 
PALQAILAPF DGFHEVEHAV TGTCLITFDR NRYSVMAKAA KRTVQVRAYA DKIVVRCAGE 
VVAEHARSFG RGRTIYDPWH YLPVLARKPG ALRNGAPFQD WSLPPALTRL SKKLGRGDEA 
DRRFVRVLAA VLIDGLDVVD DAVREALDAG AASDEVILNI LARRREPPAP QPITTCEALV 
LRHPPIADCA RYDLLRGPRA AA