Gene Caul_5238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5238
Symbol
ID	5897290
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010335
Strand	+
Start bp	169953
End bp	171251
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	65%
IMG OID	641555341
Product	integrase catalytic region
Protein accession	YP_001676672
Protein GI	167621887
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTTGC ATTTCATGAG CGACAAGGAG CTCTCGCGGC TGGAGATCCT ACGCGATCTC 
GCTAGCGGCC GGCTCACGAC GCCGGCGGCG GCGCAGCTGC TGGGCCTGGA GCGACGCCAG 
GTTCAGCGAT TGGCCAAGGC CTATCAGGAG CAAGGCGCCA CGGCGCTGAT CTCCAAGAAG 
CGCGGTCAGC CGAGCAACCG GCGCACGCCG TCGATCGTCA AGACGCAGGC GCTGGAGCTG 
ATCCGTGAGC GGTACTCGGG ATTTGGTCCG ACGCTGGCGG CCGAGAAGCT GCGTGAGCTC 
CACGGTGTGT ATATCGGGCG TGAGACGCTG CGGATTTGGA TGCTGGAAGC CGGGCTCTGG 
GCCGATCGCC AGAAGCGGCG TGGCCGGGTC TACCAACCGC GCTATCGGCG AGAATGCGTC 
GGTGAGCTCA TCCAGGTCGA CGGGTCCGAT CACTTCTGGT TCGAGGACCG CGCCGACAGC 
TGCACGCTGC TGGTCTTCAT CGACGACGCC ACCAGCCGGC TCATGCACCT GCAGTTCGTC 
CAGTCAGAGT CGACCTTCGC CTACTTCAAC GCCACCCAGC GCTACCTTGA GGCCCACGGC 
AAGCCGATCG CCTTCTACAC CGACAAGCAT GCGGTCTTTC GTGTGAACAA GGCTGGCGGT 
CTTCATGGTG ACGGCATGAC CCAGTTCGGC CGCGCGCTCA AAGCCCTGAG CATCGAGATC 
ATCTGCGCCA ACTCCAGCCA GGCCAAGGGC CGTGTCGAGC GAGCCAACAA GACCCTCCAG 
GACCGGCTGG TGAAGGAGCT CCGGCTCGCC GGCGTCAGCT CGATGGACGA CGGCAACGCC 
TTTCTGCCGA GCTTCATCGC CGACTACAAC GCGCGCTTCG CCAAGGCGCC GTTCAACGAC 
AAGGACCTGC ACCGGCCCAT GGCGCCGCGA GACCGGTTGG ACGAGGCCTT CACCTGGCGC 
GCTGAGCGGA CCCTCTCACA GGCGCTGACG CTCCAGTACG ACAACATCCT CTTCATGATC 
GAACCGTCCG AGTTCGCGCA AGGAGCGATC GGCCAGCGCG TCGAGGTCGT CGACTTCCCC 
GATGGCCGCC TGGAGATCCG CCACAAGGGT CTCAGCATGC CCTACCGGAC CTTCGACAAG 
GTTCGGCGCG TCACAGAGAC GGCCGTGATC GAGAACAAGC GGCTGGGCGG CCTGCTCGCC 
TTGATCAAAC AGAGCCAGGA GGCCGGGCCG GCTGGGGCAC GCACCCGTAA AGGTCCCAGG 
CGCCGCGATC AGACCAACCA TATGTTCGGC GTCGGCTGA

Protein sequence

MALHFMSDKE LSRLEILRDL ASGRLTTPAA AQLLGLERRQ VQRLAKAYQE QGATALISKK 
RGQPSNRRTP SIVKTQALEL IRERYSGFGP TLAAEKLREL HGVYIGRETL RIWMLEAGLW 
ADRQKRRGRV YQPRYRRECV GELIQVDGSD HFWFEDRADS CTLLVFIDDA TSRLMHLQFV 
QSESTFAYFN ATQRYLEAHG KPIAFYTDKH AVFRVNKAGG LHGDGMTQFG RALKALSIEI 
ICANSSQAKG RVERANKTLQ DRLVKELRLA GVSSMDDGNA FLPSFIADYN ARFAKAPFND 
KDLHRPMAPR DRLDEAFTWR AERTLSQALT LQYDNILFMI EPSEFAQGAI GQRVEVVDFP 
DGRLEIRHKG LSMPYRTFDK VRRVTETAVI ENKRLGGLLA LIKQSQEAGP AGARTRKGPR 
RRDQTNHMFG VG