Gene Caul_0566 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0566
Symbol
ID	5898021
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	615348
End bp	616853
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	68%
IMG OID	641561048
Product	integrase catalytic region
Protein accession	YP_001682197
Protein GI	167644534
COG category	[L] Replication, recombination and repair
COG ID	[COG4584] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.478269
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAGACGG TGGCGAAGAT CCGGCGCGAG CATTTCGGCC GGGGCAAGGG CATGAAGACG 
ATCGCGCGGG AGCTGGGGCT ATCGCGCAAC ACGGTGCGCA AGGTGCTGAG GTCGGGCGAG 
ACCTCGTTCG AGTATGAGCG GACAGAGCAG CCGCATCCCA AGCTGGGGGC CTTCATCGGG 
CGGCTGGAGG CGATGCTGGA GACCAACGCG TCCGGCGCCA GGAAGGACCG GCTGACGCTG 
ACGCGGATTG CCGACCTGTT GGGCCGCGAG GGTTATGACG GCGGCTACGA TGCGGTCCGC 
CGATACGCTG GCCGTTGGAC AGCCAAGCGC CGGGGCGTGA GCTCGCCGGT CGAGGCGTTC 
GTGCCGCTGA GCTTTGCGCC GGGCGACGCC TACCAGTTTG ACTGGAGCCA CGACCAGGTC 
GAGATCGGCG GGACGCCGCT GACGGTGAAA GTGGCGCACC TGCGGCTCTG CCACAGCCGT 
CGGTTCTACA TCCGGGCCTA TCCGCGCGAG ACCCAGGAGA TGGTGTTCGA CGCCCACACC 
CGGGCCTTTG CGCTGTTTGG CGGGGTCACG GCGCGCGGGA TCTACGACAA CATGAAGACC 
GCGGTGGACG CGGTGTTCGC CGGCAAGGCG CGGCGCTTCA ACCGGCGCTT CGAACAGATG 
TGCTCGCACT ATCTGATCGA GCCGGTGGCC TGCACGCCGG CTTCGGGCTG GGAGAAGGGT 
CAGGTCGAGA ACCAGGTGGG CTACGCCCGC GACAACATCT TCAAGCCGCG CCTGCGCTTC 
AGGACGCTGG AAGAGCTCAA CGGCTGGCTG GAGGCCGAGT GCGAGCGCCG GGCCCGGAGC 
GATCGGCATC CCGAGCAGCG CGATCGGACG GTCTGGGAGG TGTTTGAGGC CGAGAAGGCG 
TTCCTGGCGC CATTTGCTGG AACCTTCGAC GGCTTCCACC AGATCGAGGC CGTGGCCCAG 
GCCACCTGCC TGATCAGCTT CGACCGGAAC CGCTACTCGG TGGCGGCCAG GGCGGCGCGC 
CGGGCGGTGC AGATCCGGGC CTATGCCGAC AGGATCGTGG TGCTCTGCGA CGGCGAGCTG 
GTGGCCGAGC ACCCGCGCAG CTTCGGCCGC GACCGGACGA TCTACGATCC CTGGCACTAC 
CTGCCGGTCT TGGCGCGCAA GCCAGGCGCA CTGCGCAACG GCGCGCCGTT CCAGGACTGG 
TCGCTGCCGC CGGCCCTGAC CCGCCTGAGG AAGAAACTGG GCGCCGGCGA CGAGGCCGAC 
CGCCGCTTCG TGCGGGTGCT GGCCGCGGTG CTCGATGATG GCCTGGAGGC GGTCGACGAG 
GCGGTGCGCG AGGCCCTAGA CGCTGGCGTC TCCAGCGACG ATCTGATCCT CAACATCCTG 
GCCCGACGGC GTGAGCCGCC TAAACCTCCG GGGATCACAA CATCTGAGGC GTTGCAGCTG 
CGATATCCGC CGGTCGCCGA CTGCGCCCGT TATGACCGCC TAAGAGGCTC CCATGCAACG 
GCATGA

Protein sequence

METVAKIRRE HFGRGKGMKT IARELGLSRN TVRKVLRSGE TSFEYERTEQ PHPKLGAFIG 
RLEAMLETNA SGARKDRLTL TRIADLLGRE GYDGGYDAVR RYAGRWTAKR RGVSSPVEAF 
VPLSFAPGDA YQFDWSHDQV EIGGTPLTVK VAHLRLCHSR RFYIRAYPRE TQEMVFDAHT 
RAFALFGGVT ARGIYDNMKT AVDAVFAGKA RRFNRRFEQM CSHYLIEPVA CTPASGWEKG 
QVENQVGYAR DNIFKPRLRF RTLEELNGWL EAECERRARS DRHPEQRDRT VWEVFEAEKA 
FLAPFAGTFD GFHQIEAVAQ ATCLISFDRN RYSVAARAAR RAVQIRAYAD RIVVLCDGEL 
VAEHPRSFGR DRTIYDPWHY LPVLARKPGA LRNGAPFQDW SLPPALTRLR KKLGAGDEAD 
RRFVRVLAAV LDDGLEAVDE AVREALDAGV SSDDLILNIL ARRREPPKPP GITTSEALQL 
RYPPVADCAR YDRLRGSHAT A