Gene Caul_5446 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5446
Symbol
ID	5897118
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010333
Strand	-
Start bp	160651
End bp	161682
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	63%
IMG OID	641550733
Product	integrase catalytic region
Protein accession	YP_001672219
Protein GI	167621711
COG category	[L] Replication, recombination and repair
COG ID	[COG2826] Transposase and inactivated derivatives, IS30 family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGATCGC GCTACGATCA TATCACGCTT GAAGAACGCC ACCTGATCTG TCGTTGGCGT 
GACGCCAAGG TGCCTGTGCG GGTCATCTCC GAGCGCCTCG GCCGCCATCC ATCGACTGTC 
CATCGCGAGA TCCGACGCAA TTGGTTTGAC GATGGGCCCT GGCTGCGCGG CTACTTCGCC 
ATCGCCGCCG ACCAGCGCGC CTCGTCGCGA CGCAGGCGTG TTGGCAAGCT GCATCGCGAT 
CCTGAACTGG CCCACTTCGT CACACAGCGC TTGCGAGAGA CCTGGTCGCC AGAACAGATC 
GCCGGTCATC TCAAAGCGAC CCGGCAGCTC CAAGCCTATG CCTGCCACGA GACCATCTAC 
CGCTACGTTT ACGGCCCAGA TGGCCGGGCC GCGGAGCTCT ACAAGCTGCT CCCCAGGATG 
CGTCGGCGCC GGCGCGCGCG CTATGCTCGA AGGCCGCGCG GCGGCCTGCA TATTCCGCTA 
CAGAACACCA TTGCACAGCG CCCCGCCCAC ATCGGCGAAC GCCAGGGTTA CGGCCATTGG 
GAGTGCGATC TGATCGCTTT CCGGCAGGAA TACGGGCGTC ACAACATCAC GACGTTGGTC 
GAGCGTCGAA GCCGGTATCT GATCATGATC AAAAACCCGA GCCGCAGCTC GACGGGCATC 
ATGGCCGGCT TGGCCGAGCG TCTGGAGCCG CTTCCTCCGC CGATGCGGCA ATCCATTACC 
TTTGATCGCG GCACTGAGTT TGCTTTCTTT GCGACCTTGA AGCGCTCGCT GGAGATCGAG 
AGCTACTTCT GCAAGCCACA GGCGCCTTGG CAAAAGGGTA CTGTCGAGAA CACCAATGGC 
CGCCTGCGAC GCTTCCTACC CAGCGACACG GACATCGCGT TGATCCCGCC AGAGAAGCTG 
CTGGAGCTGA CCACGCGGCT CAATCGGATC CCGCGCAAGT GTCTTGGATA TCGCACGCCG 
GAGGATGTGC TGGGTGAGCA GATAGCGGCT ACGGCTGGGA CACGGGCGAC GAACGGGCTC 
TGCGCTACGT GA

Protein sequence

MGSRYDHITL EERHLICRWR DAKVPVRVIS ERLGRHPSTV HREIRRNWFD DGPWLRGYFA 
IAADQRASSR RRRVGKLHRD PELAHFVTQR LRETWSPEQI AGHLKATRQL QAYACHETIY 
RYVYGPDGRA AELYKLLPRM RRRRRARYAR RPRGGLHIPL QNTIAQRPAH IGERQGYGHW 
ECDLIAFRQE YGRHNITTLV ERRSRYLIMI KNPSRSSTGI MAGLAERLEP LPPPMRQSIT 
FDRGTEFAFF ATLKRSLEIE SYFCKPQAPW QKGTVENTNG RLRRFLPSDT DIALIPPEKL 
LELTTRLNRI PRKCLGYRTP EDVLGEQIAA TAGTRATNGL CAT