Gene Caul_5202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5202
Symbol
ID	5897254
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010335
Strand	-
Start bp	121074
End bp	122498
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	70%
IMG OID	641555305
Product	hypothetical protein
Protein accession	YP_001676636
Protein GI	167621851
COG category	[L] Replication, recombination and repair
COG ID	[COG0389] Nucleotidyltransferase/DNA polymerase involved in DNA repair
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.45217
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGGCC GCATCGGGCG CCGTCGCGCC ATCGCGCACA TGAACCTGGC CGCCGCCCAG 
GCGGGCCTGC GGGTCGGCCA GGCCGTCGCT CACGCCACGG CCCTGATCCC GGGCCTGTTG 
CTGCACGACC TCGACGCGAC CGGCGATCAA GCCGGCTTGC ATCGCCTGGC GCTGTGGGCC 
CAGAAACTCT ATTCGCCCAT CGTCGCCCCC GACGGCGCCG ATGGTCTGGT GATCGACGCC 
AGCGGCTGCG CCCATCTCTT CGGCGGCGAG GAGAAGATGG CCATCGCCAT CCGCGAGCGA 
CTGACCAAGG CCGGGTTCAG CGCCACCCTC GCCATCGCCG ACAGCTGGGG CGGCGCCCAT 
GCCTTGGCCA GGTTCAGCGG CCGAGCGATC TTCGTGGTCG ATCCCGGCGC TACCGGCCGC 
GAACTTCGCA GCCTGCCCGT CGCGGCCTTG CGCCTGGGTT CCGACCTCGT CGAAGGACTG 
GGGCGCCTGG GGTTCGATAC GATCGGCGAG CTGGAGGCCA CGCCCAAAGG GCCGTTGGCG 
CACCGCTTGG GCCTGGAGCC CGTGCGACGC CTCGACCAGG CGCTGGCGCG TCAGGCCGAG 
CCCATCGAGC CGGTGATGGC CGCCCAGACC CTGTCGGTGC GCCGCGCCTT CGCCGAGCCG 
ATCGGGGCGC CCGAGACGAT GGCTCGCTAT GTCACCCAAC TCACCCACGA ACTTTGCGCG 
GCTCTGGAGG CCGCCAGTCT GGGCGCCAAG CGTCTGGACG CCTGGTTCTT CCGCGTCGAC 
AACCGTATCG AGGCCGCCCG GATCGGCATG GCCGCTCCGA CACGTGACGG CGCGCGCCTG 
GCCAAACTCC TGTGTGAGAA GCTGGAAAGG GTCGATCCGG GATTTGGGGT CGAGAAGATC 
GTGCTGGCCG CGCCCGGCGC CGAGCCCCTG ACCTACAAGC AAGGCCAAGC GCTGGGCGAC 
GGCGGCGCGG GCGTGGACCT GTCGGGTCTG ATCGACACCC TGTCCAACCG GATCGGCGCC 
GAACACGTCT ACCGCCTGGC CTCCGCCCAG AGCGATTTGC CCGAACGCTC GGTCAAGCGC 
GTTCCGGCCT TGCAGGCGCC TGACGGCTTT TCCTGGCCGA TGGACTGGCC GCGGCCCGAC 
CGGTTTTTTG CCCGCCCCGA ATCCATCGAG ACCGTCGCCC TGCTTCCCGA CGCGCCGCCG 
GCGGCCTTCA CTTGGCGTGG CGCCCGCCAC CGGGTGCGCT GCGCCGACGG ACCCGAGCGG 
GTGTTTGGCG AATGGTGGAA GGCTGACGAG GAGTTGGCCC GCTCGCGCGA TTATTTCCAG 
GTCGAGGACG AGGCCGGCGA GCGGTTCTGG ATCTTCCGCG ACGGCGACGG CGAGGACGCC 
GAAACCGGCA CGCAGCGCTG GTACATGGTC GGGGTCTTCG GATGA

Protein sequence

MVGRIGRRRA IAHMNLAAAQ AGLRVGQAVA HATALIPGLL LHDLDATGDQ AGLHRLALWA 
QKLYSPIVAP DGADGLVIDA SGCAHLFGGE EKMAIAIRER LTKAGFSATL AIADSWGGAH 
ALARFSGRAI FVVDPGATGR ELRSLPVAAL RLGSDLVEGL GRLGFDTIGE LEATPKGPLA 
HRLGLEPVRR LDQALARQAE PIEPVMAAQT LSVRRAFAEP IGAPETMARY VTQLTHELCA 
ALEAASLGAK RLDAWFFRVD NRIEAARIGM AAPTRDGARL AKLLCEKLER VDPGFGVEKI 
VLAAPGAEPL TYKQGQALGD GGAGVDLSGL IDTLSNRIGA EHVYRLASAQ SDLPERSVKR 
VPALQAPDGF SWPMDWPRPD RFFARPESIE TVALLPDAPP AAFTWRGARH RVRCADGPER 
VFGEWWKADE ELARSRDYFQ VEDEAGERFW IFRDGDGEDA ETGTQRWYMV GVFG