Gene Caul_3808 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3808
Symbol
ID	5901270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	4130621
End bp	4132705
Gene Length	2085 bp
Protein Length	694 aa
Translation table	11
GC content	65%
IMG OID	641564330
Product	nuclease
Protein accession	YP_001685432
Protein GI	167647769
COG category
COG ID
TIGRFAM ID	[TIGR00180] ParB-like partition proteins

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.310263
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACCG CTGTAATCGA AACGACCGCC CCGATTTCCA ACGTTCCCGC CGCCGTCAAC 
GGCGCGGAAG TTCTCATCCC TCTCAACAAG CTCAAGAAGT CCCACCGGAA CGCCCGGAAG 
ACGCCGCATA GCGAGGCGTC TATCGAGGCC AAGGCGGCGA GCATCCACGC CAAGGGCATC 
CTGCAAAATC TGGTGGTGGA GCCGGAGTTT GACGCCGAGG GCGCGGAAAC CGGCTTCTAC 
CTTGTCACTA TCGGCGAAGG CCGGAGGCTG GCGCAGTTGC TGCGCGCCAA GCGCAAGCAG 
ATCAAGAAGA CCGAGCCGAT CCGCTGCGTC ATCGACACGC AGAACGATCC AGCCGAGATC 
AGCTTGGACG AGAACGTCAC CCGCGAAGAC CTTCACCCCG CCGACCAGTT CGAGCGCTTC 
CGCGAGCTTG CGGAAAACAA GGGATGGGGA GCCGAGGAAA TCGCCGCCCG GTTTGGCGTC 
ACCCCGCATG TGGTGCGCCA GCGGCTGCGC TTGGGCGCGG TCAGTCCGAA GCTGATGCAA 
GTCTATCGCG ATGAAGGGCT GACGCTGGAC CAGTTGATGG CCTTCGCCAT CGTGGAGGAC 
CATGCGCGGC AGGAGCAGGT TTACGAGAAC CTCTCCTATA ATCGCGATCC GTCGATCATC 
CGCCGTGACC TCACCCGCTC GCACATCGCG GCAGCGGACC GGCGCGCGAT CTTCGTCGGG 
CCGGAAGCGT ATACCGAGGC GGGCGGCGTC ATCCTGCGCG ATCTGTTCAC CGAGGATCGC 
GGCGGCTTCT TTGAGGATGT CGTGCTGCTG GACCGGCTTG TCAGCGACAA GCTGGAAAGC 
ATCGCCGTCG AGGTTCAGGT GGAGGGCTGG AAATGGGCGA GCGCACACAT CGACTATCCC 
CACGCCCACG GCCTGCGCCG CAACTACCCG CAACCGGTGG CGCTGTCGGC GGAAGACGAG 
GCGGCGCGCG AAGCCGCGCA GGCGGAATAT GACGCGCTGA CCGAGCAGTG GGATAGCGCC 
GACAACCTTC TTCATGAGGT GGACGAGCGT TTCGGGGAGC TAGAAGCCGA GATCGAACGC 
ATCGATGCCC TGCGTCATGC CTACGATGCC GACGACATCG CGCGTGGCGG CGTGATCGTG 
GTGCTTTCCC ATGACGGGAC GGCGCGGATC GAGCGCGGCT TCATCCGGGC CGAGGACGAG 
AAGCCTGAAC CGGAGGTGGA GGCACAAGCC AATACGGGAG GCGAAGACTA TACCGTCACC 
GAAGACGGCG AGATCATCGA GGGTGGCGAC GAGGACCGGG TTTCGGCCTT GGAGACGGAA 
GAAGAAGACG CCGACGATGG CAAGCCGCTG TCGGACCTTC TCGTCCGCGA CCTGACCGCG 
CATCGCACCC TTGGCCTGCG TCTTGCCCTT GGCGAGCAGC CGGACATGGC GTTGATCGCC 
GTCACCCACG CCCTCGCGGC GCAGACCTTC TATCGCGGCG TGGAAGCCCA TTGCCTCGAT 
ATCCGGCCGA GCAGCGCGCA TTTGGGCGGG CATGCGGACG GCATCGAGGA CACGGCGGCG 
GCGAAGCTGC TGGCGGATCG TCATGACGGA TGGGCGGGAG ACATGCCGCG CGACGTGGCG 
GACCTGTGGG ACTTCGTCGC CGGTCTGGAC CATGCGAGCG TCATGGCGCT GTTCGCGCAT 
TGCGCCTCGC TGACGGTCAA CGCCGTGAAG CAGCCTTGGG AGCGCAAGGC CCGCGCCCAT 
GAAGCCGCCG ACAAGCTGGC GACGGCGGTC TCCCTCGACA TGACCGCTCA CTGGACGTCC 
ACGGTGCGGA CCTATCTCGG TCGCGTCACC AAGGCGCATA ATCTCGCCGC CGTGCGGGAG 
GCCGTTAGCG ACGAGGCGGC GGAACGCCTG TCGGGCTTGA AGAAGCAGCC TATGGCGGAA 
GCCGCCGAAC AGCTTCTCGC CGGGACCGGC TGGCTTCCGA CCTTGATGCG GACGGCGGAA 
CCCGCGTGGC CCGCAATCGA GCAGCCCGAC GTGCAGGAGG TGGTTGAAAC GGAGCATGCC 
GCGAGCGCGG ATGATGGTGA AAGCTACGCC ATCGCCGCCG AGTGA

Protein sequence

MTTAVIETTA PISNVPAAVN GAEVLIPLNK LKKSHRNARK TPHSEASIEA KAASIHAKGI 
LQNLVVEPEF DAEGAETGFY LVTIGEGRRL AQLLRAKRKQ IKKTEPIRCV IDTQNDPAEI 
SLDENVTRED LHPADQFERF RELAENKGWG AEEIAARFGV TPHVVRQRLR LGAVSPKLMQ 
VYRDEGLTLD QLMAFAIVED HARQEQVYEN LSYNRDPSII RRDLTRSHIA AADRRAIFVG 
PEAYTEAGGV ILRDLFTEDR GGFFEDVVLL DRLVSDKLES IAVEVQVEGW KWASAHIDYP 
HAHGLRRNYP QPVALSAEDE AAREAAQAEY DALTEQWDSA DNLLHEVDER FGELEAEIER 
IDALRHAYDA DDIARGGVIV VLSHDGTARI ERGFIRAEDE KPEPEVEAQA NTGGEDYTVT 
EDGEIIEGGD EDRVSALETE EEDADDGKPL SDLLVRDLTA HRTLGLRLAL GEQPDMALIA 
VTHALAAQTF YRGVEAHCLD IRPSSAHLGG HADGIEDTAA AKLLADRHDG WAGDMPRDVA 
DLWDFVAGLD HASVMALFAH CASLTVNAVK QPWERKARAH EAADKLATAV SLDMTAHWTS 
TVRTYLGRVT KAHNLAAVRE AVSDEAAERL SGLKKQPMAE AAEQLLAGTG WLPTLMRTAE 
PAWPAIEQPD VQEVVETEHA ASADDGESYA IAAE