Gene Caul_2701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2701
Symbol
ID	5902555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2934574
End bp	2936199
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	66%
IMG OID	641563193
Product	zinc finger SWIM domain-containing protein
Protein accession	YP_001684326
Protein GI	167646663
COG category	[S] Function unknown
COG ID	[COG4715] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.322732
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCGTA TCCACGAAAC CCTGTCGGAC AGGCGACTGG AGCGGGCCGC CGGGTCCGCC 
GCTTTCGCGC GCGGCGCGGC CTATCACGCG CAAGGTCGCG TGGATCTATT GTCGCTGGGC 
GACGATCAGG CCGTGGCTCG GGTGACGGGG TCGGAAATCT ATCGGGTGAG GCTACGTTGG 
CGTGGAGGCG TCGCGGAGGG CGCTTGCGAT TGTCCCGCCT TCGATTCCAC TGATTTCTGC 
AAGCATATGG TCGCCTTGGC GATCACAGCG CGAGAGCGGA CCGATGACGG GCCGGCGATC 
GACCGGCGCG TGCGTCTCGT CGAGCATCTG CGCCGTCAGG GACTGGAAGC GGCGGTGGCT 
CGCCTGGTGT CGCTGGCCGA GCAGCACCCG GAGGTCTGGT CCGAGATCGA GGCCGAAGCT 
CAGGACGCCG TCGAAGACGA CCAGACGCTC GTGCGCCGAT ACAGGGCGGA GATCGAATCC 
GCCTGCGATG TTCCAGGACC CATCGGCTAT TACAGTGTCG GGAGCTATGC CGAAGGCCTG 
TTCGCCTTGC TCGATCGCCT GGAGCGCCTG AACGCCGGCG GACGAGCGAC CGCCGTGTCC 
GCTCTGATGG TGCATTTCCT TGAAAACATG CAGGAGGTCT TCGAAGCCAT CGACGACTCC 
GAAGGCGAGG TGACCTCCGC CGTCCAGCGG GCCGTCGAGA TTCACCTGGC TGCTTGCCGG 
GAGACCAAGC CCGACCCGTT GGATCTGGCC GGATGGCTGT TCACTCAGGA GATGGACAGC 
GAGTGGCCCG CCTTCGAGGA CCTTCGCATC GACTATGCCG AGGTGTTGGG CGAGGCCGGA 
ATGGCTGAGT ATCGCCGACT GGCCGAGGCG GCCTGGGCGG CGGTCGCGAC CAAGGATCGA 
GCCGCGCAAT ATACCTTGCG GGCGATCCTC GACCACTTCG CCTGCCAAGA CGGCGACCTC 
GACGCGCGGA TCGCGCTGCG CGGCGCCGAC CTTTCCGGAC CTTACGCCTA TCTGGAGATC 
ATCCAGATCT GCATGGAGGC CGAGCGGCTG GACCTAGCCC TGAAATGGGC GCGGGAGGCG 
GTCTGGATTT TCGAGGACGC CCCCAATGCC CGGCTGGTGA GCCTGGCCGC CCAGCTCGAA 
GAAAAGGCGG GGCGAAGCGA CGAGGCCGTG TCCATGCTCT GGCGAACCTT CGAACGGTCG 
CCCGACCTCG CCCTGCTGGG CGACCTGAAA CGCCTTTCGC CGACAGATGT CATCGACAAG 
GCCGCCGAGA TCCTGGAGGC CAAGGGATAC TCGGCGATGT TGTTCGAACT GCAACTGGCG 
GAAGGCCGGC TGGACGCCGC CTGGAAGATC GCCGATGACC ACCCCATCGC CGACTGGCGC 
CTGAAGGCGC TCGCCGACGC CAGCCACCAA ACCCATCGCC TGAAGGCCCA GGCCGCCTAT 
GAGCGCCTGG CTGAGTCCAG CGTGCGTCTG GCCAATGTCG GCGCCTACGA TACGGCGATC 
AAACTCATTC GCCTTCGGGG GCAGGTCTGT GATGATCCCG CTTCACAGGC GGCCTACATC 
GCCGACCTCG CCACGCGTCA CAAGGCCAAG CGCACCTTCA TCCAGCGCCT GGAAGGTCTT 
CGCTGA

Protein sequence

MSRIHETLSD RRLERAAGSA AFARGAAYHA QGRVDLLSLG DDQAVARVTG SEIYRVRLRW 
RGGVAEGACD CPAFDSTDFC KHMVALAITA RERTDDGPAI DRRVRLVEHL RRQGLEAAVA 
RLVSLAEQHP EVWSEIEAEA QDAVEDDQTL VRRYRAEIES ACDVPGPIGY YSVGSYAEGL 
FALLDRLERL NAGGRATAVS ALMVHFLENM QEVFEAIDDS EGEVTSAVQR AVEIHLAACR 
ETKPDPLDLA GWLFTQEMDS EWPAFEDLRI DYAEVLGEAG MAEYRRLAEA AWAAVATKDR 
AAQYTLRAIL DHFACQDGDL DARIALRGAD LSGPYAYLEI IQICMEAERL DLALKWAREA 
VWIFEDAPNA RLVSLAAQLE EKAGRSDEAV SMLWRTFERS PDLALLGDLK RLSPTDVIDK 
AAEILEAKGY SAMLFELQLA EGRLDAAWKI ADDHPIADWR LKALADASHQ THRLKAQAAY 
ERLAESSVRL ANVGAYDTAI KLIRLRGQVC DDPASQAAYI ADLATRHKAK RTFIQRLEGL 
R