Gene Caul_3398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3398
Symbol
ID	5900853
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3669512
End bp	3671344
Gene Length	1833 bp
Protein Length	610 aa
Translation table	11
GC content	70%
IMG OID	641563904
Product	hypothetical protein
Protein accession	YP_001685023
Protein GI	167647360
COG category	[S] Function unknown
COG ID	[COG4805] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.15376
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCAGC TCAATCGACG TGACGTTCTG GCGCTCGGCG CCGCGACCCT GGCCCTGGGA 
TCGGCGAGCG CGAGCCGGGC CGCCGCGCCG GGCGACACCG CCGCCGAGGC GCAGCTGTCG 
GGCGTCGCCG AGGACCTGAT GCGGGAATAT CCCGAGAACG CCTCGGCCCT GGGCCTGGAC 
AAGGGCGCGC GGGCGGCCCT GAAGTCCACC CTGACCGATC GATCGCTCGA AGGTCGCGCC 
AAGCTGGCCG CCGCCGCCAA GGCGCGGGTC GCCAGGATGA AGGCCGTGGA CCGCAAGGGC 
CTGAGCCCGG CGACCGCGCA GGACCTCGGC GTCGTCCAGA CCGCCCACGA GCTGACCGTC 
GAGGGCTTCG ACTTCGCCTA TGGCGACGCC ATCGGCCTGA GCGCGCAGTG GTCCTATCGC 
AACGCGCCCT ATGTCGTGGC CCAGAACACC GGGGCCTTCG TCGAGATCCC CGACTTCCTC 
GACAGCCAGC ACGGGGTCGC CTCGGCGGCC GACGCCGAGG CCTATCTGAC CCGGCTGGAG 
CTTTACGCCG CCCAACTGGA CGGCGAGACG GCGCGGCTGA AGCATGACGG CGCGCTGGGC 
GTGGTCGCGC CCGACTTCTT GCTCGACAAG ACCCTGAAAC AGCAGAAAGG CGCCCGCGCC 
CAGCCGATCG CCGACTGGGG CCTGATCACC GCCCTGGCCA GGAAGGCCAA GGACATCCCC 
GGCGACCACG TCCGCCGGGC CACGGCCATC GTCGAGGGCA AAGTCGCCCC GGCCATGGAT 
CGCCAGATCG CCGAACTGGC CGCCCACCGC GCCAGGGCCA CGTCCGACGC CGGGGCCTGG 
AAGCTGCCCG ACGGCGAGGC CTATTACGCC TGGGCGTTGC GGGCCGGCAC GACCAGCCGA 
ATGACGCCGG ACGAGGTCCA CCGGATGGGC CAGGAGCAGC TGAAGGCGCT GTTCGCGCGA 
ATGGACACCC TGCTGAAGGC CCAGGGCCTG ACCCAGGGCA GCGTCGGCGC CCGGATGAAG 
GCGCTGGGCG AGGATCCCAG GAACCTGTTC CCCAACACCG ACGAAGGCCG AGCCCAGATC 
CTGGCCTATC TGAACGGCCG GGTGGCCGAC ATCCGCACTC GCCTGCCACG GGCCTTCGCC 
ACGTTGGCGC CGGGCAATCT GCTGATCAAG CGGGTGCCGA TCGAGATCCA GGACGGCGCG 
CCGGGCGGCT ATGCGGCGGC GGGCTCGATC GACGGCACGG TACCCGGCAA CTACTACATC 
AACCTGCGCG ACACGAGCAT CTGGCCGCGC TACGGCCTGC CGACTCTGAC CTATCATGAG 
GGCATACCGG GCCACGTCTG GCAGGGCGAA TACACCTACA AGCTGCCGCT GGTCCGGTCG 
CTGCTGGCCT TCAACGCCTA TAGCGAGGGC TGGGCGCTGT ACGCGGAGCA ACTGGCCGAC 
GAGCTGGGGG CCTATGACGG CGATCCGCTG GGCCAGCTGG GCTATCTGCA GTCGATCGCC 
TTCCGCGCCT GTCGCCTGGT GGTCGACACC GGCATCCACG CCAAGCGCTG GACCCGGGAG 
CAGGCGGTCG ACTGGTTGGT GACCACAAAT GGCTCGACCC GCGAGGAGGT GCAAGGCGAG 
GTCGACCGCT ACTGCGCCTG GCCCGGCCAG GCCTGCGGCT ACAAGGTGGG CCACAGCGAG 
ATCATCCGTC TGCGAACCAA GGCCCAGGCC GCGCTCGGCC GCCGCTTCGA CCTGCGCGCC 
TTCGACGACG CGGTGGTGAT GGGCGGCAAT GTCCCGCTAA CCCAGCTGGA GGGCGTGATC 
GGCGCCTATG TGGCGAGGCG GCGGGCTGCT TAG

Protein sequence

MSQLNRRDVL ALGAATLALG SASASRAAAP GDTAAEAQLS GVAEDLMREY PENASALGLD 
KGARAALKST LTDRSLEGRA KLAAAAKARV ARMKAVDRKG LSPATAQDLG VVQTAHELTV 
EGFDFAYGDA IGLSAQWSYR NAPYVVAQNT GAFVEIPDFL DSQHGVASAA DAEAYLTRLE 
LYAAQLDGET ARLKHDGALG VVAPDFLLDK TLKQQKGARA QPIADWGLIT ALARKAKDIP 
GDHVRRATAI VEGKVAPAMD RQIAELAAHR ARATSDAGAW KLPDGEAYYA WALRAGTTSR 
MTPDEVHRMG QEQLKALFAR MDTLLKAQGL TQGSVGARMK ALGEDPRNLF PNTDEGRAQI 
LAYLNGRVAD IRTRLPRAFA TLAPGNLLIK RVPIEIQDGA PGGYAAAGSI DGTVPGNYYI 
NLRDTSIWPR YGLPTLTYHE GIPGHVWQGE YTYKLPLVRS LLAFNAYSEG WALYAEQLAD 
ELGAYDGDPL GQLGYLQSIA FRACRLVVDT GIHAKRWTRE QAVDWLVTTN GSTREEVQGE 
VDRYCAWPGQ ACGYKVGHSE IIRLRTKAQA ALGRRFDLRA FDDAVVMGGN VPLTQLEGVI 
GAYVARRRAA