Gene Caul_2146 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2146
Symbol
ID	5899601
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2324853
End bp	2326232
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	72%
IMG OID	641562636
Product	hypothetical protein
Protein accession	YP_001683772
Protein GI	167646109
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.107944
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.048736
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGCGTA CGGGCTCGAA AAAGACGCTG ACGACGGCCA ACCTCGCCGC CCTGGGCGCC 
GAGCGCCTGG CCGATCTGTT GATCGACGTC GCCGAGGGCC ACGCCCAGAT CAAGCGCCGG 
CTGCGGCTGG AGCTGGCGGG CGAGGTGGGC GCCGCCGACC TGGCCGCCGA ACTGGCCAAG 
CGCATCGATT CCATCGCCGA CAGCCGGGCC CGCGTTCACT GGCGCAAGCA CAAGGAGTTC 
GTGCGCGAGC TCGACATGCA GCGGGCGTTG ATCGCGGGCC GGCTGACCGC CCTGGATCCG 
GCCCTGGCCT TGCCGATGAT GCTGCGGTTC CTCGACCTAG CCGAAGGGGT GTTCCACCGC 
ACGGCCGACG CCAAGGGCGA GGTCGACGCG GTGTTCGACG CCGCCGTCGA CGACGTGGCG 
GCAATCGCGC CCCTGGCCAT GCCCAATCCT CGTGACCTGG CCGATCAACT TCTGAACCTG 
CTGCTGACCG GCCGGGCGGG CCTGGGGCCG CGGGTGCTGA AGAACGCCCT GCCAGCCCTC 
GGCGCCGAGG CGGTGGCCCA ACTGCGGGCC AGGATCGAGA CGACCATGGC CTCGCAGAAG 
CGGGCCAGCG GCGCGCTGAA GGCCGCCGTC CAGGTATTGG CCGACGCCCA GGGCGACGTC 
GACGGCTATA TCGCCCAGTT CACCGACTCC CAGGCCGTCC TGCCGCCGAT CGGGGCGCAG 
ATCGCCCGGC GGCTGACGGC GGCGGGCCGT TTCGACGAGG CGGTGGCGGC GCTCGATCGC 
TCGACGCCGG GGTCCTTCGC TCAACTGGTC GGGACGGTTC TGGGCCGACC CACCCTTCCA 
GGGCCGGGCG CCCTGGACTG GGAGGACGCC TATATCGAGG TGCTGGAGGC GAGCGGGCGG 
TCGGGTCTCG CGCAGGAGAT GCGCTGGGCC AGCTTCGAAC GCGGCCTGTC GGTCGAGCGG 
CTGCGCGATC ACCTCAAGCG CCTGGCCGAT TTCGACGACG TCGAGGCCGA GGATCGCGCC 
CTGGCCTATG CCGAGGATTT CCATGACCTG CACGCCGCCC TCGACTTCCT GATCCGCTGG 
CCCGCCTGGG ACCGCGCCGC CCGGCTGGTG TTGCGCCGGC ACGGCGACCT GGACGGCGAC 
CGCCCCGACC TGCTGGAGAC TGCCGCCCGG GCCATCGAGG GCCGCCATCC GCTGGCCGCC 
ACCCTGCTGC TGCGGGCGCT GATTCTCGAC ACCGTCCGCT ACGCCCGCAC GACGCGCTAC 
AAGGACGCCC AGCAGCAGTT GCTGGAGGCC GCTTCCCTGG CCCCGGCCAT CGCCGACTGG 
CAGGGCCACG AAGACGCAAA CGCCTTCGCG GCGAAGGTGG CGGGCTATCG GCGGTGGTGA

Protein sequence

MKRTGSKKTL TTANLAALGA ERLADLLIDV AEGHAQIKRR LRLELAGEVG AADLAAELAK 
RIDSIADSRA RVHWRKHKEF VRELDMQRAL IAGRLTALDP ALALPMMLRF LDLAEGVFHR 
TADAKGEVDA VFDAAVDDVA AIAPLAMPNP RDLADQLLNL LLTGRAGLGP RVLKNALPAL 
GAEAVAQLRA RIETTMASQK RASGALKAAV QVLADAQGDV DGYIAQFTDS QAVLPPIGAQ 
IARRLTAAGR FDEAVAALDR STPGSFAQLV GTVLGRPTLP GPGALDWEDA YIEVLEASGR 
SGLAQEMRWA SFERGLSVER LRDHLKRLAD FDDVEAEDRA LAYAEDFHDL HAALDFLIRW 
PAWDRAARLV LRRHGDLDGD RPDLLETAAR AIEGRHPLAA TLLLRALILD TVRYARTTRY 
KDAQQQLLEA ASLAPAIADW QGHEDANAFA AKVAGYRRW