Gene Caul_5344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5344
Symbol
ID	5897098
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010333
Strand	+
Start bp	54501
End bp	55748
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	65%
IMG OID	641550636
Product	HipA domain-containing protein
Protein accession	YP_001672122
Protein GI	167621614
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.71584
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGACG TTGAGGTTCA CATCGACTTC TCTGCCGGCC TGCGCCGGGT CGGCACGCTC 
CACCGTCAGC CTCGGCGCGG CGGGGAAGCT GTGGTCTTCG AATATCATCC CGCCTGGTTG 
GCGGACGCGG CCCGCTTTTC ACTGGAGCCC GCATTGACCC TGGGCCAGGG CGCATTCGCG 
CCGGCCGCGG GCCTGTCGAT GTTCGGCTCG ATTGGCGATT CCGCGCCCGA TACCTGGGGC 
CGCCGGCTGA TGCAGCGCGC CGAACGCCGC CAGGCCGAGC GTGACGGCCG CCAGGTGCGC 
GCCCTTTCGG ACGCCGACTA TCTCCTGGGC GTGGCCGACG TATCCCGGCT AGGCGCGTTG 
CGCTTCCGCG AGCCCGGTGA AGCCGATTTT CGGGCTCCGA CCCAAACCGG TGTGCCTGGC 
CTCGTCGAGC TTGGTCGGTT GATGGGCGTC ACCGAGCGCA TTCTGCGCGA TGAAGAGACC 
GACGAAGATC TCGCGATGAT CTTCGCGCCC GGCTCCTCAC TGGGCGGCGC GCGCCCCAAA 
GCCTCGGTGA TCGACCAGCA TGGCAGCCTG TCGATCGCCA AGTTTCCCAA AGAGGCCGAC 
GACTATAGCA TCGAGCTTTG GGAGGAGGTG GCGCTTAGAT TGGCCAAGCG TGCCGGCATC 
CGCACCCCAC GTCATGAACT GGTGAAGATC GCGGACAAGT CCATTCTGCT GTCCCGACGC 
TTCGACCGAG ATGGCGAGAC GCGCATTCCC TTTTTGTCAG CCTTGTCGAT GCTGGGGCTG 
CGCGACGGCG AACGGGGCAG CTATCCCGAG CTGGTCGATG TGCTCACCCA ACATGGCGCC 
CAGGCCAAGC AGGACGCCGT CGAGCTCTAT CGGCGCATGG TGTTCAACGT CCTGATCTCC 
AACGTCGATG ACCATCTGCG AAACCACGGC TTCCTGTGGG CGGGACAAAG CGGCTGGACG 
CTTTCGCCCG CCTACGACCT CAACCCCACG CCGACCGACG TCCGGCCGCG CATTCTCACG 
ACCAACATCG ATCTGGATGA AGGCACCTGC GACCTGGGCC TAGTGGAATC GGTCGCTGAA 
CTCTTCGGCC TGGGTCCAAA GCCCGCACGC GAGATCATCG CGCAGGTTGG CCAAGCCACC 
AGGATCTGGC GCGATGTCGC CGTCGAGATC GGCGCGCGGC CAGCTGAGGT CCGCCGTATG 
CAAAGCGCCT TCGAACACAC CGATCTAGAG CGGGCATTGG CGATCTGA

Protein sequence

MADVEVHIDF SAGLRRVGTL HRQPRRGGEA VVFEYHPAWL ADAARFSLEP ALTLGQGAFA 
PAAGLSMFGS IGDSAPDTWG RRLMQRAERR QAERDGRQVR ALSDADYLLG VADVSRLGAL 
RFREPGEADF RAPTQTGVPG LVELGRLMGV TERILRDEET DEDLAMIFAP GSSLGGARPK 
ASVIDQHGSL SIAKFPKEAD DYSIELWEEV ALRLAKRAGI RTPRHELVKI ADKSILLSRR 
FDRDGETRIP FLSALSMLGL RDGERGSYPE LVDVLTQHGA QAKQDAVELY RRMVFNVLIS 
NVDDHLRNHG FLWAGQSGWT LSPAYDLNPT PTDVRPRILT TNIDLDEGTC DLGLVESVAE 
LFGLGPKPAR EIIAQVGQAT RIWRDVAVEI GARPAEVRRM QSAFEHTDLE RALAI