Gene Caul_0477 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0477
Symbol
ID	5897932
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	517174
End bp	518421
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	65%
IMG OID	641560960
Product	HipA domain-containing protein
Protein accession	YP_001682109
Protein GI	167644446
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGACG TCGAGGTTCA TATCGACTTC GCGGCCGGCC CGCGCCGGGT CGGCACGCTT 
CATCGTCAGG CTCGGCGGGG CGGTGAAGCC GTCGTGTTTG AGTACCATCC CGACTGGTTG 
GCGGATGCGA CCCGCTTCTC CCTGGAGCCT GCCCTGACAT TGGGCCAAGG CGCCTTCGCG 
CCGGCGGCTG GCCTGACGAT GTTCGGCTCG ATCGGCGACT CCGCGCCCGA TACCTGGGGT 
CGGCGGCTGA TGCAACGAGC CGAGCGGCGT CAAGCCGAAC GCGACGGGCG CCCCGTGCGC 
GCGCTCTCCG ACGCCGACTA CCTGCTGGGC GTCGCCGATG TTTCCCGCCT TGGCGCATTG 
CGTTTCCGCC GGCCTGGCGA AGAGGCCTTC CAGGCGCCGA CCGAGGCGGG CGTGCCGGGG 
CTTGTCGAGC TAGGCCGGCT GATGGGCGTC ACCGAGCGCA TCTTGCGCGA TGAGGAAACG 
GACGAGGATC TGGCGATGAT CTTCGCGCCG GGTTCCTCTC TCGGCGGGGC TCGGCCGAAG 
GCGTCGGTGA TCGATCAGCA CGGTCGGTTG TCGATCGCCA AATTCCCGAA GGAGACCGAC 
GACTACAGTA TTGAGCTTTG GGAAGAGGTG GCGCTAAGGC TAGCCAAGCA GGCCGGCGTT 
CGTACCCCTG ATCATGAGCT GGTGGTGGTC GCCGGAAAGT CCGTTCTGCT GTCCCGGCGT 
TTCGACCGGC AAGGCGAGGC TCGCATCCCC TTCCTGTCGG CTCTGTCCAT GATGGGTCTG 
AAGGATGGCG AACGTGGAAG CTATCCCGAA CTCGTCGATG TCCTGACCCA GCATGGCGCC 
CAGACCAAGC AGGATGCGGC TGAACTCTAC CGCCGCATGG TCTTCAACGT CCTGATCTCC 
AACGTCGACG ACCACCTCCG CAACCACGGA TTCCTTTGGG CCGGCCAGGG GGGATGGGTG 
CTGTCTCCGG TCTATGATCT CAATCCGACC CCGACCGATA TCAGGCCGCG CATCCTCACC 
ACCAACATCG ATCTGGACGA AGGTACTTGC GACCTGGATC TGGTGCAGTC GGTCGCCGAA 
CTCTTTGGAT TGGGGTTAAA GCCGGCGCGC GAGATCATCG CTGAGGTCGG CCAAGCAACA 
GCCGCTTGGC GTGATGTCGC TGCGGCGGTC GGGGCGCGGC CAGCGGAAAT CCGGCGCATG 
GAGAGCGCGT TTGAGCATGT CGACTCACAG AAGGCGCGAG CCCTTTAG

Protein sequence

MADVEVHIDF AAGPRRVGTL HRQARRGGEA VVFEYHPDWL ADATRFSLEP ALTLGQGAFA 
PAAGLTMFGS IGDSAPDTWG RRLMQRAERR QAERDGRPVR ALSDADYLLG VADVSRLGAL 
RFRRPGEEAF QAPTEAGVPG LVELGRLMGV TERILRDEET DEDLAMIFAP GSSLGGARPK 
ASVIDQHGRL SIAKFPKETD DYSIELWEEV ALRLAKQAGV RTPDHELVVV AGKSVLLSRR 
FDRQGEARIP FLSALSMMGL KDGERGSYPE LVDVLTQHGA QTKQDAAELY RRMVFNVLIS 
NVDDHLRNHG FLWAGQGGWV LSPVYDLNPT PTDIRPRILT TNIDLDEGTC DLDLVQSVAE 
LFGLGLKPAR EIIAEVGQAT AAWRDVAAAV GARPAEIRRM ESAFEHVDSQ KARAL