Gene Caul_0465 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0465
Symbol
ID	5897920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	506383
End bp	507642
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	70%
IMG OID	641560948
Product	HipA domain-containing protein
Protein accession	YP_001682097
Protein GI	167644434
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTGG CGCCGGGCGA GCCTCTCGCC ATCAACCTCA TCTTTGACGA AAGCCAACCG 
CCCATGCCAA CGGCGCGCCT AGCCATGGCC AAGGGGTTGG CCCAGTTGGA ATGGTCGCCC 
CAGATCCTGA CCAGCAAGCT GCCGGTCTCG GGCTTGAACT ATCCGCCGGA GCCGGGCCTC 
CATGCCGCCC GTCGCCGCGA CTTCGAGGGC TTGCACGGCT TCGTCGCCGA CAGCCTGCCC 
GACGCCTGGG GAAGCCTTGT CGCCCGGCGG CGGCTGGCCA AGCTGGGCGT GCGCATCGAG 
GATCTCGGCC CCCTTGACCG GCTGGCCCTG GTCGGACGGC ACGGCCGTGG CGCCATGGCC 
TTTCTTCCCG ACACGGCGCC GCCGCCCGAG GTCGAGACCC TGGACCTGGA CGCCCTGGCC 
GCCGAGGCCT TGGCCGTCCT GGCCGGCGAC GAGAGCGCGC TGGCGGCCAC CCTGGCCACC 
TTGGCCAACG GATCGGGCGG GGCGCGCCCG AAGATCCACG TGGGCTTTGA CCCAAACGGC 
GCGATCTCCG TGGCCGAGGG CGAGGCCGCG CCAGGCCATA CCGCCTGGAT CGTCAAGTTC 
GCCGCCCCCA ACGATCAGCC GGATATCGGG CCTATCGAGG CGGCCTATGC CGCGATGGCC 
AAGGCGGCGG GCCTGGATGT ATCCGAGCAC CGGCTGATTC CCGCCAAGTC CGGTCCAGGA 
TACTTCGCCA CCCGGCGGTT CGACCGGCCC CAGCCGGGAC GCAGGCTTCA CATGCTTTCC 
TTGGGGGGCG CGATCGAGGC GCCGTGGATG CAGCCCTCCT CCTATGACCT CTTCCTGCGG 
GCCACCCTGG CCATCACGCG GCATGCCGGC GACCTGGCCG CGGCTTTCCG GCGCATGGTC 
TTCAACATCC TGGCGAGCAA TCGCGACGAT CATGTCCGCC AGCACAGCTA CCTGATGGAC 
CCGACAGGGG GGTGGCGCCT GGCGCCGGCC TACGATCTGA CCTACTCGGC CGGTCCCGGC 
GGTGAACATT ATCTCGACGT CGAGGGCGAG GGGCGCCGCC CGACCCGGGC TCACGTCAGG 
GCGCTTGGCA AGCGCCACGG CTACGACAAG GCGACTGTGG ATCGGGTCAT CGAGGAGGTC 
GCCGCCGCTC TGGCGGGGTG GCCGGGCTTC GCCGACGAGG CGGGCGTCAC CAGGCTTTCC 
AAGACCGACA TCGCCGCGGC CCACGCCGAC GTCGCCGGAT CCTTCTTCGC CGTGCCCTGA

Protein sequence

MKLAPGEPLA INLIFDESQP PMPTARLAMA KGLAQLEWSP QILTSKLPVS GLNYPPEPGL 
HAARRRDFEG LHGFVADSLP DAWGSLVARR RLAKLGVRIE DLGPLDRLAL VGRHGRGAMA 
FLPDTAPPPE VETLDLDALA AEALAVLAGD ESALAATLAT LANGSGGARP KIHVGFDPNG 
AISVAEGEAA PGHTAWIVKF AAPNDQPDIG PIEAAYAAMA KAAGLDVSEH RLIPAKSGPG 
YFATRRFDRP QPGRRLHMLS LGGAIEAPWM QPSSYDLFLR ATLAITRHAG DLAAAFRRMV 
FNILASNRDD HVRQHSYLMD PTGGWRLAPA YDLTYSAGPG GEHYLDVEGE GRRPTRAHVR 
ALGKRHGYDK ATVDRVIEEV AAALAGWPGF ADEAGVTRLS KTDIAAAHAD VAGSFFAVP