Gene Caul_0403 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0403
Symbol
ID	5897677
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	442839
End bp	444131
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	68%
IMG OID	641560889
Product	HipA domain-containing protein
Protein accession	YP_001682038
Protein GI	167644375
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID	[TIGR03071] HipA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.173425
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTAAGC AGGCCGCGGT CCTGGGCGTC TACCTGCTCG ATCGGCAAGG CGCCCCCCTG 
CGCGTGGGGG CCCTAACCCG TGACGGGGTC GGGGCGACGG CCTTCCTCCC CGACGAGGTC 
TGGCTACGCG ATGAGGCGCG CCCGATCCTC AGCCTAACCT GGCTCACGCC AGGCGATCCT 
GTGGAGACGC GCCGGCGGCT GAACTATCGT GGCGACAAGA TTGGCCTCTA CGGCGGCTTG 
CCGCCCTGGT TCGCTGGCCT GCTGCCGGAG GGCGCGCTGC GCGATCTGGT CATCAACGAA 
ATGGGGCCCG GCGACCACGA TCCGTTCGAC CTGATCACGC GTCTGGGCGC CGATCTGCCG 
GGCGCGATCC TCGTGACGCC GGATAACGCG GAGGCGCCGG CCTCGGCTGG CCCCCTACGC 
TGGGATCAGA TCGCGGGCTT TCGTACGCCC GTGCCCGACG GTCAGGTGAA GTTTTCCCTG 
GCCGGCGTCC AACTGAAGTT CATCGCCGCC GATACTGGCC AGCGCTTCAC CGCGCCGGCC 
CGCGCCGGCG AGGGCCGCTA TATCCTGAAG CTGGCGTCCG CCGCCCATCC AGGTCTGCCC 
GAAGCCGAGT TCACAGCCAT GAGCCTGGCC AGAAGCCTGG GCGTGCGCAC GGCCAACTGC 
CGCCTCGTTG CAAACGCGTC CATTTCCGCG GTCCCGGCCG CGATGCTGGT GGGCGAGCAC 
GCCCTGGCCG TCGAGCGCTT CGACCGAACG ACCGGGGAGG GCCGTATCCA CATTGAGGAC 
GCCGGCCAGA TTCTTGGCGC GGTGGGCGAA CGCAAGTACA CGGCCAACAG CGAAACCGTG 
CTCAACATGA TCGCCCGTTT CAGCACGGAC TGGCGCGATG ACGTGCTCGA GGGTTTCCGC 
CGCCTCGTGG CCGACATCCT GCTGGGCAAC GGCGACAACC ACCTCAAGAA CTGGTCGTTC 
ATATTCCCGG CGCCCGGCGA GGTCCGGCTC TCGCCCGCCT ACGACATCGT CCCGACGGTC 
TTGTTCTCGC CGCTCGATGA CACCTTGGGC TTGCCGTTCG CCAAAATCCG CCGGTTCGGC 
TCGGTGCGCC TGCATCACTT CCGCCGCGTC GCCGAGCATC TGGGGCTTGA GCCGGATTGG 
ATCGCCCGGG AGGTTCGTGA CCTCGTCGTC CGCGCGCTCG ATACTTGGCC GCAGGCCATG 
GCCGACCTGC CCATATCCCG CGAGCGCGCC CAGGTCCTGC AAGCCCGCTG GCCCGACCTG 
ACGCTCGTCA ACGAAAGCCG CCTATCCCGG TGA

Protein sequence

MAKQAAVLGV YLLDRQGAPL RVGALTRDGV GATAFLPDEV WLRDEARPIL SLTWLTPGDP 
VETRRRLNYR GDKIGLYGGL PPWFAGLLPE GALRDLVINE MGPGDHDPFD LITRLGADLP 
GAILVTPDNA EAPASAGPLR WDQIAGFRTP VPDGQVKFSL AGVQLKFIAA DTGQRFTAPA 
RAGEGRYILK LASAAHPGLP EAEFTAMSLA RSLGVRTANC RLVANASISA VPAAMLVGEH 
ALAVERFDRT TGEGRIHIED AGQILGAVGE RKYTANSETV LNMIARFSTD WRDDVLEGFR 
RLVADILLGN GDNHLKNWSF IFPAPGEVRL SPAYDIVPTV LFSPLDDTLG LPFAKIRRFG 
SVRLHHFRRV AEHLGLEPDW IAREVRDLVV RALDTWPQAM ADLPISRERA QVLQARWPDL 
TLVNESRLSR