Gene Caul_1820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1820
Symbol
ID	5899275
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1928961
End bp	1930190
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	73%
IMG OID	641562310
Product	hypothetical protein
Protein accession	YP_001683447
Protein GI	167645784
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.448323
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.25103
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAACA GCCTGGCCGT GGCCACCGTG ACGGCCGCCC TGGCCAACCA CCTCGCGCGC 
GTTGTCAGCG AAGGCCCCTC CGGCGGCGTG CCTGGGACCC GGATCACCAC GCTCAATCCC 
GGCAGCGCCG CGCTCCGCGA CGGCGATCCG TTGGTCAATC TCTACCTGTT CCGCGTGTCC 
CGGAACGGCT TCGTGTCCAA CCGCGACCTG CCCAATCGCG CCGCCGACGG ACGCGGGCTG 
AAGGCGCCGA CCATCGCCCT GGACCTGGAC TACATGATCA CCGTGTTCGG CGACGACGCC 
CGGCTGGAGC CCCAGCTGTT GCTCGGCGCC GTGGTCGCCT GGCTGAACGC CGAGCCGATC 
CTGGACCGGA CCCTGGTCCA GACGACGATC GCCCACACGC CCTGGCTGGC CGGGTCGAAC 
CTGGGCGAGA CCACCGAGCC CGTCCGCATC GCCCCGATGA GTATGGCGCC GGACGTTATG 
GCCCGGCTGT GGTCCGAGTT CGTCAACGTC CCCTACCAGC TGACCGTGCT CTACACCCTG 
TCGGTGGTCG AGCTGGACGT ACCGCTGGCC ACCCAGCCCG CCCTGCCGGT GCGACGCATC 
GGCCTCGACG TCCAGCCGTC CGGGCCGATC CCGGTGCGCG GCCTGGTCAA CGCCGAGCAT 
CCCGACCTGC CGCTGGTGGC CGGCGGCGTG CTGGCCGTGC GCCTGGCCAA TCCGGGCCAG 
TTGGGTCTGG ACGTCCGCCT GAACGGCGCC GTGGCGACCG GCGTGACGAC CGGTCGCGAC 
GCCCTCGGCC ACGCCGCCCT GCTGGTCCCG CTGACCGCCG CCCAAGCCGG GCTGAGCGCT 
GGTCCGCTGA GCGTCCAGGT TCGGCGGACC GCGCCAGACG GCAAGACGCT GGCCCTGTCG 
CCGCCGTTGA GCGCGCCCCT GCACCCGACG ATCGTCCGGC TGGACCACGA CGCCAAGGCC 
GCCACGGTGA CCGCCCGCCT AGTCCTGCCG ATCCCCGCCG GCCAGGCCGC GGCGCTGCTG 
CTGTTCCCCG TCGCCGGCCG GGGCGCCCCT TCCCGGCGCA TCGCCCTGCC CGCGTCCGAG 
ACCGCCACCG ACAGTCCCGT GTTTCCCGCG CCCGACCAGC CGCCCGGCCG CTACCTGGCG 
ATGATCGAGA CCGCCGGCCT GCAGAGCCTG CTCGACTATC AGGGCGGGAC CTATGTCGGG 
CCGGTGGTCG AGATCGAGGC CGCGTCATGA

Protein sequence

MSNSLAVATV TAALANHLAR VVSEGPSGGV PGTRITTLNP GSAALRDGDP LVNLYLFRVS 
RNGFVSNRDL PNRAADGRGL KAPTIALDLD YMITVFGDDA RLEPQLLLGA VVAWLNAEPI 
LDRTLVQTTI AHTPWLAGSN LGETTEPVRI APMSMAPDVM ARLWSEFVNV PYQLTVLYTL 
SVVELDVPLA TQPALPVRRI GLDVQPSGPI PVRGLVNAEH PDLPLVAGGV LAVRLANPGQ 
LGLDVRLNGA VATGVTTGRD ALGHAALLVP LTAAQAGLSA GPLSVQVRRT APDGKTLALS 
PPLSAPLHPT IVRLDHDAKA ATVTARLVLP IPAGQAAALL LFPVAGRGAP SRRIALPASE 
TATDSPVFPA PDQPPGRYLA MIETAGLQSL LDYQGGTYVG PVVEIEAAS