Gene Caul_4042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4042
Symbol
ID	5901504
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	4378039
End bp	4379298
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	68%
IMG OID	641564563
Product	diguanylate phosphodiesterase
Protein accession	YP_001685665
Protein GI	167648002
COG category	[T] Signal transduction mechanisms
COG ID	[COG2200] FOG: EAL domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.18678
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAAGGC TGATGCTGGC GCTGCTGACC GGCGCCTATC TCTGTCTGGC TCTTGTGACC 
TCCCTGGCCC TGTGGCGCAT GGGAGCGGCT CCGGCCGTCG GCCTGGCCGC CTTCATCGGC 
GCCATGGGCC TGTGCTTCGC CATCCACGGC GTGATCGCCG GCGTCCTGCA GGGCGCGACC 
CTGCGCGTCG ATATCGAGAC CATCCGCGAG GCCCACGGCA TCCTGCTGGA ACAGATCGAG 
AAGGTCGACG CCCGCATCAC CGGCCTGCTG GAGACCGTCG CCGACGACGC CCAGCGCCGC 
TCGGCCGAAC TGACCAGCGA GGTCCATCAG TTGGAAGACC TGGTCGTGCG CATGAGCGAC 
CGGCTGGAAA ACCAGCTGAC CCACCATGTC GCCGCCGCCC GCGACGAGCC GCGCGGCCGC 
TCGTCGCAGT CCAGCGCCTT GCTCGGCGTG GTGCAGGACG CCCTGGCCGA CAACCGGGTC 
GACCTCTATC TGCAGCCGGT CGTCAGCCTG CCCCAGCGCC GGACCGTCTT CTACGAGAGC 
TTCTCGCGCC TGCGCGACGA GACCGGCCGG GTGCTGATGC CCGCCGAATA CCTGGCCGTG 
GCCGAGCCCG AGGGCCTGAC CGCCGCGATC GACAACCTGC TGCTGTTCCG CTGCGTGCAG 
ATCGTCCGTC GCCTGGCCAA GCAGGACCGC AAGGTCGGGA TTTTCTGCAA CATCTCGCTG 
GCCAGCCTGG CCGACGAGGC GTTCTTCGCC CAGTTCCTCG AATTCCTGCA GGTCAACAAG 
GACCTGTCGG GCGCCCTGAT CTTCGAACTG GGCCAGGCCG CCTTCAACGA CCGAGGCCCG 
GTCGAGGCCC GTCACATGGC CCGCCTGGCC AGCCTGGGTT TCCGCTTCAG CCTTGACAAG 
GTCACCGACC TGGACCTGGA CTTCCAGGAC CTGGCCCGCG CCGACGTCAA GTTCCTGAAG 
ATTGGCGCCC AGCTTCTTCT GGACCAGTTG GAAGAGCAGG GCGGCAAGCT GGTCATCGCC 
TCGTTGCCCG ACCTCAATGC CGAGGACTTC GCCGGCCTGA CCCGTCGCTA CGGCATCGAG 
GTGATCGCCG AGAAGGTCGA GCACGAGCGC CAGGTGGTCG ACGTGCTGGA GCTCGACATC 
GGCTACGGCC AGGGCCACCT GTTCGGCGAG CCCCGCGCCA TCCGCGACTC GATCATCGCC 
GAAGCCGACC CGCCGCAGGA CTTCATGCGC GGCGCGATGC GGCGCGGGAT GGGGCGGTAG

Protein sequence

MRRLMLALLT GAYLCLALVT SLALWRMGAA PAVGLAAFIG AMGLCFAIHG VIAGVLQGAT 
LRVDIETIRE AHGILLEQIE KVDARITGLL ETVADDAQRR SAELTSEVHQ LEDLVVRMSD 
RLENQLTHHV AAARDEPRGR SSQSSALLGV VQDALADNRV DLYLQPVVSL PQRRTVFYES 
FSRLRDETGR VLMPAEYLAV AEPEGLTAAI DNLLLFRCVQ IVRRLAKQDR KVGIFCNISL 
ASLADEAFFA QFLEFLQVNK DLSGALIFEL GQAAFNDRGP VEARHMARLA SLGFRFSLDK 
VTDLDLDFQD LARADVKFLK IGAQLLLDQL EEQGGKLVIA SLPDLNAEDF AGLTRRYGIE 
VIAEKVEHER QVVDVLELDI GYGQGHLFGE PRAIRDSIIA EADPPQDFMR GAMRRGMGR