Gene Caul_2354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2354
Symbol
ID	5899809
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2552087
End bp	2553232
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	71%
IMG OID	641562845
Product	hypothetical protein
Protein accession	YP_001683979
Protein GI	167646316
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5653] Protein involved in cellulose biosynthesis (CelD)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGAGA CCCGATCCGT TCACCCGTGC GCGCTGGACA GCCAGGACGT CGAGACATGG 
CGCGCCATGG CCTCGGCGCA TCCCGAGTTC CGCAACCCTC TGCTCGGCCC GGATTTCGCC 
CAGGCGGTCG GCGCCCTTCG GCCCGATGCG CGCGTGGCGA TCTTTCGGCG CCACGGCCGC 
GTGCTGGGCT ACCTGCCCTA TCATCGCCGG GCCTGCGGCC AAGCCTGGCC GATCGGCGCG 
CCGTTGTCGG ACTATCACGC CCTGGTCGGC GTCGCCGACG CCGGGCTCGA CGGCCGTGAC 
GCCCTCGCCG CCGCCGGATT GTCGGCGTTC CGCTTCGGCG GCCTGGTCGA TCCGTTCGAG 
GTGTTCGGCC CAGGCGCCGA TCAGGTCGGC CATGTGATCG CGCCGGCCGA CGGCCCCGAG 
GCCTATCTGG AGCAGGTCCG GGCGGCCAAT CCCAAGAAGA TCAAGAACTA CCGCCGGCTG 
GGCGCCAAGC TGGAACGCGA GTGCGGCGCC GTGCGCCTAG TCGCCGACGA CCGGTCACGA 
CCGGCTTTCG ACCAGTTGAT CGCCTGGAAG CGCGAGCAGC TCATGCGCAC CGGAACCCAC 
GACTTCCTGG GCGCCGATTG GTCGCTCGAC CTAGTGACCC GGCTATTCGA AGGCCAGCAG 
GGCGAGCTTC GCGGCCTGAT GATCTGCCTC TATGCCGGCG ACACCCTGGT GGCAGGGCAT 
TTCGGCGTGC GGCAGGGCGA GGTCTTTCAC CCTTGGATCG CCTCCACCCA CCCAGACTAT 
GGGCCTTGGT CTCCCGGGCA TCAGCTCTTC CCGCGTGCGA TCGCGGCCAT GCCCGCCCTG 
GGCCTGACAA CCTACGACCT CGGCTGCGGT CACGATCACT ACAAGAGCGT CTACGCCTTG 
CGGACCCGCA TCGTGACCGC GGGCCTGGCG ACCGCCGGCA ACCTGGCCGG CGACATCGCC 
CGCTCCATCG ACGCCGCCTG GCTGCTGGCC GGCGCCGAAA GCCCCGGGCC GGTCGGCCGC 
CTGCGGCGAC GGATGGACGC CATCGCCAAG GTCGACCTGA CCCTGTCCGG CCGCCTGCGG 
GGCCTGGCCT TCGCCGTGGC CAGCCAGGAC CGTCGGCGCC GCGCCACCGA ACACGAGCAG 
CCTTGA

Protein sequence

MLETRSVHPC ALDSQDVETW RAMASAHPEF RNPLLGPDFA QAVGALRPDA RVAIFRRHGR 
VLGYLPYHRR ACGQAWPIGA PLSDYHALVG VADAGLDGRD ALAAAGLSAF RFGGLVDPFE 
VFGPGADQVG HVIAPADGPE AYLEQVRAAN PKKIKNYRRL GAKLERECGA VRLVADDRSR 
PAFDQLIAWK REQLMRTGTH DFLGADWSLD LVTRLFEGQQ GELRGLMICL YAGDTLVAGH 
FGVRQGEVFH PWIASTHPDY GPWSPGHQLF PRAIAAMPAL GLTTYDLGCG HDHYKSVYAL 
RTRIVTAGLA TAGNLAGDIA RSIDAAWLLA GAESPGPVGR LRRRMDAIAK VDLTLSGRLR 
GLAFAVASQD RRRRATEHEQ P