Gene Caul_2930 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2930
Symbol
ID	5900385
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3176569
End bp	3178125
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	70%
IMG OID	641563427
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_001684555
Protein GI	167646892
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.917064
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTTCA TCGACGCCCG AACCTTGCCT GACGCCAGCC GGATCGAGGC CGACCTGGTG 
ATCATTGGCG GCGGCCTGGC CGGCATCGCG CTCGCCAAGG AGCTGGCCGG CGGACCGCTG 
AAGGTCGCCG TCCTCGAGAG CGGCGGCCGC GAGATCGACA TGGAGATCCA GGGCCTCTAC 
GCCGGAACCG CCGTGGTCAA GGCGCCCGAC AATCCCGACA AGCCGTTCGA CGACTATCCG 
GTCCAGTCGC GGGTCCGGGT GCTGGGCGGC TCGGGCATGG TCTGGGGTGG CAAGTGCGCA 
CCGCTCGATC CCGCCGACTT CGCCGCCCGC GCCTGGGCGC CGCACAGCGG CTGGCCGGTC 
ACGCGAGTCC AGATGCAGCC GTTCTACGAC CGGGCCTGCG ACCTGCTGGA GATCCCCCGC 
TTCGACGCCG ACAACAAGGC GCTGAAGGAC CCGGCCCGCC CGCCGCTGGC GCTCGACCCG 
CGGGACGGCT TCTTCTCGGC CCCGCGCGTC TTCACCCGCT ATTCCGGCGG CGCGGACAAG 
GACGCCTTCG ACCGCTTCCG CACCGATTTC GCCGAAGCGC CCAACATCAC CGTCTATCTG 
CACGCCAATG TCACCCAGAT CCGCCTGAAC GCGGCGGGCG ACCAGGTCGA AGGCCTGGAC 
GTGGCCTGCC TGGACGGCAA GCGCCACACG GCGGTCGGCA AGACCCATGT GCTGGCGGTC 
GGCGGCATCG AGAACGTCCG CCTGCTGTTG GCCTCGAACA GCGTGCGGCC CGAGGGCGTT 
GGCAACCGCC ACGACCTGGT CGGCCGGTTC TTCCAGGGCC ACGTGACCTA CAGCTTGGAC 
GGCGACGCCG AGACCGAGGG CACGGCGGTC CACGTCTCGC GCGCCGAACC GATGAGCCTC 
TATTTCAACC CGGGCCGCAC CGCCGCCCAC TGCGTGCTGG CCAGCGGCCT TCCGGCCCAG 
GCGCGGATGA AGACCGGCAA CTTCACCGCC ACCCTCTACG CCGCCGAAGA GACCGGGGTC 
GCAACCCCGC CCGAGGCCGA GACCAAGGCC CTGCGCCGGG TCGCCACGCG GATCGACGGG 
ACGGGAAAGA CCGACGGCCA ACTTCTGGGC TTCTTCGCGA TGTCCGAGCA CTTCCCCAAT 
CCCGACAGCC GCGTGGCCCT GGATCCCTCG GCCAAGGACG CGCTGGGCAT GCCGCGCGTT 
CATCTGGAGT GGCGCTATTC AAAGGCCGAC TGGGACAGCC TGGAACGCTC GGCGGCCGGC 
TTCGGCGACG CCCTGGGCGC CTCAAGCCAG GGCCGCGCCT GCTGGCCGAT CAAGCGCGGG 
CAGCTGCTGG AGATCGCCAG CGCCTCGCGT CACCACATGG GCACGACCCG GATGAGCGCC 
GATCCCGAGA AGGGCGTCGT CGATCCGAAC CTGAGGGTCC ACGGGACCGG CAACCTCTAT 
GTCGCCGGCA GCTCGGTGTT CCCGACCTCG GGCATCGCCA ACCCCACCCT GACGATCCTG 
GCCCTGGTCA TGCGCCTGGC CGACCACCTG AAGCTGGACA TGGGAGCCCG CCGATGA

Protein sequence

MAFIDARTLP DASRIEADLV IIGGGLAGIA LAKELAGGPL KVAVLESGGR EIDMEIQGLY 
AGTAVVKAPD NPDKPFDDYP VQSRVRVLGG SGMVWGGKCA PLDPADFAAR AWAPHSGWPV 
TRVQMQPFYD RACDLLEIPR FDADNKALKD PARPPLALDP RDGFFSAPRV FTRYSGGADK 
DAFDRFRTDF AEAPNITVYL HANVTQIRLN AAGDQVEGLD VACLDGKRHT AVGKTHVLAV 
GGIENVRLLL ASNSVRPEGV GNRHDLVGRF FQGHVTYSLD GDAETEGTAV HVSRAEPMSL 
YFNPGRTAAH CVLASGLPAQ ARMKTGNFTA TLYAAEETGV ATPPEAETKA LRRVATRIDG 
TGKTDGQLLG FFAMSEHFPN PDSRVALDPS AKDALGMPRV HLEWRYSKAD WDSLERSAAG 
FGDALGASSQ GRACWPIKRG QLLEIASASR HHMGTTRMSA DPEKGVVDPN LRVHGTGNLY 
VAGSSVFPTS GIANPTLTIL ALVMRLADHL KLDMGARR