Gene Caul_3222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3222
Symbol
ID	5900677
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3482612
End bp	3483772
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	71%
IMG OID	641563727
Product	aspartyl/asparaginyl beta-hydroxylase
Protein accession	YP_001684847
Protein GI	167647184
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.235186
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGACG ACGCCCTGAC CGCCCTGCAC GCCCTGGTTC TGGCGGACGT CGCCTTGCAG 
GATACGCTGG GCGACATCGA GGACTCCAGG ACGTTCGCCG CGCGGGCGGC CGAGGCGGCG 
CGGGCGGCGG GCGTCGACCT GGACGCCGGC CATCTCGAAG CCTTGCTGTA CATGCCGCCG 
CCGAGCCCCG TCCTCGAAGG CCTTTCGCCG TTGCGCGGCT GGCTGCCCGC CGAGGTCAGC 
CAGGTCGACG GCCGGCCCGT GGTCGCCTGG CTGCGCTTTG GCCGGCGACG CCTGACGGAA 
CCCTTCTACG ACGACTCCCT CGTCCTCGCC CGTCGCCTGC CTTTCAACCG ATTGTTCGGC 
TTCCGCACGC CTTTGGCGGA GCTGGAGGCC TGGTCGGGCG CCCTGGCCCC GCCCTCAAAG 
CCCGACGGCC TGATCTTCCA CATGTCCCGC TGCGGCTCGA CCCTGGCGGC CCAGATGCTG 
GCGGCGCCGG CCCGCTACAT CATGGTCTCC GAAGCCGCGC CGATCGATGC GATCGTTCAA 
CTGGCCGACC ATGACGAGGA GGCCAAGGCC GCCTTGCTGC GGGCCATGGT CGCCGTGTTG 
GGCCAGACCC GAAACCCCGG CGAAACCCGC CGCTTCGTCA AGCTCGACTG CTGGCACAGC 
CTGGACCTGC CATTGTTCCG GCGAGCGTTC CCCGACACGC CCTGGGTGTT CCTGTATCGC 
GATCCGGTGG AGGTGATGGT CTCGCATGTC CGCCAGCGCG GCATGCAGAT GGTCCCCAGC 
CTCGTCGCGC CGGCGCTGTT CGGCATCGAC CTGGCCGACG CGCCGCCCGA CGAGGACTAC 
TGCGCGCGGG TCCTGGCCGC CGTCTGCGCG GGCGCCGTGC GTCACTATCC CCAGGGCGGC 
GGCCTGGTGG TCGATTATCG GGAACTTCCG GAGGCGCTGT TCACGCGGAT CCTGCCGCAC 
TTCGGCGTGG CCGTCTCCGA GGCCGAGGCG GACGCCATGC GCCAGGCGAC GGTTCGCGAC 
GCCAAGGCGC CGGAACAGGC CTTCGCGCCG GACGGCGAAA CCAAGCGGCG GGCGGCGACG 
GTCACGGTGC GGGAGATCTG CGAACGCCGG CTGGGACCGG TGCACCGGCG GCTGGAGGCG 
TTGCGGGTCG AGGAAATCTG A

Protein sequence

MPDDALTALH ALVLADVALQ DTLGDIEDSR TFAARAAEAA RAAGVDLDAG HLEALLYMPP 
PSPVLEGLSP LRGWLPAEVS QVDGRPVVAW LRFGRRRLTE PFYDDSLVLA RRLPFNRLFG 
FRTPLAELEA WSGALAPPSK PDGLIFHMSR CGSTLAAQML AAPARYIMVS EAAPIDAIVQ 
LADHDEEAKA ALLRAMVAVL GQTRNPGETR RFVKLDCWHS LDLPLFRRAF PDTPWVFLYR 
DPVEVMVSHV RQRGMQMVPS LVAPALFGID LADAPPDEDY CARVLAAVCA GAVRHYPQGG 
GLVVDYRELP EALFTRILPH FGVAVSEAEA DAMRQATVRD AKAPEQAFAP DGETKRRAAT 
VTVREICERR LGPVHRRLEA LRVEEI