Gene Caul_0988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0988
Symbol
ID	5898443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	1043549
End bp	1044670
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	70%
IMG OID	641561470
Product	hypothetical protein
Protein accession	YP_001682616
Protein GI	167644953
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.4586
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.292703
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGATT TCAAGGGCAT GAAACGCCAG CGCGGCCGCA ACAATCGCGG CGGAGCGGGT 
AGTGGCGGCA AGCCTCAGCA GCACAACGCC AACCGGGCCT TCGATTCGAA CGGCCCCGAA 
GGCGTGAAGG TGCGCGGCGC GGCCCAAAGC GTCTATGAAA AGTACCAGCA GCTGGCCCGC 
GACGCGACGT CGTCCGGCGA CCGGGTTCTG GCCGAGAACT ACCTGCAGCA CGCCGAGCAC 
TATTTCCGGG TGCTGCGCGC CATCCAGCCG AATCGCCCCG TCAGCGACAT CATCGGCAAG 
GACGCCTATT CGGCCTACGA GATCGATTTC GAGGCCGAGC CGGAAGAGCA GACCGAAGCG 
CCAGAAGCCG CCCAGTCCGA GACTCAGGGC GATGGCGACG GCGGTGATCA GGGTCAGGGC 
GAAGGCCGCC GCGACCGGTT CGAGAACCGT CCCCGCGACG ACCGCCCCCG GGAAGACCGG 
CAGCGCGATG ACCGTCCCCG TGACGGCCAG CGCGACGATC GTCCTCGCGA AAACCGCGAC 
CGCTTCGAGA ACCAAGGTCA AGGTCAAGGT CAAGGTCAGG GTCAAGGCCG CCGGGATCGT 
TGGCGCGACC GTGACGACCG TCCCCGTGAT GGCCAGCGTG ATGATCGTCC CCGTGATGAT 
CGTCCGCGCG AAGATCGCCC GCGCGACGAC CGTCCCCGCG AAGATCGTCC GCGTGACGAC 
CGTCCGCGCG AAGATCGCTT CCGTGACGAA CGTCCTCGTG ACGACCGCCC CCGTGAAGAC 
CGGCCGGCCG TCGTCGAGGC GGCCGTCGAG GCTCCCGTCG AAGCCCGCCG CGAGCGTCCG 
CGCCGCGAAC GGGCTCCGCG CGACCGCGAT CCCATGGCGG TGATCGAGCC GCAGGCCATG 
CCGCTGACCA GCGAGGCTCC GGCCTCGCCG GTGCTGCGCG GCCAGGACGG CGACGTCAGC 
CACGCCCCGG CCTTCCTGGG CCGCAAGGCG CCGCGCGCCG AAGCCCCGGT CCAGGCGGCT 
CCCGTCGCGC CGTCGGCCGA CGAAGCGCCG GCCAAGCCCA AGCGTCGCCG CGCTCCGCGC 
AGCTTCGAAG GCAGCGCCGC GCCGGAGTCG GAAGAGGTCT AG

Protein sequence

MRDFKGMKRQ RGRNNRGGAG SGGKPQQHNA NRAFDSNGPE GVKVRGAAQS VYEKYQQLAR 
DATSSGDRVL AENYLQHAEH YFRVLRAIQP NRPVSDIIGK DAYSAYEIDF EAEPEEQTEA 
PEAAQSETQG DGDGGDQGQG EGRRDRFENR PRDDRPREDR QRDDRPRDGQ RDDRPRENRD 
RFENQGQGQG QGQGQGRRDR WRDRDDRPRD GQRDDRPRDD RPREDRPRDD RPREDRPRDD 
RPREDRFRDE RPRDDRPRED RPAVVEAAVE APVEARRERP RRERAPRDRD PMAVIEPQAM 
PLTSEAPASP VLRGQDGDVS HAPAFLGRKA PRAEAPVQAA PVAPSADEAP AKPKRRRAPR 
SFEGSAAPES EEV