Gene Caul_4779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4779
Symbol
ID	5902241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	5160291
End bp	5161571
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	74%
IMG OID	641565299
Product	Fmu (Sun) domain-containing protein
Protein accession	YP_001686397
Protein GI	167648734
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID	[TIGR00563] ribosomal RNA small subunit methyltransferase RsmB

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.849075
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.940845
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACTCAGG AACTCAATGA CGGCCTCCCG GCACGGGAAG GCGCCCTCGC CCTCATCGAC 
GCGGCCCTGT CGCGGCGCGG CGGGCTCGAC GAGGCCGCCT CGGCCAACGC TTTTCGCTTT 
CTCGAACCGC GGGAGCGCGC CTTCGCGCGC GCCCTGGCCA TGGCCACCTT GCGTCATCTG 
GGACCCATCG ACCGCGCCCT GGCCGGCAAG CTGGCCAAGG AACCACCGCC CCGCGTGCGC 
AACCTGCTGC GCCTGGGCGC GACCCAGGCC TTCTTCCTGG AGGTGCCCGC CTTCGCCGCC 
GTCGCCACCA GCGTCGAACT GGCCGGCGCC AGCAAGACCA GCCGCCCGTT CAAGGGCCTG 
GTCAACGCCG TGCTGCGCGG CCTGCTGCGC GACGGCGCCC TGTCCGACGC TTCGGAACAC 
CTGGCTCCGC CGTGGCTCTA CGCCCGCTGG GTTAGCGCCT ATGGCAAGGA GACCGCCGAC 
GCGGTCGCCG CCCAGATCGG CTTCGAGCCG GCCACCGACC TTTCCTTGAA GCCCGACTTC 
GACGCCACGG CGCTGGCCGC CGAGCTGGAG GGCGAGATCC TGCCCGGCGG CACGCTGCGC 
ACCGAGCGGC GCGGCGACGT CTCGGCCTGG CCGGCCTTCG ACGACGGCGT CTGGTGGATC 
CAGGACGCCG CCGCCGCCAT CCCCGCCCGC CTGCTGAACC TCAAGCCCGG CGAAACGGCG 
CTCGACCTCT GCGCCGCGCC CGGCGGCAAG ACGATGCAGA TGGTCGCGGC CGGGGCCCAG 
GTCGTCGCCA TCGACCGCTC GCCCGCCCGG CTGGGCCGCG TCACCGAGAA CCTGGCCCGC 
ATGTCCATGC AGGCCGAGGT GATCGCCGCC GACGCCGGAG CCTGGGACGA TGCGCGCACC 
TTCGACGCGG TGCTGCTGGA CGCCCCCTGC TCGGCCACCG GCACCTTCCG CCGCCACCCC 
GACGTGTTGT GGGCCGCCCG CCCCGGCGAC GTCGCCAGCC TGGCCGGCGT GCAGAGCAAG 
CTGCTCGACA GCGCGGCGGG CCGACTCAAG CCCGGTGGCC GTCTGGTCTA TTGCGTCTGC 
TCGCTGGAGC CCGAAGAGGG CGAGGCCCAG GTCGAGGCGT TCCTCGCCCG CCGCCCGGAC 
ATGGCGCTGG ATCCGATCAC CTCGGAGGAA GGCGGCGCTC CGGCCGCCAG CCTGACGCCG 
CGCGGCACGC TGCGCATCCT GCCCCACCAC CGCGAGGGCG GACTGGACGG CTTCTTCGCG 
GCGCGGTTCG TGAAGCTCTA A

Protein sequence

MTQELNDGLP AREGALALID AALSRRGGLD EAASANAFRF LEPRERAFAR ALAMATLRHL 
GPIDRALAGK LAKEPPPRVR NLLRLGATQA FFLEVPAFAA VATSVELAGA SKTSRPFKGL 
VNAVLRGLLR DGALSDASEH LAPPWLYARW VSAYGKETAD AVAAQIGFEP ATDLSLKPDF 
DATALAAELE GEILPGGTLR TERRGDVSAW PAFDDGVWWI QDAAAAIPAR LLNLKPGETA 
LDLCAAPGGK TMQMVAAGAQ VVAIDRSPAR LGRVTENLAR MSMQAEVIAA DAGAWDDART 
FDAVLLDAPC SATGTFRRHP DVLWAARPGD VASLAGVQSK LLDSAAGRLK PGGRLVYCVC 
SLEPEEGEAQ VEAFLARRPD MALDPITSEE GGAPAASLTP RGTLRILPHH REGGLDGFFA 
ARFVKL