Gene Caul_3702 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3702
Symbol
ID	5901158
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3996464
End bp	3997906
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	69%
IMG OID	641564213
Product	tRNA (uracil-5-)-methyltransferase Gid
Protein accession	YP_001685327
Protein GI	167647664
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1206] NAD(FAD)-utilizing enzyme possibly involved in translation
TIGRFAM ID	[TIGR00137] tRNA:m(5)U-54 methyltransferase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACTT CCCCCAAACC CGTCGCCCCC ATCCACGTCA TCGGGGGCGG CCTGGCCGGG 
TCCGAGGCCG CCTGGCAGAT CGCCCAGGCC GGCGTCCCGG TCGTCCTGCA CGAGATGCGT 
CGCGACCTGC CCTCAAGCAG CGGAGCGGTA GGGCCAACAA AAGTGCGCAC CGACGCCCAT 
CAGACCGACG GCCTGGCCGA GATGGTCTGC TCCAATTCGT TCCGGTCCGA CGACTGGCAG 
TTCAACGCCG TCGGCCTGCT GCATGCCGAG ATGCGCAAGC TGGACTCGTT GATCCTGTCG 
GCCGCCGACC AGCACCAGGT GCCGGCCGGC GGCGCCCTGG CCGTCGACCG CGACGGCTTC 
TCGGCCGAGG TCACCCGCCG TATCGAAGCG CATCCGCTGA TCACCATCGA ACGCGAGGAG 
GTCGCGGGCT TGCCGCCGGA AGACTGGGAC AGCGTGGTGG TGGCCACCGG CCCCCTCACC 
TCGCCCGCCC TGGCCGACGC GATCCTCGAG CTCAGCGGCG AAGGCCAGCT CAGCTTCTTC 
GACGCCATCG CCCCGATCAT CCACGTCGAG TCGATCGACA TGGACATCGC CTGGCGCCAG 
TCGCGCTACG ACAAGGAAGG CCCCGGCGGA GACGCGGCCG CCTACATCAA CTGCCCGATG 
AACAAGGCGC AATACGAGGC CTTCATCGAC GCCCTGCTCG AAGGCCCCAA GGCCGAGTTC 
AAGGACTGGG AGCACGTGCC CTATTTCGAC GGCTGCCTGC CGATCGAAGT CATGGCCGAG 
CGTGGCCGCG AGACCCTGCG CCACGGCCCG ATGAAGCCGG TCGGCCTGAC CAACCCGCGT 
GACCCGACCG TGAAAGCCTA CGCCATCGTG CAACTGCGCC AGGACAACGC CCTGGGCACG 
CTGTGGAACA TGGTCGGCTT CCAGACCAAG CTGAAGCACG GCGCCCAGGC CGAGGTCTTC 
CGGATGATCC CGGGCCTGCA AAACGCCCAG TTCGCGCGGC TGGGCGGCCT GCACCGCAAC 
ACCTTCATCA ACAGCCCGCG CCTGCTGGAC CGGTCCCTGC GAATGAAGGT CGCGCCGCGC 
CTGCGCTTCG CGGGTCAGAT GACCGGGGTC GAGGGCTATG TCGAAAGCGC CGCCACGGGC 
CTGCTGGCCG GCCGCTTCGC CGCCGCCGAG CGCCTAGGCA AGACGCTGGA CGCCCCGCCG 
CCGACCACCG CCCTGGGCGC TCTGGTCGAC CACGTGACCG GCGGCCACAT CGAGGGCGAA 
GCGCTGGGCA AGACCAGCTT CCAGCCGATG AACATCAACT ATGGCCTGCT GCCGCCGACG 
GAGACCCCCA AGGTCGGGGA CGACGGCGTC AAGATCCCGA TGAAGGAACG CGGCCGGGCC 
AAGAAGCGGC TGATGAGCCT CCGGGCGCTG GCGGATCTGG ATCAGTGGAT GGCAGGGGCC 
TGA

Protein sequence

MSTSPKPVAP IHVIGGGLAG SEAAWQIAQA GVPVVLHEMR RDLPSSSGAV GPTKVRTDAH 
QTDGLAEMVC SNSFRSDDWQ FNAVGLLHAE MRKLDSLILS AADQHQVPAG GALAVDRDGF 
SAEVTRRIEA HPLITIEREE VAGLPPEDWD SVVVATGPLT SPALADAILE LSGEGQLSFF 
DAIAPIIHVE SIDMDIAWRQ SRYDKEGPGG DAAAYINCPM NKAQYEAFID ALLEGPKAEF 
KDWEHVPYFD GCLPIEVMAE RGRETLRHGP MKPVGLTNPR DPTVKAYAIV QLRQDNALGT 
LWNMVGFQTK LKHGAQAEVF RMIPGLQNAQ FARLGGLHRN TFINSPRLLD RSLRMKVAPR 
LRFAGQMTGV EGYVESAATG LLAGRFAAAE RLGKTLDAPP PTTALGALVD HVTGGHIEGE 
ALGKTSFQPM NINYGLLPPT ETPKVGDDGV KIPMKERGRA KKRLMSLRAL ADLDQWMAGA