Gene Caul_2043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2043
Symbol
ID	5899498
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2184131
End bp	2185108
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	69%
IMG OID	641562532
Product	tRNA-dihydrouridine synthase A
Protein accession	YP_001683669
Protein GI	167646006
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00742] tRNA dihydrouridine synthase A

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.00353768
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.913937
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGACT GGAGCGATCG GCATTGCCGG TCGCTGCACC GTGTGCTGTC GCGCCGGGCG 
TTGCTGTATT CGGAGATGGT GACCAGCGGG GCGGTGCTGC ATGGCGACTG CGAGAAGTTG 
CTGGGGTTCG ACGCCGGTCA GCATCCGGTG GCCCTGCAAC TGGGCGGCTC GGAGCCGGCC 
GATCTGGCCG CCGCCGCCCG GATTGGCGAG GACTTTGGCT ACGACGAGAT CAATCTGAAT 
GTCGGCTGCC CGTCGGACCG CGTGCAGAGC GGCCGTTTCG GGGCCTGCCT GATGCGCGAA 
CCGAAGCTGG TGGCCGACTG CATGGCGGCG ATGACCGCGG CGGTGTCCGT ACCGGTCACC 
GTCAAGTGCC GGATCGGGGT CGACGACCAG GACCCGGAGC AGAGCCTGTT CGAGCTGGTC 
GATCTGTCGG CCCAGGCCGG CGTAACCCAC TTCGTGGTTC ACGCGCGCAA GGCCTGGCTG 
AAGGGCTTGT CGCCAAAGGA AAACCGCGAC GTGCCGCCGC TGGACTATCC GTTGGTCCAT 
CGGCTGAAGG CCGAGCGGCC CGCCCTGACC ATCGTCATCA ACGGCGGGAT TCCGGATCTC 
GACGCCTCGC TGGTCCAGCT GGCGCATGTC GATGGGGTGA TGCTGGGTCG GGCGGCCTAT 
CACGAGCCTG GCCTGCTGGG TCAGGTCGAT CGCCGGGTGT TCGGCGAGGG CCGCGATGTC 
GACGCCTTCG AGGCGGTCGA GCTCTACAAG TCCTATATGG CCAGTCAGTT GGCGGCCGGC 
GTGCACCTGA CGGCGATGAG CCGGCACATG CTGGGCCTGT TCCACGGCAT GCCGGGCGCG 
CGGGCTTGGC GCCGCATCCT CACGGTCGAG GGCGTCGCGG CGGGGGCGGG GCTGGAGGTT 
GTCGATCGCG CCTTGGCCGC CGTCCGCCAG GCTGTCGATG CGCGCGAGGC GCGGGCGCTG 
GAGGCGGTCG CGAGCTAA

Protein sequence

MMDWSDRHCR SLHRVLSRRA LLYSEMVTSG AVLHGDCEKL LGFDAGQHPV ALQLGGSEPA 
DLAAAARIGE DFGYDEINLN VGCPSDRVQS GRFGACLMRE PKLVADCMAA MTAAVSVPVT 
VKCRIGVDDQ DPEQSLFELV DLSAQAGVTH FVVHARKAWL KGLSPKENRD VPPLDYPLVH 
RLKAERPALT IVINGGIPDL DASLVQLAHV DGVMLGRAAY HEPGLLGQVD RRVFGEGRDV 
DAFEAVELYK SYMASQLAAG VHLTAMSRHM LGLFHGMPGA RAWRRILTVE GVAAGAGLEV 
VDRALAAVRQ AVDAREARAL EAVAS