Gene Caul_2604 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2604
Symbol
ID	5900059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2824704
End bp	2825711
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	71%
IMG OID	641563095
Product	NifR3 family TIM-barrel protein
Protein accession	YP_001684229
Protein GI	167646566
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.131824
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAATA CTCTCTCAGT CGGTAAGGTC GAGGTGCCCG GACGCGTTTG GATCGCGCCG 
ATGACGGGCG TCTCCGATCT ACCCTTCAGG GAAACCGCCA CCCGCCTCGG CGCGGCCTAT 
GTGGCGACCG AGATGGTGGC CTGCGCCGAA TTTGCGCGTG GACGGCCCGA CGCCGTGCGC 
CGCGCCGCCG TGGGCGACGG CCTGCCCCTG ATGGTCGTCC AACTGGTCGG CCGTGATCCC 
ACCTTCATGG GCCAGGGCGC GCGGATGGCC GCCGAGGCCG GGGCCCAGAT CATCGACCTG 
AACTTCGGTT GCCCTTCCAA GCAGGTCACC GGGGGCGTGG CCTCCGGCTC GGCCCTGATG 
CGCGAGCCGG ACCTGGCGGA AGCTCTGGTC GCCGCCGCCG TCCGGGCCGT CGACGTGCCG 
GTCACCGTCA AGATGCGCCT GGGCTGGGAC GACGACAGCC GTAACGCCGC CGACATCGCC 
CGCCGGGCCG TCGACGCCGG GGCGCAGGCG ATCACCGTCC ACGGCCGCAC CCGCTGCCAG 
TTCTACAAGG GCGTGGCCGA CTGGAGCGCC GTGGCGGCCG TCAAGGCGGC GGTGTCGGTT 
CCGGTGCTGG TCAATGGCGA CATCATCGAC GGCGACACCG CTCGCCTGGC CCTGGAGCAG 
TCCGGCGCCG ACGGGGTGAT GATCGGCCGC GGCGTCTATG GCCGCCCGTG GATCGCCCAA 
GCCATTGAGG CGGCCCTGAA CGGCGAGGGC TTCCGCGAAC CGGACGCCGA GGAGCGCCTG 
GCCATCGCCG TCACCCATTT CCGCCGCAGT CTGGGCTTCT ACGGCCAGAA CCTCGGCCTC 
AAGATGTTCC GCAAGCACCT GGCCTCCTAC ATCGAGGCCG CGCCCTGGCC CGATAGCGAG 
GAACTTCGCC GCACCGCGCG CGCCGCCCTG TGCCGCCTGG AGGATCCCGC CGCGATCGAG 
GACGGCCTGG CCGCTCTGTG GCTGGGCGAC CGGAGGCTGG CCGCATGA

Protein sequence

MSNTLSVGKV EVPGRVWIAP MTGVSDLPFR ETATRLGAAY VATEMVACAE FARGRPDAVR 
RAAVGDGLPL MVVQLVGRDP TFMGQGARMA AEAGAQIIDL NFGCPSKQVT GGVASGSALM 
REPDLAEALV AAAVRAVDVP VTVKMRLGWD DDSRNAADIA RRAVDAGAQA ITVHGRTRCQ 
FYKGVADWSA VAAVKAAVSV PVLVNGDIID GDTARLALEQ SGADGVMIGR GVYGRPWIAQ 
AIEAALNGEG FREPDAEERL AIAVTHFRRS LGFYGQNLGL KMFRKHLASY IEAAPWPDSE 
ELRRTARAAL CRLEDPAAIE DGLAALWLGD RRLAA