Gene Caul_3410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3410
Symbol
ID	5900865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3682657
End bp	3683646
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	70%
IMG OID	641563916
Product	ArsR family transcriptional regulator
Protein accession	YP_001685035
Protein GI	167647372
COG category	[H] Coenzyme transport and metabolism [K] Transcription
COG ID	[COG0640] Predicted transcriptional regulators [COG2226] Methylase involved in ubiquinone/menaquinone biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0187563
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0416707
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTAT CGTCCGAACA GGTTGTGGAT CTGCTGCGCG CGGCCGGGGA ATCGACCCGC 
CTGCGGGTGC TGGCCCTGTT GGCGATCGAG GAACTGTCGG TGCTGGAGCT GTGCCGCATC 
CTCGACCAGA GCCAGCCGCG TGTGTCGCGA CACCTGAAGC TGCTGGCCGA GGCCGGACTG 
GTCGAGCGTT TCCCTGACGG AGCGTGGGTC TTCTATCGCC TGGCGCTGAA GTCGCCGGGC 
CGGGGCGTGA TCGACCGGGC GTTGACGTTG ATCGATCCCG AGGACTCGGC CGCCCTGGCC 
GACGCCGAGA AGCTGACCCT GGTCCGTGCC GAGCGAGCCG CCGGCGCCCA GGCCTATTTC 
GCCCGCAACG CCGCGCGCTG GAACGAGATC CGTTCGCTGT ATGTCGACGA GGCCGAGGTC 
GAGGCCGCCA TCCTGCGGGC GGCGGGCGAG GGGCCCTTCG ACGAAATGGT CGACCTGGGC 
GCGGGCGCGG GACGCATGCT GACGCTTCTT GGTCGCCGCG CGGGCGCGGC GTTGGGGCTC 
GATCTGTCGC AGCAGATGCT CAACATCGCC CGCGATGAGG TGGCCAAGGC GGGCCTGGCT 
CAATGCGAGC TGCGCCACGG CGACATCTTC GCCACCGGCC TGCCGGGCGG CTGCGCCGAC 
CTGGTGACCG TGCACCAGGT GCTGCACTAT CTGGGCGATC CCGCCGCCGC CGTGGCCGAG 
GCCGCGCGGC TGGTGGCCGA TGGCGGCCTG CTGCTGATCG CCGACTTCGC CCCGCACGAC 
CACGAGTTCC TGCGCGAGAA CCACCAGCAC CGCCGCCTGG GCTTCGCCGA CGCCGAGATC 
ATTCCCTGGA TCGAGGCCGC CGGCCTTGTC CTGGACAGCA ACATCGCCCT GCCGCCGACC 
TCGGACGAAG GCCTGACCGT CAAGATCTGG ACGGCCCGAC GCCCAAGCGA TCTGGCGGCC 
GAAAGAAACG CCGAAAGAAA CGCCGCATGA

Protein sequence

MKLSSEQVVD LLRAAGESTR LRVLALLAIE ELSVLELCRI LDQSQPRVSR HLKLLAEAGL 
VERFPDGAWV FYRLALKSPG RGVIDRALTL IDPEDSAALA DAEKLTLVRA ERAAGAQAYF 
ARNAARWNEI RSLYVDEAEV EAAILRAAGE GPFDEMVDLG AGAGRMLTLL GRRAGAALGL 
DLSQQMLNIA RDEVAKAGLA QCELRHGDIF ATGLPGGCAD LVTVHQVLHY LGDPAAAVAE 
AARLVADGGL LLIADFAPHD HEFLRENHQH RRLGFADAEI IPWIEAAGLV LDSNIALPPT 
SDEGLTVKIW TARRPSDLAA ERNAERNAA