Gene Caul_1094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1094
Symbol
ID	5898549
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	1161119
End bp	1162243
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	71%
IMG OID	641561576
Product	AraC family transcriptional regulator
Protein accession	YP_001682722
Protein GI	167645059
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.760334
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTAGTG AAGGCGTTCC GGAGTTTCTT TCGCATTCCT GGAGTGATCT CGACTGGCGT 
CGGATCAAGT CTGGCGTCGA CGACCTGGGC GCCCGTGGAT TGGTGGTCGG GTCGTTCGAC 
GAAGAGCGCT CGTTCGGCGC GCGCCCGTCG CCCGCTTCGC CGGGCGAGGT GGTGCTGCGC 
GAGACCGAGG GGCCGCATGA GGTCTGGGCC CATGCCGCCG GGCGGAACCT TGCGGTCACT 
CAGCTCACGC CGGACCCCTG CCGCGGCCAC CTGTTGCGAG CCGGCTTGGG CGACATGGGC 
TTCGACGCCG GCGCCTTCAG CGGCGACCTG CGCGTGCGCG GGGTGATGGC GCGCAAGGCT 
TTCAGCTTCG TCTCGGTCCT GGAGCAGGAC GGGGTGCTGA ACCAGTGGGG CCATCGGATC 
GAGGAAGGCG ACATCCTGGC CATTCCGCCG GGCGACGAAC TGGACGGCCG TTTCCAGGGC 
CACACCGCCT ACGCCGTCGT CACCGCGCCC TGGGGGCTGG TCATGCAGCG GGCCGAGGCG 
TTCGAATGGC TGGCCGATCC GGGCTTCTGG ACCGAGGCGG CCGTCTATTC GCCCCCGCCC 
GAGGCCCGCG CGGCTTGCCG GCGTGTGCTG CAGGGCTGCT CGGGCGTCCT GCGGGCCATG 
GGCGCGGCGC CGCCGCCCAG CGCCGTTTCC TTCCTTCGCC ACGAGATTCT CGACGGCGTG 
CTGACAGCTC TGTCCCAGGT CAAGGTCGAA GGTGGACGCC GGCACGGCCT GTTGAACGCC 
GCCCGCATCG TCCGGGGCGC GGAGGATTTC CTCGACGGCG GCGGGGCGCG CCAGGCGGTG 
CAGATCGAGG ACATCTGCCG GGCGCTCAAC ATCTCGCGCC GCACGCTGTA TCGCGCCTTC 
CACGACCAAC TCGACGTCAG CCCCAAGGCC TATCTGCGGC TGAAGAACAT GTCAGCGGCC 
CGAGCCCGGT TCCTGGGGGC GGGCGTCCGG CCGACAACGG TGACCCAGGT GGCCCTGGAC 
CATGGCTTCT GGGAGCTGGG CCGATTCTCC GGCGCCTATC GGGCGATGTT CGGCGAGTCG 
CCTTCGGAGA CCCTGCGCGG CGCCCAGGGC GCCCCGGGGC GATAG

Protein sequence

MASEGVPEFL SHSWSDLDWR RIKSGVDDLG ARGLVVGSFD EERSFGARPS PASPGEVVLR 
ETEGPHEVWA HAAGRNLAVT QLTPDPCRGH LLRAGLGDMG FDAGAFSGDL RVRGVMARKA 
FSFVSVLEQD GVLNQWGHRI EEGDILAIPP GDELDGRFQG HTAYAVVTAP WGLVMQRAEA 
FEWLADPGFW TEAAVYSPPP EARAACRRVL QGCSGVLRAM GAAPPPSAVS FLRHEILDGV 
LTALSQVKVE GGRRHGLLNA ARIVRGAEDF LDGGGARQAV QIEDICRALN ISRRTLYRAF 
HDQLDVSPKA YLRLKNMSAA RARFLGAGVR PTTVTQVALD HGFWELGRFS GAYRAMFGES 
PSETLRGAQG APGR