Gene Caul_0416 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0416
Symbol
ID	5897690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	455945
End bp	456994
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	66%
IMG OID	641560902
Product	LacI family transcription regulator
Protein accession	YP_001682051
Protein GI	167644388
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.339437
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGAGT ACGATTCCAA CCTGCCGACG CCCCATGGGC CAGCCACGAT CAAGAACGTG 
GCGCGTGCGG CCGGGGTCTC GGTGGCGACC GTCTCGCGCG CCTTGCAGAT GCCCGCGCGG 
GTGGCGCCTG ACACCCGGGC CAAGGTTTCG GCGGCGGTCG AGCGGCTAGG CTACACGCCC 
AATGTCCAGG CGCGCAACCT GCGAACCTCC AAGACCTCGA TGATCGTCGC CCTGGTGCCG 
GACATCTCCA ACTGCTTTTT CGCCGGGGTG ATCCGGGGCA TCGAGGACGT GGCCACCCGC 
AACGGCTATT CGGTCTTGCT GGGCGACATC CAGGACGACG TTTCGCGGGA GCAACGCTAC 
AGCGACATGA TCTCCGCCCG CGTGGTCGAT GGCATGATCA CCCTGCTGCC GCGCGTGCCG 
AAAATCCAGC GCGCCGGCCG GGCCCCTATC GTCAACGCCT GCGAATATGT CGACGACCCG 
GCCATCACCA GCGTCTACAT CAACAACGAG GCGGCCGCCG GCGATGCGAC GCGCTATCTG 
CTGACCCTGG GCCATCGCCA GATCGCCTTT ATCGGCGGGC CAGCTTCTAG TCCGATCAGC 
ATCGATCGCA AGCGCGGCTA TGAACAGGCC TTGCTGCAGG CGGGGGTCAC CCCGTCGCGG 
AAGCTCTGCG CCCAGGGCGA CTTCTCCATG GCCGCCGGCG TGCGGGGCGT GGAGTCGATC 
TTCGCCGCGG GCGAGCCCTT CACCGCGGTG CTTTGCGCCA GCGACGAGAT CGCGATCGGC 
GTGCTCCAAG CGGCCAAGGC GCGGGGATTT CGCGTGCCGC AGGACTTGTC GATCATCGGG 
TTCGACAACA TCATCTTCTC GCAATACATG GATCCGCCCT TGACCACGGT GGCCCAACCG 
CAGGAGGACC TGGGGCGCGA AGCGATGATG CTGCTGCTCA ACATCCTCGA TGAACAGGAC 
ATCCCGCCGT GCAAGCGGAT CTTGTCCACG CAGCTGGTGG TGCGCGGCTC TACCGGTCCA 
GCGCCGCGTC AGGCCCTCAT CGCCGACTAG

Protein sequence

MLEYDSNLPT PHGPATIKNV ARAAGVSVAT VSRALQMPAR VAPDTRAKVS AAVERLGYTP 
NVQARNLRTS KTSMIVALVP DISNCFFAGV IRGIEDVATR NGYSVLLGDI QDDVSREQRY 
SDMISARVVD GMITLLPRVP KIQRAGRAPI VNACEYVDDP AITSVYINNE AAAGDATRYL 
LTLGHRQIAF IGGPASSPIS IDRKRGYEQA LLQAGVTPSR KLCAQGDFSM AAGVRGVESI 
FAAGEPFTAV LCASDEIAIG VLQAAKARGF RVPQDLSIIG FDNIIFSQYM DPPLTTVAQP 
QEDLGREAMM LLLNILDEQD IPPCKRILST QLVVRGSTGP APRQALIAD