Gene Caul_2640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2640
Symbol
ID	5900095
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2865893
End bp	2866882
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	68%
IMG OID	641563131
Product	AraC family transcriptional regulator
Protein accession	YP_001684265
Protein GI	167646602
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.708344
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGATT TCCCAACTCG TCCCCGCAAG ATCGCGATCG TCGGTTATCG CGGCGCGCAA 
TCGCTCGATA TCAACGGGCC TTTCGAGGTG TTCGCCATGG CAAACCGGTT CGGCGGCGTG 
ACCGTTTACG AACCGATCCT GGCCTCGCCC CACGGCGGCG CGATCGTCTG CAATTCCGGG 
CTCGGCATCG CGGGTTCGGT GGCCTTCGCC GACCTTCCCA CCGACCTCGA TACGATCCTG 
GTCGCCGGCG GGGACGAAGA GGGCCTGCTG GGGATGCGCG ACGCCAACGT TCTCGAATGG 
CTGACCGAGC GGGCTCGGTC CACGCGGCGC GTGGGCAGCG TTTGCTCGGG CGCGTTCGTG 
CTGGCCGCGG CGGGGATGCT GGACGGCCGG CGCGCCACGA CCCACTGGGA AGTCTGCGAC 
GAGATGCGCG CCTTTCGACC GGCCGTGAGG TTGGAGCCGG ATGCGATCTT CGTGGCCGAT 
CCGCCGTACT ACACGTCGGC GGGCGTGACG GCCGGCATCG ATCTTTGCCT GTCCTTCGTG 
GAGGAGGACT GTGGACCGGA GCTGGCGCTG GCGATCGCTC GCAATCTCGT CCTCTTCATG 
CGCCGGCCGG GCGGGCAGAC GCAGTACAGC ACCGGGCTCA ATGTGCAGGT CGCGGCCACG 
CCGAAGCTGC GCAGCCTGAT CGCCGAGATC AGCGCCGATC CCGGCGGCGA CCAGACGCTG 
CCAAGCCTCG CCGACAAGGC CGGCATGACC GAGCGAACGT TCAGCCGCGT CTTCCACAAG 
GAGACCGGAA CCACTCCGGC GGCGTTCGTG GAAATGGCCC GGGTCAACCG CGCCAAGGCT 
TTGCTGGAAA CCTCCGACTG GCCGCTGGCG CGTGTCGCCG AGCGCTCGGG CTTTGGCAGC 
CTGGACGCGC TGCATCGGGC CTTTCAAAAA CGCGTTGGGG CGACGCCGGG CGACTATCGG 
GCTCGGTTCG GCCGCCAACC GGCTCAGTAG

Protein sequence

MPDFPTRPRK IAIVGYRGAQ SLDINGPFEV FAMANRFGGV TVYEPILASP HGGAIVCNSG 
LGIAGSVAFA DLPTDLDTIL VAGGDEEGLL GMRDANVLEW LTERARSTRR VGSVCSGAFV 
LAAAGMLDGR RATTHWEVCD EMRAFRPAVR LEPDAIFVAD PPYYTSAGVT AGIDLCLSFV 
EEDCGPELAL AIARNLVLFM RRPGGQTQYS TGLNVQVAAT PKLRSLIAEI SADPGGDQTL 
PSLADKAGMT ERTFSRVFHK ETGTTPAAFV EMARVNRAKA LLETSDWPLA RVAERSGFGS 
LDALHRAFQK RVGATPGDYR ARFGRQPAQ