Gene Caul_5148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5148
Symbol
ID	5897284
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010335
Strand	+
Start bp	67514
End bp	68500
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	72%
IMG OID	641555251
Product	AraC family transcriptional regulator
Protein accession	YP_001676582
Protein GI	167621797
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0642429
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCCCC GCACCATCAC CCTCCTGGCG GCTCCTGGCG TACAGCTGCT GGATGTCGCC 
GGGCCGCTGG ACGTGTTCGC CGAGGCCAAC CTCCAGGCCG GCGAGACGGT CTATCGCCCA 
CGGGTGGTCG GCCTGCGGCC CGGACCGATC GCCAGCTCGT CAGGCGTTCG CCTGTTGCCC 
GATACGCTTG TCGGCGAGCC GATCAGCCTG CGCTCGGACA CCTTGTTGGT CGCCGGCGCG 
CCGCACGCGC CCGACCTTGT CCTGAGCGAC GCCGAGAAGG CATGGCTGCG CCTGGCCGCG 
GGCAAGGCGC GCCGCCATGG CTCGGTTTGC AGCGGCGCTT TTCTGCTGGC CCAGGCCGGG 
CTCCTGGCCG GCCGCCGCGT GACCACCCAC TGGGCCGTCG CCGAGCGCCT GGCCGCCGCC 
TGGCCCGACA TCGTCGTCGA CGCGGATGCG TTGTACGTGC GTGACGGGCG CCTGCGCACC 
GCCGCCGGGG TGACGGCGGG CTTGGATTTG GCGCTGGCTT TGGTCGAGGA GGATCTGGGT 
CGCGACGTCG CCGTCAAGGT CGCCGCCCAG CTGGTGATGT TCTTTCGTCG TCCTGGCGGT 
CAACTGCAGT TCAGCCGGCG TGGCGAGCTG GCCCCGCAGG GTCGCTCGGC GCTGCAGGAG 
GTTCAGCGTT GGATCAGCGC CCATCCCCAG GAGGATCATG CCGTTGCAAA GCTCGCCGCC 
CGGGCCGGGC TCAGCCCCCG GCATTTTGCC CGCCTGTTCG TAGAAGAGAT CGGCGTCACC 
CCGGCCGCCT TCGTCGAAGC CGCTCGCGTA GCCGCCGCGC GACGCATGCT CGAGGACGGC 
GGCGAGGCGC CCAAGCAGGT CGCCGTCCTG TGCGGGTTCG CCGACGCCGA CGTGCTGCGC 
CGCGCCTTCG TACGCCACGT GGGCGTGACG CCCGCTGAGT TTCGACGCCG CCACGGCGCC 
TCGGCGCGGC AGGAGCCGAC AGCCTAG

Protein sequence

MPPRTITLLA APGVQLLDVA GPLDVFAEAN LQAGETVYRP RVVGLRPGPI ASSSGVRLLP 
DTLVGEPISL RSDTLLVAGA PHAPDLVLSD AEKAWLRLAA GKARRHGSVC SGAFLLAQAG 
LLAGRRVTTH WAVAERLAAA WPDIVVDADA LYVRDGRLRT AAGVTAGLDL ALALVEEDLG 
RDVAVKVAAQ LVMFFRRPGG QLQFSRRGEL APQGRSALQE VQRWISAHPQ EDHAVAKLAA 
RAGLSPRHFA RLFVEEIGVT PAAFVEAARV AAARRMLEDG GEAPKQVAVL CGFADADVLR 
RAFVRHVGVT PAEFRRRHGA SARQEPTA