Gene Caul_0771 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0771
Symbol
ID	5898225
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	821575
End bp	822753
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	70%
IMG OID	641561251
Product	GntR family transcriptional regulator
Protein accession	YP_001682400
Protein GI	167644737
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.25103
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCGTT TGTCGATGCG GAGCGGCGAT ATCAGGCCCT CGCCGGTGCG CGACATGCTC 
AACGTGTCCC AGCGGCCCGG CATGATCTCG TTCGCCGGCG GCCTGCCCGC GCCCGAGACC 
TTCGCGGGCC TGGAGCTGCC CCCGCCGCCG CGCGACCTGC TGCAATATGG CCCGACCGAG 
GGCGAGCCGG CGCTGCGCGA GCGGATCGCC CAGGACTTGG CCGCCTTGGG CCTGGACACC 
GAGCCCGACC GCGTCCTACT GCTGTCCGGG TCGCAGCAGG GCATCGACCT GACCGCCAAA 
CTGACCATCG ACGCCGGCAC GCGCCTGGCC GTGGAGTCGC CCGCCTATCT GGCCGCCCTA 
CAGGTGTTCC GCTTCTATGG CGCGCGCTTC CAGGTCACCG ACCGCGCCGA CCCGGCGGCG 
GGCTGGGCAG AGGGGCCGCC GGCCCTGGCC TATGTGATCC CAACCTTCCA GAACCCGACG 
GGCCAGTGCT GGAGCGCCGA CGAGCGCCAG GCGATGGCCC AGGCCTGCCA GGCCCACGAC 
GTGATCCTGT TCGAGGACGA CCCCTACCGC GACCTGGTCT ACGAACCTTG CGAGCGCCGG 
CCGGCCTGCG CGTGGATGAA GACCGGATCC TGGATCTACC AGGGCTCGTT CTCCAAGACC 
GTCGCCCCGG GCCTGCGCCT GGGCTACCTG ACCGCTTCGC GCGACCTGTT CCCCTTTCTG 
GTCCAGCTCA AGCAGGCGGC CGACCTGCAC ACCAACAGGC TTAGCCAATG GATGGTGCTG 
CAGTATCTGA ACGACCCCGG CCGCGCCGAG CGGATGGCGC GGGTCGCCGA CCTCTATCGC 
CGCAAGCGCG GCGTGTTCGC CCAGGCCCTG ACGCGGCATC TGGGCAATAT GGCCTCGTGG 
TCGCTGCCGC CGGGCGGGCT GTTCTTCTGG CTGACGTTGA AGGGCGATGT CGGTGTGGAG 
GCCCTGCTGA AGAACGCCGT CGAGCGCGGC GTTCTGTTCA CGCCGGGCAG CCATTTCCTG 
GCGGAGGGCG GGGCGAGCCC GACAATAAGG CTGAACTTCA GCCTGGCGGA GCCCGAGGCG 
GCGGAGCGGG GGCTGGCGAT TTTGGCGGAG CTGCTGCGGG AAGCCGGTGA GCCCTCCCCT 
ATCAACCGTC ATTCCCGCCC TTGTGGCGGG AACCCCTGA

Protein sequence

MARLSMRSGD IRPSPVRDML NVSQRPGMIS FAGGLPAPET FAGLELPPPP RDLLQYGPTE 
GEPALRERIA QDLAALGLDT EPDRVLLLSG SQQGIDLTAK LTIDAGTRLA VESPAYLAAL 
QVFRFYGARF QVTDRADPAA GWAEGPPALA YVIPTFQNPT GQCWSADERQ AMAQACQAHD 
VILFEDDPYR DLVYEPCERR PACAWMKTGS WIYQGSFSKT VAPGLRLGYL TASRDLFPFL 
VQLKQAADLH TNRLSQWMVL QYLNDPGRAE RMARVADLYR RKRGVFAQAL TRHLGNMASW 
SLPPGGLFFW LTLKGDVGVE ALLKNAVERG VLFTPGSHFL AEGGASPTIR LNFSLAEPEA 
AERGLAILAE LLREAGEPSP INRHSRPCGG NP