Gene Caul_1968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1968
Symbol
ID	5899423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2111346
End bp	2112356
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	72%
IMG OID	641562458
Product	anti-FecI sigma factor, FecR
Protein accession	YP_001683595
Protein GI	167645932
COG category	[P] Inorganic ion transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG3712] Fe2+-dicitrate sensor, membrane component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.629928
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACACATT CCCCCGCTCC AACTCCGCCG TTCGAAGACG TTCACGAGGC GGCCGCCGCC 
TGGTGGATGC GCCAGGTCTC CGACGATTGG ACCGACGCCG ACCAAGCCGG GTTGCAAGCC 
TGGCTGGCCG CGGACGCGCG CCATGCGGAC GCCTACGGCC AGGTGCTGGA GGCGATGTCC 
GCGTTCGATG ATCAGGACGA CGCCGCCGAT CTCCGGGCTT TGCGCCAACA GCTCCAAGAC 
AGCGCGGCCC CGCTTCCCGG CGCGCGACGT TCGTCCCCGC GCCCTTCGCG GCGCGCCTGG 
ATGATCGGCG CGGGCGCCCT GGCCGCCGGC CTCGTGGGCT TTGGGGTGCT GAGCCGCCCC 
TCACCCGCGC GGATCTACAT CGCCCCCGCG GGCGCCCCGG CCGAGTTCAA CCTGGCCGAT 
GGCTCGCGTC TGTCGATCGA GGGCGGCGGC GCGGTCGCGG TGCGGCTTGG CCGTCACGCC 
AGGGACCTGG AACTGACCCG CGGCCAGGCC CGCTTCGAGG TCGCGCACGA CAAGGCGCGG 
CCCTTCTCGG TCACCGTCGG CGACCAGGTC GTGGTGGCCA CCGGGACGAT GTTCAACATC 
GATCGGTTGA GCGAGCGCTC CGTCGTCAGC CTGTTGGAGG GGCGGGTCAT CATCCACCCG 
GTCCGGGGCG AGGGCCCGAC CCTGGTTCTG GCGCCGGGAG AGCAAGCCGT GCTGCGCCCC 
GGAAGCCTGC CCCTGCGCCA GACGGCCGAT GTGCGTTCGG CCGCGGCCTG GAGGAACGGG 
CGCTTGATCT TCGATGACAC GCCGCTCGCC GAAGCCGTCG AACGGGTCAA TCGTTATGGC 
GCCAATCTTC GCCTGGGCGA CGAAGCCTTG GCCCGCTTGC GGGTGACCGG GGTGTTCAAG 
GCCGGCGACA ACGCCGCCTT CGTCGAGGCG ATCACCGCCT ATCTCCCCAT CGCGGCGCGA 
CGCGGCGCCG ATGGGCGCAC CGCGCTGGTT CAACGCCCCG CCGGGGGTTA G

Protein sequence

MTHSPAPTPP FEDVHEAAAA WWMRQVSDDW TDADQAGLQA WLAADARHAD AYGQVLEAMS 
AFDDQDDAAD LRALRQQLQD SAAPLPGARR SSPRPSRRAW MIGAGALAAG LVGFGVLSRP 
SPARIYIAPA GAPAEFNLAD GSRLSIEGGG AVAVRLGRHA RDLELTRGQA RFEVAHDKAR 
PFSVTVGDQV VVATGTMFNI DRLSERSVVS LLEGRVIIHP VRGEGPTLVL APGEQAVLRP 
GSLPLRQTAD VRSAAAWRNG RLIFDDTPLA EAVERVNRYG ANLRLGDEAL ARLRVTGVFK 
AGDNAAFVEA ITAYLPIAAR RGADGRTALV QRPAGG