Gene Caul_1989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1989
Symbol
ID	5899444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2139478
End bp	2140512
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	73%
IMG OID	641562478
Product	anti-FecI sigma factor, FecR
Protein accession	YP_001683615
Protein GI	167645952
COG category	[P] Inorganic ion transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG3712] Fe2+-dicitrate sensor, membrane component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGATC ACCAGACCCA ATCGAGATCG GCGAGCCCCA CGGCCGCGGA GCTGAAGACG 
GCGCGCGACG AAGCCGCGGC CTGGTACGCC AAGATGCACG GCAAGGTGAC GCACCGCGAG 
GTGACGGACT TCTACGCCTG GCGCGCCGAC AGCCTCAACG ACGCGGCCTA CAGCCAGGTC 
GAGGCCTTGA CCCAAGGCGT GCGCGACGTC GCCGGCGATC CCCGGATCCA AGCCATCGGC 
CAGGATCTTC AAGCGCGGCG GCGACGGCGC GGCGGCGCCC TGGCCCGGCT CAAGGCCCGC 
CCCGGTCCCT GGATCACGGG CGTGGGCCTA GCGGCGGCGG CCGTGCTGGC CGGCGTCCTG 
CTCACCACCC AGCCCTTCGG CCAGACCTAT CGCACGGCGG TGGGCGAGCG CCGTATCGTG 
GCCCTGGCCG ACGGCTCGAC GATCGACCTG AACACCGACA GCCAGGTGCG TGTGCGCCTG 
TCGCGCGACC GAAGGGCGAT CACCCTGGAC AGGGGCCAGG CGCTGTTCGC CGTGGCCCAC 
GACAGCGCGC GGCCGTTCAT CGTCACGGCC GGCGACACCG CCGTGCGGGC GGTCGGCACG 
CGGTTCGAGG TCTACAGGAC CGGGGCCGCG GTGCGGGTGA TCCTGGCCGA GGGCCGCGTG 
CAGGTGACCC AGGCCCACAC CCCGGCCCCG ACGATGATGC GGGCCGGAAC CCGGCTCGAC 
CTCGCCGGCA AGGCCCCGGC CCGCCCCGTC GCCATCGACG TCGCCGCCGC TACCGGGTGG 
ACGGAAGGAC GCCTGACGTT CCAGGACGCG CCGCTGGCCC AGGCCGTGGC CGAGGTCAAT 
CGTTATAGCC GCAAGAAGGT GGTGCTCGGC CCAGGCGTCC CGGCCGACGA GTTGGTCAAC 
GGGATCTTCG ACGCCGGCGA CACCACCGCC TTCGTCAAGG GCGTGGCCGC CTCGCTGGAC 
CTGAAGAGCG CCGCCCGCGA CGACGGCGCG ATCGAACTGC GCGGTCCCGT GCCGACAGCC 
ACGCCGAAGG CCTGA

Protein sequence

MSDHQTQSRS ASPTAAELKT ARDEAAAWYA KMHGKVTHRE VTDFYAWRAD SLNDAAYSQV 
EALTQGVRDV AGDPRIQAIG QDLQARRRRR GGALARLKAR PGPWITGVGL AAAAVLAGVL 
LTTQPFGQTY RTAVGERRIV ALADGSTIDL NTDSQVRVRL SRDRRAITLD RGQALFAVAH 
DSARPFIVTA GDTAVRAVGT RFEVYRTGAA VRVILAEGRV QVTQAHTPAP TMMRAGTRLD 
LAGKAPARPV AIDVAAATGW TEGRLTFQDA PLAQAVAEVN RYSRKKVVLG PGVPADELVN 
GIFDAGDTTA FVKGVAASLD LKSAARDDGA IELRGPVPTA TPKA