Gene Caul_0471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0471
Symbol
ID	5897926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	511157
End bp	512206
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	66%
IMG OID	641560954
Product	signal transduction histidine kinase
Protein accession	YP_001682103
Protein GI	167644440
COG category	[T] Signal transduction mechanisms
COG ID	[COG3920] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGAACA TCTCCGTCAA ATCCACCGCG CAAAGACAGG CCGAGGCCGA GGTCGATGGC 
TTCCGACAAA ACCTCGGCCC CTTTGTCGTC GCGGCCCAAA CAAGCCGAGC GGCGATGGTG 
TTCACCGACG CCACCGCATC GGGAAATCCG ATCATCTTCG CCAACGACGC CTTCCTGTCG 
ATGACCGGCT ATGCGCGGGA AGAAGTGCTC GGACAGGCTT TCAACTTCCT GATGGTCCGC 
GGCGCCAACC AGGAGGTGCT GGCGCAGATC GACGCCGCAT TCGCTGGCGA CTCCCAGGGC 
TATTTCGAGA TCTGCGACCG ACGCAAGGAC GGCAGCATCT TCTGGACCGC CATCGTCACC 
AACCCCGTCC AGGATGAGAG CGGCGCGATC GTCCAGCACT TCGCCTCGTT CGTGGATCTC 
ACCGGCAAGC GGCGCGAGGC CGAACACCTT CGCTTTCTGC TCGATGAGCT CAACCATCGC 
ACCCAGAACA CCCTGACCAG CGTCCTGGCC ATCGCCGCCC AGACGCTCCG CGGCAAAGCC 
GACAAGGCCT TGGTCGAGGC TTTCGAAGGG CGCGTCCTGG CGCTCGCCAA GGCGCACACC 
CTGTTGGGCC GCGACAATTG GGAAGCGGTG AGCCTGCGCG ACGTTCTGGA GCGGATCCTT 
GGTCCGTTCG ACCTGGAGAA CGATGGCCTG TCCCGCTTTA CCCTCGAGGG CGGCGAGGCC 
TGCCTGGCGC CGAAGGCCGC CCTGACCCTG GCCATGGTGT TTCACGAGTT GGCCACCAAC 
GCCATGAAGT ACGGGGCGCT GTCGGACGCC AGGGGACACG TCCTCGTCAC CTGGCGCATC 
GCGCCCACGC CGGGCGGCGA CCGACTGACC ATTCGCTGGC AGGAGGGCGG CGGCCCGAGT 
GTCGTTCCGC CCAGCCACAG GGGGTTCGGC TCGCGCCTGA TTGAAAGGGG GCTGGCCCAG 
GATCTGAACG GAGAGGTTCA CGTCGCCTAT GACGCCGCCG GCGTGACCTG CCAGATCGCC 
ATGCCGCTAC CCCCCGCCAG AACAGGATGA

Protein sequence

MLNISVKSTA QRQAEAEVDG FRQNLGPFVV AAQTSRAAMV FTDATASGNP IIFANDAFLS 
MTGYAREEVL GQAFNFLMVR GANQEVLAQI DAAFAGDSQG YFEICDRRKD GSIFWTAIVT 
NPVQDESGAI VQHFASFVDL TGKRREAEHL RFLLDELNHR TQNTLTSVLA IAAQTLRGKA 
DKALVEAFEG RVLALAKAHT LLGRDNWEAV SLRDVLERIL GPFDLENDGL SRFTLEGGEA 
CLAPKAALTL AMVFHELATN AMKYGALSDA RGHVLVTWRI APTPGGDRLT IRWQEGGGPS 
VVPPSHRGFG SRLIERGLAQ DLNGEVHVAY DAAGVTCQIA MPLPPARTG