Gene Caul_2605 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2605
Symbol
ID	5900060
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2825708
End bp	2826838
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	71%
IMG OID	641563096
Product	signal transduction histidine kinase, nitrogen specific, NtrB
Protein accession	YP_001684230
Protein GI	167646567
COG category	[T] Signal transduction mechanisms
COG ID	[COG3852] Signal transduction histidine kinase, nitrogen specific
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGATC ACGCCCGCAT CGCCCCCGCC AAGGTCGCCG ACGGTCTGAA GATCGCCGCC 
TTCGACCTCA GCCCCGAGCC CGCCCTGGTC GTCGACCGGG AGGGCGCCTT GGTCGCCGTC 
AACGAGGCGG CCGAGGCGCT GTTTGGCCAG GGCCTGTCGC TGCTGGCTCG CGGCCGGTTC 
CGCGCCGCCC TGCCGCCAGG CTCGGTCCTG GTCTCGATGA TGGACCGCGC GCTGTTCGAA 
GGCGCTCTGG TCCGTGAGCA CGGGGTCGAG GTCAATCTGT TTGGCCAGCC GCCGTTCGAA 
GCCGACGGCG CCGCCGCGCC GCTGGGCGAC GGCTCGGTGC TGCTGACCCT GCATGTCAAG 
GGCGTGCTGG GCGTCGAGCG GGCCTCGGAC GCCGCCGGCC TCCGCTCGGT CGTCGGCCTG 
GGCCGCATGC TGGCCCACGA GATCAAGAAC CCGCTGGCCG GCATTCGCGG CGCGGCCCAG 
CTTCTGAAGA CCGGGGCCAG CGCCGCCGAC CAGCCCTTGG CCCAGCTCAT CGTCGATGAA 
ACCGACCGCA TCCGCCGCCT GGTTGATCGC ATGGAGGCCT TCTCCGACGA AGTCCCGGGA 
CCGCGCGAGG CGGTCAACAT CCACCAGGTG CTGGACCGCG TCCGGGCTCT GGTGGTCAAC 
GGCGTCGCCG ACGGCCTGGA CCTGCGCGAA CACTACGATC CGTCGCTGCC TGACGTCTGG 
GGCGACGAGG ATCACCTGAT TCAGGTGTTC CTGAACCTGG TCAAGAACGC CGCCGAGGCC 
GCCCACGCGC GCGGCGACGG GCAGGGGACA CTGTCGATTC ACACCGCCTG GCGTCCAGGC 
GTGCGGGTGC GCGGATCCGA TGGCAAGGCC GCCGCCGGAG CGCCGATCGA GATCCGCATC 
CAGGACAACG GCCCCGGCGT GCCCGACAGC CTGCGCGACC ACCTGTTTCA GCCGTTCGTC 
ACCACCAAGG CCAACGGCAC CGGCCTGGGC CTGGCCCTGG TCACCAAGCT GGTGACCAGC 
CATGGCGGCC TGATCGACTT CGAATCCGAG CCCGGCCGCA CCGTGTTCCG CGTGCTGCTG 
CCGATGGCGA CCGGAAAGCT CACCCGCTCT ACTGGAGACG CCCAAGCATG A

Protein sequence

MSDHARIAPA KVADGLKIAA FDLSPEPALV VDREGALVAV NEAAEALFGQ GLSLLARGRF 
RAALPPGSVL VSMMDRALFE GALVREHGVE VNLFGQPPFE ADGAAAPLGD GSVLLTLHVK 
GVLGVERASD AAGLRSVVGL GRMLAHEIKN PLAGIRGAAQ LLKTGASAAD QPLAQLIVDE 
TDRIRRLVDR MEAFSDEVPG PREAVNIHQV LDRVRALVVN GVADGLDLRE HYDPSLPDVW 
GDEDHLIQVF LNLVKNAAEA AHARGDGQGT LSIHTAWRPG VRVRGSDGKA AAGAPIEIRI 
QDNGPGVPDS LRDHLFQPFV TTKANGTGLG LALVTKLVTS HGGLIDFESE PGRTVFRVLL 
PMATGKLTRS TGDAQA