Gene Arth_3051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3051
Symbol
ID	4444284
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3420738
End bp	3422318
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	71%
IMG OID	639690877
Product	periplasmic sensor signal transduction histidine kinase
Protein accession	YP_832530
Protein GI	116671597
COG category	[T] Signal transduction mechanisms
COG ID	[COG2205] Osmosensitive K+ channel histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.252815
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGCAG TTGAATCCGC CCGTGGCGGC GCCGCCCGAT CCGGACCCGG GCGGTCGGGG 
ACGGCACGCC CGGAGCTCCA GGGCATCGGG CGGAGCCGCT TTATCGTCGG CATGGTGCTT 
GCCGTCGTCC TGCCGCCCGC AGTGGAAGTA CTAGTGACCC TGGCGGGCTA CCGGAACTTC 
GCAATCATCA TGCTGCTCCA TCTCGCCGTC GCTGTGGCGG TGGCTGCCAT CGGGGGATTC 
TGGCCGGCCG TCGTGGCGGC TGTCCTGGGC ACAACGCTCC TCAACTACTT CTCAGCCGAT 
CCCGTGGGCA CGCTGTCCAT CGCCGATCCC TCCACCCTGT TCACCCTGCT CGTGTTCCTG 
GCTGTGGCCT GCAGCGTGGC ACTGGCCGTG GGCCTGGCCA CCCGCCGGGC GCAGGAAGCC 
GCCAGGTCCG GGGCCGAAGC CACGGCCTTG AGCGAGCTCT CCCTGCGGAT CCTCAGTTCC 
GACGGCAGCC TGGAGACGTT CCTCGAGAAG GTCCGCAGCA GGTTGGGAGT CGAAGCCGTA 
ACCCTGGTGG CCGGCAGCTC ACCTGGCAGC CCGCACGCTG CGGGATCTGC TGCCGGAAGC 
GGTCCGGGGC GGGCCCCCGG CAGCAACCCC GGGTGGGTCG CGCTGGCGAG TGCCGGGACG 
AGCGCGCCGG TGACGCACTC GGCCGCCGAC CACGCCGTCG TCGTCGATTC CCGCTACACG 
CTGCTGATCA ACGGCGGACC GCCCGCCGGT CAGCCGTTTT CCGGCCAGCA CCAGCGCATG 
CTGGCCGCTT TCGGGGCGTT CCTGGTGGCG ATCCTGGAGC GGCGCCAATT GGCGGCGAGC 
ATGGAGGACA ACCAGCGGCT TTCCGAGGGC AACAAGATGC GCACGTCCAT CCTGAGGGCC 
GTCAGCCATG ACCTGCGCAC CCCGCTGGCC GGGATCAAGC TGGCCGTCAG CAGCCTGCGC 
CAGGAGGATG TGCGGTTCTC CCCGGAGGAC GAACGCGAAC TGCTCGCCAC CATCGAGGAC 
TCGGCCGACC GGCTGGACCA CCTGATCGGC AACCTGCTGG ACATGTCCCG GATCACGGCT 
GACTCGGTCA ACCCGCTCCT GCGCGGGCTG GGCTGGGCGG ACGTGCTGCC CGATGCGCTC 
AAAGGGCTGC CCGCGGCGCG GATCCGCGTG GAACTGCCGC CCAACCTGCC CCGCGTGGAG 
GCCGACGCCG GGATGCTGGA GCGCGTGGTG GCGAACCTGG TGGAGAACGC ACTCAAATAC 
GCGCGCGAAG CCGATGTGGT GCTGACAGCG CGGGCGGGGG AGGGAATCGC GCTGGCCGGC 
CGGCCTGCCA GCGAATTCCG CGTGGTGGAC CATGGCTCCG GGGTTGCCCC GGCGGCGGTG 
CTGGACATGT TTCAGCCGTT CCAGCGGCTC AACGATTCCC AGCGCACCGG CGGCGGCCGC 
ACCGTGGGGA TCGGGCTGGG CCTGGCCGTT GCCAACGGCT TCACCGAAGC CATGGGAGGA 
ACCCTTGCGG CCGAGCCGAC GCCGGGCGGC GGGCTGACGA TGGTGGTCAC CCTGCCGCTG 
TGGGAGGGAC CGCTGCCGTG A

Protein sequence

MAAVESARGG AARSGPGRSG TARPELQGIG RSRFIVGMVL AVVLPPAVEV LVTLAGYRNF 
AIIMLLHLAV AVAVAAIGGF WPAVVAAVLG TTLLNYFSAD PVGTLSIADP STLFTLLVFL 
AVACSVALAV GLATRRAQEA ARSGAEATAL SELSLRILSS DGSLETFLEK VRSRLGVEAV 
TLVAGSSPGS PHAAGSAAGS GPGRAPGSNP GWVALASAGT SAPVTHSAAD HAVVVDSRYT 
LLINGGPPAG QPFSGQHQRM LAAFGAFLVA ILERRQLAAS MEDNQRLSEG NKMRTSILRA 
VSHDLRTPLA GIKLAVSSLR QEDVRFSPED ERELLATIED SADRLDHLIG NLLDMSRITA 
DSVNPLLRGL GWADVLPDAL KGLPAARIRV ELPPNLPRVE ADAGMLERVV ANLVENALKY 
AREADVVLTA RAGEGIALAG RPASEFRVVD HGSGVAPAAV LDMFQPFQRL NDSQRTGGGR 
TVGIGLGLAV ANGFTEAMGG TLAAEPTPGG GLTMVVTLPL WEGPLP