Gene Arth_2135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2135
Symbol
ID	4445212
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2405863
End bp	2407560
Gene Length	1698 bp
Protein Length	565 aa
Translation table	11
GC content	65%
IMG OID	639689943
Product	putative signal transduction histidine kinase
Protein accession	YP_831615
Protein GI	116670682
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0347228
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATGCCG ATGGCGACAG TCCCGAACGG TACACGGCTG CGAGCGGTAC AAGGATTGAA 
GACCTGCTCA AGGATTTCGT CGCCCGGGCC GGCGAACTCC TTCAGTTCCA AGAGCGCATG 
GGCGGCCTGC TTGAAGCCGT CGTGGCGGTT GCGGAGGATT TGAGCCTCGA CGCCGTCCTG 
GAGCGCGTCG TTCAGTCCGC CTGCCAGTTG CTGCGCGCCC GCTACGGCGC GTTGGGCGTC 
ATCGGCGATG ACCGCGCCCT CAGCCACTTC ATCACGGTCG GGATCGACGG CGAACTGGCC 
AAACGGATCG GCCCCCTCCC TACCGGTCAT GGGGTCTTGG GATTGTTGAT CTCCGATCCG 
CGGCCGCTGC GGCTCCCCGA CCTGCGGAGC CATCCCGAGG CGTACGGCTT TCCCGAGCAT 
CACCCGCCCA TGCAGTCCTT CCTTGGCGTT CCCGTCCGGG TACGGGACGT TGTGTTCGGA 
AACCTGTATC TGACGGAGAA GGAGGGCGGC GGCGATTTTA CGGTCGAGGA CGAGGAGCTG 
GCCGTAGCCC TGGCTGCCGC TGCCGGTGTC GCCATCGAGA ATGCACGGCT TTATGATGAC 
GCCCGCCGGC GCGCACAATG GCTTGAGGCC TGCATGGATG TCTCCGGGCT GATGCTGGGG 
ACCGAACCGT CGTCGTCTGC CGGCCTTGAT CCCATTGCCG GCAGGGCGCT GCGGGAATCC 
GGGTCCCGGC TGGCCCTGAT AGTGGAACCC GCCGCGGACG GCGTGGGATA TGTCGTGGCC 
GGGGCCGACG GTGACGACGC GGAGTTGTTC GCCGGCCTGA CGCTGTACCT GGATTCGGAA 
GTTCTCCAGG GGGTGCTTGC CGGCGGGGAC CCGCTACTCG TGGACAAGGC CGCCGACGTG 
CTGGGGGTGC TGGAGGGGAC CGTGGCCGGT TCGCTCCTCG CAGTGGCGCT CAGCACCCAG 
GGCGCACATC ATGGCCTGCT CCTCCTGGTC CGGGACGCCA GCGAGGGTCC CTACGGCCGG 
ATTGATATGG AGATGGGAGC CGTTTTCGGG TCCCACGTGG CGTTGGCGCT TGAACTGGCC 
CGGGTCCACC GGCTGCGGGA AGAGCTGCTG GTCTTCACTG ACCGCGACCG GATTGCCCGT 
GACCTCCATG ACCTCGTGAT CCAGCGGCTC TTCGCAGCAG GCCTGAGCGT CCAGAGCCTG 
AACCGGTTCA CGAAGGAAGA CCTTGCACTG GAGAGGATTC GTGCCATCAC CGGTGAACTG 
GATGAGGCCA TCCGCAGCCT GCGGGACACC ATCTACTCGC TCAAGACCGG CAACAGCGAT 
GCCGAGCCCC TCAGCGGGAG GCTGCGGAGT GTCGCGCGGA GCGCTGCAAA GTCCATGCCC 
TTTGCGCCGG CGCTTAGCCT GGAAGGCCCG GTTGACTCAG TCCAACCGGA CAAGGCAGAC 
CATGTGGTGG CCGTTGTTTC AGAGGGACTG AGCAACGCCA TCCGGCATTC GGGAGCTGAT 
TCGATCGAGG TTGCCGTCTC CGCCATGAAT GGCAGGATGA CCGTCCTGGT GACCGACAAC 
GGCAGCGGGT TCAAAGATTC GGCAAAGCGC AACGGACTGA ACAACATGGA AGAGCGCGCG 
AGGATGCTGA ACGGCACCTG CACCATCACC GGCGCCCCGG ACACCGGAAC CAGTCTGGTG 
TGGTCGGTTC CGCTCTAG

Protein sequence

MHADGDSPER YTAASGTRIE DLLKDFVARA GELLQFQERM GGLLEAVVAV AEDLSLDAVL 
ERVVQSACQL LRARYGALGV IGDDRALSHF ITVGIDGELA KRIGPLPTGH GVLGLLISDP 
RPLRLPDLRS HPEAYGFPEH HPPMQSFLGV PVRVRDVVFG NLYLTEKEGG GDFTVEDEEL 
AVALAAAAGV AIENARLYDD ARRRAQWLEA CMDVSGLMLG TEPSSSAGLD PIAGRALRES 
GSRLALIVEP AADGVGYVVA GADGDDAELF AGLTLYLDSE VLQGVLAGGD PLLVDKAADV 
LGVLEGTVAG SLLAVALSTQ GAHHGLLLLV RDASEGPYGR IDMEMGAVFG SHVALALELA 
RVHRLREELL VFTDRDRIAR DLHDLVIQRL FAAGLSVQSL NRFTKEDLAL ERIRAITGEL 
DEAIRSLRDT IYSLKTGNSD AEPLSGRLRS VARSAAKSMP FAPALSLEGP VDSVQPDKAD 
HVVAVVSEGL SNAIRHSGAD SIEVAVSAMN GRMTVLVTDN GSGFKDSAKR NGLNNMEERA 
RMLNGTCTIT GAPDTGTSLV WSVPL