Gene Franean1_3845 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3845
Symbol
ID	5672208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4568087
End bp	4569265
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	76%
IMG OID	641242723
Product	integral membrane sensor signal transduction histidine kinase
Protein accession	YP_001508143
Protein GI	158315635
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.5258
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.79155
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCCC GGCATGATGC CCGGGTTGGT TACCGTGGCG GGGTGCGCGA TCTCGTCCGT 
CCGCTGTGGG AGGAGCCGCG TCCGGCGCGC CCGTCGACAC CGGGCCGGCG GGACTGGCCG 
CTGGCCGCCG CGCTCGCGGT CGCCGCGCTC ACCGAGGGGT TGCTGCGGGC GGACCTTCCG 
TGGCGGACCT GGTCGGTGCT GCTGGCACTC GCCCTCGTCC CGACCCTGCT GTGGCGCCGG 
GCGAGGCCGC TGGCAGCGGT CACGATCGCC TTCGGTGCCT CGGCTGTGGC CTCGGTGCTC 
ACCGGCGGCG GCGTCCCCCA GCTGAACAGC ATGATCTTCA TGCTGCTGTT GCCGTACTCG 
CTGCTGCGGT GGGGATCGGG CCGGGAGGCC GTGACCGGCG CGGCGGTCGT GCTCGCCGCC 
GCCGTCTGCA TGATCTCCGC CGCCACCGGT GCCGCCGACG CCGTCGGCGG CGCGGCCGTA 
CTGCTCGCCT CGTTCGCGCT GGGCGGGGCG TTCCGGTACC GGGCCGGGGC CCGGCTGCGC 
GAGCTGGAGC AGGCCAAGCT GCTCGAACGG GAGCGGCTGG CCCGGGATCT CCACGACACC 
GTCGCCCACC ACGTCTCGGC GATCGCGATC CGGGCCCAGG CGGGCATCGC CACCGCGCCG 
TCGAGCCCGG CCGCCGCCGC CGAGGCACTG CGGGTGATCG AGCTCGAGGC GTCGCGCACC 
CTGGCCGAGA TGCGGGCCAT GGTCCGGGTA CTGCGCCGTG ACGAGCCGGC GGAGCTGGCG 
CCGAACCCGA CCGTCGCCGA TCTCGAACGG CTCGCCGGGC AGGCCCGCTC CGGCCCGGCG 
GTGCGGGTGC GGATCGTCGG CGAGGTGGGG GATCTCCCGC CGTCGGTCGG GTCCGCGATC 
TACCGGCTCG CGCAGGAGTC GATCACCAAC GCCCGCCGGC ACGCGCGGCA CGCGAACCAC 
GTCGAGGTCG TGGTGTCCGC CGATGACGCG TGCGTGCGGC TGTCCGTGCG CGACGACGGC 
GACACCGCCG CCCTGCACCC GCCGCCGTCG CCGGGCTACG GGCTCACCGG GATGATCGAG 
CGTGCGCGCC TGCTCGGCGG CACCTGCGAG GCCGGCCCCG CCCTCGACCG GGGCTGGACG 
GTGACCGCCA CCCTGCCCCG GGCCGGGTGG GCGACGTGA

Protein sequence

MTARHDARVG YRGGVRDLVR PLWEEPRPAR PSTPGRRDWP LAAALAVAAL TEGLLRADLP 
WRTWSVLLAL ALVPTLLWRR ARPLAAVTIA FGASAVASVL TGGGVPQLNS MIFMLLLPYS 
LLRWGSGREA VTGAAVVLAA AVCMISAATG AADAVGGAAV LLASFALGGA FRYRAGARLR 
ELEQAKLLER ERLARDLHDT VAHHVSAIAI RAQAGIATAP SSPAAAAEAL RVIELEASRT 
LAEMRAMVRV LRRDEPAELA PNPTVADLER LAGQARSGPA VRVRIVGEVG DLPPSVGSAI 
YRLAQESITN ARRHARHANH VEVVVSADDA CVRLSVRDDG DTAALHPPPS PGYGLTGMIE 
RARLLGGTCE AGPALDRGWT VTATLPRAGW AT