Gene Franean1_3858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3858
Symbol
ID	5672221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4586246
End bp	4587676
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	77%
IMG OID	641242736
Product	integral membrane sensor signal transduction histidine kinase
Protein accession	YP_001508156
Protein GI	158315648
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID	[TIGR01386] heavy metal sensor kinase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.296973
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGCTGC GGGTACGACT GACCCTGCTG TTCGTCCTGG GCACCACGCT GGTGCTCGCG 
GCCGCCGGCG TGCTGTTCTA CGCGCTGCTG CGCACCAACC TGCGGAACTC CGTCGACGCG 
AACCTGCGCA CCCGGATGGC CGTGCTCGCC GCGCAGGTCC CCGCCGCGGC GGACCCGGCC 
GCGCAGCTGC GGGCCTACGG CGCCGGGCCC GCCCAGCTGC TGCGCCCCGA CGGCTCCGTC 
GCCGCCTCGA ACGACAGCGC CGGTCCCGAG CCGCTGCTCG AGCCCGCCCA GGTGGCCACG 
GCGCTCGCCC GCTCGGAGTC GCTCACGTCC GGCGAGCTGC GGGAGCCGGG CGGCGACGAT 
GACGACGCGC GCGCGCTGGC CGTCCCGGTG CGGACCGGGG CGCGGGACGG GGTTTTGGTC 
GTCGCGACGA GCACCGATCT GACCGACTCG GCCGAGGACC GCGTCCGCAA CATCATGGTC 
AGCGCGACGG CGCCGATGGT CGCGCTCTCC GGGCTCGCGG CCTGGCTGCT GTCGGGCGCC 
GCCCTGCGCC CGGTCGATCG CATGCGCCGG CAGACCGCCG CCATCAGCGA GTCGGACAGC 
TCCGCCGAGC TGGACGTGCC CCCGACCCGC GACGAGATCG CCGCCCTGGC CGCCACGATG 
AACAACCTGC TGCGCCGGCT GCACGCCGCC CGCGCCCGCG ACCGGGCGTT CGTCGCAGAC 
GCCGGGCACG AGCTGCGGAC CCCGCTCACC AACCTCAAGG CCGAGCTCGA GCTCGCCGGC 
CGCCCGGCCC GCACCCGCGA CGAGCTCGTC GACGCGGTCG CGGGCGCGGC GGAGGAGACC 
GAGCGGCTGA TCCGGCTCTC CGAGTCACTG CTCACGCTCG CCCGGATGGA CAGCGGCATC 
ACCGCCCCGC GGCGGCTGGA CGCCGGCGAC CTCCTCGAGC GGGCCGCCCG CGCCGCGACC 
GGCCACGCCG AGACCAGGCA GGTCCGCCTC CACCTGGACG CCGACCCGGG CCTCGCCGTG 
GACGCGGACC CCGACATGCT CCGCCAGGCG GTCGACAACC TGGTGGCCAA CGCCATCCGT 
CACGCGCCGC CCGGCACCGC CGTGGACGTC CGGGCCGGGC CGGGTGAGGC CGGGAGGACC 
GTCGTCGTGC GGGTGCGTGA CCGCGGCCCG GGGTTCCCCC CGGACTTCCT GCCGCGTGCC 
TTCGAACGTT TCAGCCGCGC CGACGCCGCG CGCACCCGCG ACCACGGCGG CACCGGCACC 
AGCGGAAACA GCAGCGGGAC GGGCCTTGGT GGCACCGGGC TCGGGCTCGC CATCGCCGCG 
GCGGTGGCGC GGGCCCACCA GGGGACCGCC ACCGCCGCCA ACCATCCCGA CGGCGGCGCC 
GTCGTCACGC TCACGCTGCC CGCCGCGGGC GGTCTCCCGC CGGACCGGTA G

Protein sequence

MPLRVRLTLL FVLGTTLVLA AAGVLFYALL RTNLRNSVDA NLRTRMAVLA AQVPAAADPA 
AQLRAYGAGP AQLLRPDGSV AASNDSAGPE PLLEPAQVAT ALARSESLTS GELREPGGDD 
DDARALAVPV RTGARDGVLV VATSTDLTDS AEDRVRNIMV SATAPMVALS GLAAWLLSGA 
ALRPVDRMRR QTAAISESDS SAELDVPPTR DEIAALAATM NNLLRRLHAA RARDRAFVAD 
AGHELRTPLT NLKAELELAG RPARTRDELV DAVAGAAEET ERLIRLSESL LTLARMDSGI 
TAPRRLDAGD LLERAARAAT GHAETRQVRL HLDADPGLAV DADPDMLRQA VDNLVANAIR 
HAPPGTAVDV RAGPGEAGRT VVVRVRDRGP GFPPDFLPRA FERFSRADAA RTRDHGGTGT 
SGNSSGTGLG GTGLGLAIAA AVARAHQGTA TAANHPDGGA VVTLTLPAAG GLPPDR