Gene Francci3_1156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1156
Symbol
ID	3903584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1376036
End bp	1377616
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	72%
IMG OID	637878488
Product	periplasmic sensor signal transduction histidine kinase
Protein accession	YP_480264
Protein GI	86739864
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.331298
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGGCAGC CGGTAGCGGG GCATGCGGCG GTGAACGGGC GCGCCGGCCG GTTGGACGGG 
TTCGCGCGGC GGGTCCACCC GGGACGTCAC CCCAGGATCC GGTTTTCCTC CCCGCTCGGT 
CAGCTGACGT TGCGGGCCCG GCTCGCCCTG CTCGTCGGGA TGGCGGTGGC TGCCGCCGTG 
ACGGTCGTCG CCGGGGTGTC GCTGGGGGCG ACCAGCATCG TGCTGAACCA GGCCATCGAC 
GACCAGCTCG TAGAGCAGGC TGAGGCGTCG GCGCGCACCA TCCAGACCAG CCCGCTGGGG 
CTGGAACTGC AGGCGTTCAG CTTCGGGCTG GAGGGCCAGT TCCTCGACGC CGCCGGCAAT 
CCGCTGGAGA ACGCCGTCTC GTCCTGGAAC AGCGTGCGGA TCCCGGTCGA CTCCGCCGAC 
GCCGAGGTGG CCCGGCGGGA GCGGGCCCAG AACCTGCGCA CGATCGCCGT TGACGGGCAG 
TCCTACCGGC TTGTCACGGT TCCGCTGCAA CGTCCCGCGT CCGGCGGTGC ATTGCAGCTC 
GCCCGGCCGA CCACCGACGT CGACCGGACC CTGCGCGACC TCGCGCTGGT GCTGCTTGTC 
GTCGGGATCG TCGGGGTGGT CGGCTCGGTG CTCGCCGGAC AGATCGTGGC ACGTGCCGCG 
CTCAAACCCG TTGACGCCGC GGCCGCGGCC GCCGAGGAGG TCGCTCGTAC CCAGAATTTG 
TCGGCGCTCA TCCCGGTGAC CGGATCCGAC GAGATCACCC GGCTGGCGGA GAGCCTCAAC 
AGCATGCTGC GCGCGCTGGA GGCATCTCGG GCCCGCCAGC GCCAGCTCGT CGACGATGCC 
AGCCACGAGC TGCGCACCCC GTTGACGAGC CTGCGTACGA ACATCGAACT GTTGCTGCGC 
GCCGAGGCGA ACCCGCATCG CGCGCTGCCC GCGGCCGACC ATGAGGCACT GCTACGCGAC 
GTGGACGCGC AGATGCGCGA ACTGTCCGGC CTCGTCAGCG AACTGGTTGA GCTCGCCCGG 
GACGAGGCGC CCACCGAGGA GGTGGAACGG CTCGATCTCG CGGAGATCGT GCGAGCCGCG 
GCCGAACGGG CCCGGCGCCG CGCCACCGGC AAGAGCATCA GCATCGAGCT CGACGCGACT 
CCCTCGACGG TCGACGGGCG GGCGAACATG CTCGAACGGG CGATCACCAA CCTGCTCGAC 
AACGCCGTGA AGTTCTCGCC GCCCGCCTCC GTCGTCCGGG TCGGCTCCCG GGACGGCGAG 
GTAACCGTCG CGGATGACGG ACCGGGCATC GCGCCGGAGG ACCGCGTGCA GGTGTTCGAC 
CGCTTCTACC GGGCCACCTC CGCGCGGGGC CTGCCCGGAT CCGGGCTCGG CCTCGCGATC 
GTCGCGGATG CCGTGCACAC CCACCGGGGT ACCGTCACCG CGGAGAGTTC CCCGAGTGGC 
GGGGCGTTGC TGCGGATGCG GCTGCCGGTC GTTGACGACC CCGGTCCGCT GGGCCCGGCC 
ACCACACCGG GTCCGGCGCC GAACCCGCCG GACGGCGCTG CTTCGCCTCC GGACCGCGCG 
GGCGAGAATC CCAGGCCGTG A

Protein sequence

MGQPVAGHAA VNGRAGRLDG FARRVHPGRH PRIRFSSPLG QLTLRARLAL LVGMAVAAAV 
TVVAGVSLGA TSIVLNQAID DQLVEQAEAS ARTIQTSPLG LELQAFSFGL EGQFLDAAGN 
PLENAVSSWN SVRIPVDSAD AEVARRERAQ NLRTIAVDGQ SYRLVTVPLQ RPASGGALQL 
ARPTTDVDRT LRDLALVLLV VGIVGVVGSV LAGQIVARAA LKPVDAAAAA AEEVARTQNL 
SALIPVTGSD EITRLAESLN SMLRALEASR ARQRQLVDDA SHELRTPLTS LRTNIELLLR 
AEANPHRALP AADHEALLRD VDAQMRELSG LVSELVELAR DEAPTEEVER LDLAEIVRAA 
AERARRRATG KSISIELDAT PSTVDGRANM LERAITNLLD NAVKFSPPAS VVRVGSRDGE 
VTVADDGPGI APEDRVQVFD RFYRATSARG LPGSGLGLAI VADAVHTHRG TVTAESSPSG 
GALLRMRLPV VDDPGPLGPA TTPGPAPNPP DGAASPPDRA GENPRP