Gene Francci3_0235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0235
Symbol
ID	3906539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	274454
End bp	275956
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	74%
IMG OID	637877564
Product	periplasmic sensor signal transduction histidine kinase
Protein accession	YP_479353
Protein GI	86738953
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGCCGGC CGGTCCTGTC CCTGCGGGCC CGGCTGCTGC TGGCCCTGGT GGGCCTGCTG 
GCCGTCGGGA TGGCTCTCGG CGCCGTCGGC ACGCGAGGGG CTCTGGGGGC CTACCTGCGT 
GGCCGGCTGG ACCAGCAGGT CCGGGACGCC CATCCGCTGA TGGAGCAGTT GCTCCTGCGG 
GCCGGCGGGG ACGGGGACGG GGATGACCAC TACCCAGGTT TCGGCACCAC GTTCCTGGTG 
GGCACCTACG GCGCGTTGTA CGACGGCGCC GGCCGCCGGC TCGCCGAGGC CAGCCCCGGC 
CCGGGTGGCC CGGGTGGTCC GGGTGGCCCG GCGGCGCCGA CGCAGCGTCC GGCGGTGTCG 
GCACGCCTGC TCGCCACCGC CCGGCTGCAT CCGGACCTCG CGACCGTCCC GCTGTGCACG 
GTGGGCGCCG AGGACCATGG CGGCCGGTTC AGGATGCTCG CGGAGCGCTT CGACAACGGG 
TATGTGCTGA TCGTCGCCGT GCCCTTCGCG GAGGTGAACG CCACCCTTGA CCGGGTCACC 
AGGATCGAGG TCGTGGCGAC CTCGGTGGTC ACGGCCGCGC TGGCCGTGCT GGCATACGTC 
ATCATCCGGC TTGGGCTGCG TCCCCTGACC CGGATCGAGC AGACCGCGGA CCTGATCGCC 
CACGGCGACC TGACCAGGCG GGTCGCCGAC GCGGACCGCC GGACCGAGGT GGGTCGGCTC 
GGGCTCGCCT TCAACGCGAT GCTCACCCGG ATCGAGGCGG CGTTCCGGGC GCGTGAGGTC 
TCCGAAGGGC GTCTGCGCCG CTTCGTCGGG GACGCGAGCC ACGAGCTGCG GACCCCGTTG 
ACATCGATCC GCGGGTACGC CGAGATGTTC CACCGCGGCG CCGCGGAGCG GCCCGAGGAC 
CTGGCGATGG TCATGCGCCG CATCGAGGAG GAGTCCGCGC GCATGAGCGA GCTGGTGGAT 
GACCTGCTGC TGCTCGCCCG GCTGGACCAG CGACCGGTGC TGGAGCGCCA GCCGGTCGAC 
GTCGCGGCGA TGGTCCGTGA CATCGTCACC GACGCCCGTG TGGTGAGCCC GGGACGGACG 
ATCGAGGTCG ACGTGCCGCC GATCCTCGAG GTGCTCGGCG ATGAGGGCCG GCTGCGGCAG 
GCCGTCGGCA ACCTCGTCCG CAACGCCGTC GTCCACACCC CGCCCGACGC CGGGATCTCC 
GTCTCCGTGG GCCCCCTCGA AGCCGGCTCC CCGGGGCCGA CGGGCGATGG TCCCACCGAC 
GGGATCGTGG TCTCGGTGGT CGACCACGGC CCGGGCGTCC CCGAGGATGC CGTGGCCCAC 
CTCTTCGAAC GCTTCTTCCG GGCCGATGCC GGGCGGTCCC GGGACGCCGG CGGGACCGGT 
CTGGGCCTGT CCATCGTCGA CGCCGTCGCC ACCGCGCACG GCGGGCGGGT CGAGTACCGG 
CCGACCCCGG GCGGCGGGGC GACGTTCCGT CTCGTCCTGC CCGGTCCGTC GCAGCCCGAC 
TGA

Protein sequence

MSRPVLSLRA RLLLALVGLL AVGMALGAVG TRGALGAYLR GRLDQQVRDA HPLMEQLLLR 
AGGDGDGDDH YPGFGTTFLV GTYGALYDGA GRRLAEASPG PGGPGGPGGP AAPTQRPAVS 
ARLLATARLH PDLATVPLCT VGAEDHGGRF RMLAERFDNG YVLIVAVPFA EVNATLDRVT 
RIEVVATSVV TAALAVLAYV IIRLGLRPLT RIEQTADLIA HGDLTRRVAD ADRRTEVGRL 
GLAFNAMLTR IEAAFRAREV SEGRLRRFVG DASHELRTPL TSIRGYAEMF HRGAAERPED 
LAMVMRRIEE ESARMSELVD DLLLLARLDQ RPVLERQPVD VAAMVRDIVT DARVVSPGRT 
IEVDVPPILE VLGDEGRLRQ AVGNLVRNAV VHTPPDAGIS VSVGPLEAGS PGPTGDGPTD 
GIVVSVVDHG PGVPEDAVAH LFERFFRADA GRSRDAGGTG LGLSIVDAVA TAHGGRVEYR 
PTPGGGATFR LVLPGPSQPD