Gene Franean1_6903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6903
Symbol
ID	5675216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	8409102
End bp	8411444
Gene Length	2343 bp
Protein Length	780 aa
Translation table	11
GC content	77%
IMG OID	641245752
Product	putative signal transduction histidine kinase
Protein accession	YP_001511143
Protein GI	158318635
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCGCT GGACCGGGAG CGAGGGGGGA CGCGACCGGA GCGGCGCGGC GGGCGGGGGC 
GTCGGCCCGA ACGAGGCCGG GCTCGGCGTC AGAATGTCGC GGACCCTCGG GCTCCTGCGT 
CTGGTCGCGG TCCTGTTCGG CATCGCGGTG CTCCTCGCCG ACGCGGGATG GTACGGATCT 
CCGGCCCGGC TCGCCCTGCC GGCCGTCGCC GCCTGCTGGG GCGTGCTCTT CGGCGTGGTC 
TGCCTGACGC GTGGCCTGGG TCGGGACCTC GCCGCCGGCG AGCTCCTGAT GGGCCTGGTC 
GTGGCGGGCT GCGCGCCCTG GGCCGTGCCG CCGGGCGAGC TCGCCACCGG CCCCAACTGG 
GTGCTGCTGC GGCTCATCGG GACGGGCCTG ACCATCGTGT GGTGCTTCCC GCCGGCGGTC 
TGGCTGCCGG CCGTGCTGGC GTTCGTCACC CTGTACACGA CCGTCGTCCA CGAGATCGCC 
GCGCCGTCCG TTTTGGAGGC GGCGCTGCCG GCCGGCGCGG TCATCGCCGT CCCCCTCGCG 
TTCGCCGCGG TCGTCGGGCG GATGCGCCGC GGGGCCCGGC GCTGCGACGA GTGGCTCGCG 
CTGGCCCACA CGCGGCGCCG CGGGCGCGGC ATCGTGGCGG CACGGCGGCA GGACGTGGCC 
GAGTCGGACC GGCTCGTGCA CGACACCGTC CTGAACACGC TCACCGGTAT CGCCTGGGGG 
GCACGTGACG CGGGCGGGAA GAGTGTCCGC GCCCGGTGCC GGCAGAGCGT GGCGATCTGT 
GAGGACCTCC TCGCCGGCGG GCGGGACTGG GAGGACGGCC TGATGGTCGC CCTCGGCCGG 
GCTCTGGACC AGGCTCGTGC CACCGGGCTG GGCGTGGAGT TCTCCTTCAC CGGCTCCACG 
GACACGCCGG CCGAGGTCGC CGCCGCCGTG GCCATGGCCG TCAGCGAGGC GCTGTCGAAC 
GTGCGCCGCC ATTCCGGCCT GCCCCGGGCA CGGGTTGACA CGCGCACCGA CCCCACCGGA 
GTCCTGGTCA CCGTGACCGA CCACGGCGTG GGCTTCACCC CCGGCCGGTA CCGCGCCGAC 
CAGCTGGGCG TGCGCCGGTC GATCATCGAC CCGATGGGCG ACGTCGGCGG GTCCGCGACC 
GTGCGGTCGA CGCCGGGGGG CCCGACAATC GTGACCTTGC AGTGGTCCCG TCACTCGCCC 
GACGCGCCGG CGGTCGAGGT CGCCGAGCTC GAGGAGCGGC TGGCCCGCGA CACGGCCCGG 
GCCGCCGGGC GGGGCGCCGT CGTCTGGCAG CTCGCGCTCG GGATCGTGCT CGTGATGCGG 
CTCTCCTACT ACCAGCACCC GGCCCTCGTC GCCCTGGCCT GGGCCGCGTC CGGGGCGGCG 
CTGGTATGGG CGGGCCGGGC CAGCCGCCGC GGCCCGCTGC GCGGACCGGC GGTGGCCGGG 
CTGACCGGGC TGTTCCTCGT CACCCAGATC GCCGCCGGGG CCCTCGGCCA GGAGGGCTCG 
CGGGTACCGC TCAACTGGGT GCTGGTCAGC GGGCTGGGGG TGTGCGCCTT CCTGACCGCG 
GCCTGCCCCG TCCGGCAGTG GCTGCCCGCC TCGGCGGCGA TCGCCGCGTG CGCGGGCGGC 
ATCGTCGCCA CCGGGTACAG CGGCGGGCCC GGGATCGTCG GTTACCTCAG CGTGGTGTTC 
TACACGCAGG CAGCCGTCCA GTCGGTTGTC GGCGCGCTCG ACCCCATGCG GCGCGGGACG 
GCGGCGGCCG CCGCCGAGAT CGCCCGCGCC GACGCCGAGC TCGCCGCCGA CCTGGTCGCC 
TCCACCAAGA TCACTCAGGA TCGCCGGGCC CGGCTCGGCC GGCTCCGTGC CGACACGCTG 
CCGCTGCTGG CCGCCATCGG CGACGGCCGG CTCGACCCCG CGGCCGACGA GGTGCGCGCG 
CGCTGCGCGT CCAGCGCGGC GGAGCTGCGC CGCGCGATGA CCAGCCCCGT CGCCGGCTCG 
GACCTGCTCG AGGGCCTGGA GCCGGCGCTG CGCGCCGCCG AGCGACGTGG GGTGGCGGTA 
CGGATGCAGG TCGCCGGCAC CTTCGACGCC GTTCCCGGGA CGGCCCGCGA CGAGGTGGTC 
GCCGCGCTCT CGGTGGTGCT GGCCACGGTC ACCCCCGCTG CCACCGCGGT CACGGTCACC 
CTGACCGGCA CGGACGACAC CGGCGAGGCG TTCGTCACCG CCGACGACCC GGCGGTGGCC 
GAGGCCGGCC CGCCCGTCAC CCCGGCGCCG TCCGCCTGGA CGCAGGTCAT CGACGACAGC 
GGCGACGGCC AGCTCTGCGT CGAGATCCGC TGGTGCCCGC CGCAGCGGGT CGGCGGCGCC 
TGA

Protein sequence

MTRWTGSEGG RDRSGAAGGG VGPNEAGLGV RMSRTLGLLR LVAVLFGIAV LLADAGWYGS 
PARLALPAVA ACWGVLFGVV CLTRGLGRDL AAGELLMGLV VAGCAPWAVP PGELATGPNW 
VLLRLIGTGL TIVWCFPPAV WLPAVLAFVT LYTTVVHEIA APSVLEAALP AGAVIAVPLA 
FAAVVGRMRR GARRCDEWLA LAHTRRRGRG IVAARRQDVA ESDRLVHDTV LNTLTGIAWG 
ARDAGGKSVR ARCRQSVAIC EDLLAGGRDW EDGLMVALGR ALDQARATGL GVEFSFTGST 
DTPAEVAAAV AMAVSEALSN VRRHSGLPRA RVDTRTDPTG VLVTVTDHGV GFTPGRYRAD 
QLGVRRSIID PMGDVGGSAT VRSTPGGPTI VTLQWSRHSP DAPAVEVAEL EERLARDTAR 
AAGRGAVVWQ LALGIVLVMR LSYYQHPALV ALAWAASGAA LVWAGRASRR GPLRGPAVAG 
LTGLFLVTQI AAGALGQEGS RVPLNWVLVS GLGVCAFLTA ACPVRQWLPA SAAIAACAGG 
IVATGYSGGP GIVGYLSVVF YTQAAVQSVV GALDPMRRGT AAAAAEIARA DAELAADLVA 
STKITQDRRA RLGRLRADTL PLLAAIGDGR LDPAADEVRA RCASSAAELR RAMTSPVAGS 
DLLEGLEPAL RAAERRGVAV RMQVAGTFDA VPGTARDEVV AALSVVLATV TPAATAVTVT 
LTGTDDTGEA FVTADDPAVA EAGPPVTPAP SAWTQVIDDS GDGQLCVEIR WCPPQRVGGA