Gene Franean1_3391 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3391
Symbol
ID	5671762
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4016718
End bp	4018055
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	71%
IMG OID	641242279
Product	integral membrane sensor signal transduction histidine kinase
Protein accession	YP_001507699
Protein GI	158315191
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0809012
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATCA CCAGCCGGTG GCGGCGCCTC CGGGACCATC ACCGCACAAG CACCGTGGTG 
ATCGCGGTTC TGGCCTTCGC GGCCGCCGGT CCCGCCAGCA GGCTCAACCC GCAGCATGTC 
GCGCACGACA GTTCGCCGTG GCCGGCGGTG CTGCTCGCCG CCGTCGCCTG CACCGCACTG 
CTCTGGCACG AACGCCATCC CCGCGCGACC GCCGTGGTGG CCATCACCTG CACCGTGTTC 
CTGGCCGGCC TGGGCTACCT CCTCACCTCC CTGATGATCG CCCCAGCGAT GGCCGCGCTC 
TACTGGCTGG CCGCGCACAC CGACCGCAGA ACCACCCTGA GCATCGCCAT CCCCGGCTGC 
GCGGCGGTGG TCGCGACGGC GCTGGTCGCC GACCCCGACG GCTACCCCCT GGAACTCAAG 
ACCATCGGCC CGACCGCCTG GCTACTGATG GCCGCGTCAC TCGGCGGCGC GAGACGGATC 
AAACAGGACT ACCTCGACGC CGTCAAAGCC CGCGCCGAAT ACGCAGAACG CACCCGCGAG 
GCCGAAGCCC GCCGCCGGGT CGCCGACGAA CGCACCCGCA TCGCCCGCGA ACTCCACGAC 
GTCGTCGCCC ACCACATCAC CCTCGCCCAC GCCCAGGCCG GCACCGCCGC ACACCTCGTC 
CGCACCCACC CCGACCAGAC GGAACCGATC CTCACCAACC TCACCGCCAC CACCTCCTCC 
GCCCTGCGCG ACCTCAAGGC CACCGTCGGC CTCCTGCGGC AGAGCGACGA CCTGGACGCG 
CCGCTGGAGC CGGCCCCCTC GCTCGCCCAG CTCCCCCAGC TCGCCGACAC GTTCGCCGCG 
ACCGGGCTCA CGGTCACGAT CACCACCCGT GGCGAACCGT CCCCGCTCTC CCCCGGCATC 
GACCTCACGG CCTATCGGAT CGCGCAGGAG GCCCTCACCA ACGTGGCGAA GCACGCCAGG 
ACCGACAACG CCTGTGTCGA CATCACCTAC GCCCCGCACA GCGTCACCCT GATGATCATA 
AATGGCGGCG GGGAGAACGC GGGCCCGGTC AGCCGCGGCG CGCGTCCCGG CGCCGGGACG 
TCGATCCCGG CCTCGGGCAG CGGGTTCGGC CTGATCGGCA TGCGGGAACG CGCACTGTCC 
GTCGGCGGAC ATCTCGAGGC CGGTCATCAT CCCGAGGTCG GCTTCCACGT CACCGCCATC 
CTGCCCCTGC ACCCCAGAAC TCCCACGAAA ACGGAAGCCG ATGACTATCC GAGTGCTCCT 
CGCCGACGAC CAGACCCTCC TACGGGCAAC CTTCCGGATT CTGATCGACT CCTGCAGCGA 
CATGGAGGTC GTCGGTGA

Protein sequence

MTITSRWRRL RDHHRTSTVV IAVLAFAAAG PASRLNPQHV AHDSSPWPAV LLAAVACTAL 
LWHERHPRAT AVVAITCTVF LAGLGYLLTS LMIAPAMAAL YWLAAHTDRR TTLSIAIPGC 
AAVVATALVA DPDGYPLELK TIGPTAWLLM AASLGGARRI KQDYLDAVKA RAEYAERTRE 
AEARRRVADE RTRIARELHD VVAHHITLAH AQAGTAAHLV RTHPDQTEPI LTNLTATTSS 
ALRDLKATVG LLRQSDDLDA PLEPAPSLAQ LPQLADTFAA TGLTVTITTR GEPSPLSPGI 
DLTAYRIAQE ALTNVAKHAR TDNACVDITY APHSVTLMII NGGGENAGPV SRGARPGAGT 
SIPASGSGFG LIGMRERALS VGGHLEAGHH PEVGFHVTAI LPLHPRTPTK TEADDYPSAP 
RRRPDPPTGN LPDSDRLLQR HGGRR