Gene Franean1_2112 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2112
Symbol
ID	5670512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2538688
End bp	2539752
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	69%
IMG OID	641241033
Product	PhoH family protein
Protein accession	YP_001506454
Protein GI	158313946
COG category	[T] Signal transduction mechanisms
COG ID	[COG1702] Phosphate starvation-inducible protein PhoH, predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTCCGGC CCAGGCGGCC GTACTACATG CCCGAATCCG ACACCCCACC CGGCTCCCGG 
GTCACCACAC GCATCGTCGT CCCCGACGGG CACAGCATGG TGAGCCTGCT CGGGCACCAG 
GACCAGCTTC TGCGTGTGAT CGAGAAGGCC TTCTCCTCTG ACATCCACGT CCGCGGCAAC 
GAGATCACGA TCACGGGTGA CCCGGCGGAG AACGAGCTGG CCGCCAGGTT GTTCTCCGAG 
CTCGTCGCGC TGCTTGACGC AGGCACCGAG ATCAGCCCGC AGCACGTCGA CCACTCGGTG 
GCGATGCTGC GCAGCGGCGC GGGGGAGCGG CCTGCCGAGG TGCTCACCCT CAACATCCTG 
TCCAACCGTG GTCGGACGAT CCGTCCCAAG ACGCTGAACC AGAAGCGGTA CGTGGACGCG 
ATCGACCAGC ACACGATCGT GTTCGGGATC GGCCCGGCGG GCACCGGCAA GACCTACCTG 
GCGATGGCCA AGGCCGTGCA GGCGCTGCAG GCGAAGAAGG CCAACCGGAT CATCCTCACC 
CGGCCGGCGG TCGAGGCGGG TGAGCGGCTC GGCTTCCTGC CCGGGACGCT CTACGAGAAG 
ATCGACCCGT ACCTGCGTCC GCTCTACGAC GCGCTGCACG ACATGATCGA CCCCGACTCG 
ATCCCGCGGC TCATGCAGAG CGGCACCATC GAGGTCGCGC CGCTGGCGTA CATGCGCGGC 
CGTACGCTCA ACGACGCCTT CATCATCCTG GACGAGGCGC AGAACACCTC GGCCGAGCAG 
ATGAAGATGT TCCTGACCCG CCTCGGCTTC GGGTCCAAGA TCGTGGTGAC CGGTGACGTC 
ACCCAGGTCG ACCTGCCCAG TGGCACGCAG AGTGGCCTGC GAGTGGTCCG CGAGATCCTG 
GACGGCGTCG CCGACGTCCA CTTCGCGACC CTGACCAGCA CGGACGTCGT CCGGCACCGG 
CTGGTCAGCG ACATCGTCGA CGCCTACGCG CGCTGGGACG CGGCGAGCCC GGCACCGAGC 
ACGGACACGC GCCCCACGCG GGCGGCCCGC CGGGACCGCC GATGA

Protein sequence

MLRPRRPYYM PESDTPPGSR VTTRIVVPDG HSMVSLLGHQ DQLLRVIEKA FSSDIHVRGN 
EITITGDPAE NELAARLFSE LVALLDAGTE ISPQHVDHSV AMLRSGAGER PAEVLTLNIL 
SNRGRTIRPK TLNQKRYVDA IDQHTIVFGI GPAGTGKTYL AMAKAVQALQ AKKANRIILT 
RPAVEAGERL GFLPGTLYEK IDPYLRPLYD ALHDMIDPDS IPRLMQSGTI EVAPLAYMRG 
RTLNDAFIIL DEAQNTSAEQ MKMFLTRLGF GSKIVVTGDV TQVDLPSGTQ SGLRVVREIL 
DGVADVHFAT LTSTDVVRHR LVSDIVDAYA RWDAASPAPS TDTRPTRAAR RDRR