Gene Franean1_6146 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6146
Symbol
ID	5674467
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7477811
End bp	7479208
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	73%
IMG OID	641244998
Product	histidine kinase
Protein accession	YP_001510396
Protein GI	158317888
COG category	[T] Signal transduction mechanisms
COG ID	[COG5002] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.854948
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACGGC GGCCTGACTC GGCTGATCGG GGCGGTGCGA CGGACGCCGG CCCCCGCGGC 
GCGGCGGCGG CCGCCACCGG CCCGCACGCG CTGCCCGCCC ACCTCGTCCG ACAGGTGATC 
GCCGGCCTGC CCTCCGGGCT GGTGGTGGTG AACGCCGAGG ACGTGGTCGT GCTGGTCAAC 
TCCGCCGCCC GCCGGATGGG TGTCGTCGAC GGTGACGAAC TCAGCGTGGG CGAGGTGGCG 
GATCTGGTGA AGGCCTGCCG GTCCGCCGCG GCCGAGCGCA ACCGCCAGCT GGACCTGCCG 
CCGGTGCCCG AGCCACCGCT GACCAGGGCC CGTCCGGACC AGACCGCGCT GGCCGTCTGG 
GCATACGCGC GCCCGCTCGG TGACAGCGGG TACGTCTCGG TCCTGCTCGA CGACATCACC 
GACTCGCGGC GGGTCGAGGC CGTCCGGCGC GATTTCGTCG CCAACGTCAG CCACGAGCTC 
AAGACGCCCG TCGGGGCGCT GCACGTGCTC GCGGAGGCGG TCAGCGAGGC CAGCGAGGAC 
CCGGTGGCCG TGCGCCGTTT CGCGTCGCGG ATGACGCACG AGTCCACCCG GCTGGCCCGG 
CTGGTCCAGG AGATCATCGA CCTCTCCCGG CTGCAGGGCG CCGAGCCGAT GCCCGACCTG 
GCCCCGGTGC CGGTCTCGGT GGTGCTCGCG GAGGCCGTCG ACCGGAACCG GTTCAGCGCG 
CAGGCGCAGG AGATCTCGGT CGCCGTCATC GGCGCTGGCG GGCTGCGGGT CCGCGGCGAC 
GAGAACCAGC TGGTCACCGC CGTGGCGAAC CTGCTGGACA ACGCCATCAG CTACTCGCCG 
CGCGGCACAC GGGTCGTGCT GGGAGTCCGC CAGGTCGGCG GAACAATAGA GATATCAGTC 
GCGGACGAGG GAATCGGCAT CGCCGAGAAG GACCTGGAAC GGGTCTTCGA GCGTTTCTAC 
CGCGCCGACC CGGCGCGTTC CCGGGCGACC GGGGGAACTG GTCTCGGCCT GGCTATCGTG 
AAGCACATCG CGACCAACCA CGGCGGTTCG GTGAGCGTGT GGAGCGCGGA GGGTCGGGGC 
TCGACGTTCA CGCTGCGCCT GCCCTCCGGT ACCGACGATC CCAAGGCGGC CGGGTCCGAA 
ACAGGCCGCT CCGAAACAGG CCGTGCGGGG AAGTCCGGCG GCACGGTCGA GCCTGGTGGC 
GCGGCGCCGT CGCGGCCGAG CGGTGTCGTT CCGTTGCGGC CGCCAGTCGA TGCACCCGAT 
CTCGCCGATT CCGCGTCGCG GGGCCCGGTC CTGGCGGAAA CTGTGCACGA ATCAACTGGT 
CGCACCCGGC CGGCGGCGGC CGCTCCGGTC GCGTCCGAGA ATTCCTCCGG AACCGGCCCC 
GGCGGCCCCG GAGCATGA

Protein sequence

MARRPDSADR GGATDAGPRG AAAAATGPHA LPAHLVRQVI AGLPSGLVVV NAEDVVVLVN 
SAARRMGVVD GDELSVGEVA DLVKACRSAA AERNRQLDLP PVPEPPLTRA RPDQTALAVW 
AYARPLGDSG YVSVLLDDIT DSRRVEAVRR DFVANVSHEL KTPVGALHVL AEAVSEASED 
PVAVRRFASR MTHESTRLAR LVQEIIDLSR LQGAEPMPDL APVPVSVVLA EAVDRNRFSA 
QAQEISVAVI GAGGLRVRGD ENQLVTAVAN LLDNAISYSP RGTRVVLGVR QVGGTIEISV 
ADEGIGIAEK DLERVFERFY RADPARSRAT GGTGLGLAIV KHIATNHGGS VSVWSAEGRG 
STFTLRLPSG TDDPKAAGSE TGRSETGRAG KSGGTVEPGG AAPSRPSGVV PLRPPVDAPD 
LADSASRGPV LAETVHESTG RTRPAAAAPV ASENSSGTGP GGPGA