Gene Franean1_4333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4333
Symbol
ID	5672688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5176408
End bp	5177439
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	75%
IMG OID	641243206
Product	integral membrane sensor signal transduction histidine kinase
Protein accession	YP_001508623
Protein GI	158316115
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0375931
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCTCGG CCAGGGTGCC GGGACCGGTG GCGCCACCGG TCGTGATCGG GCTGGCGGCC 
GGGGCCGTCG TGCTGCTGAT CTGGGCGGCC GTCGGCGGTG GTTACTTCTG GCCGCGCTGG 
GTGTGGTTCG GCATCGGCAC CGTGTTCTGG GCCGCGATCC TCGTCGGGTG GGTCCGGCGG 
ATACCGCCGG GGCGGCGCCG GTGGCTCGCC GCCACCCGGG CGGTGGCTGC CCTGGCCATC 
CCGGTCGACG TGGTGGTGTG GGCGCTGTCC GGCGGCGGCT ACTTCTGGCC GGTCTGGACG 
ATTCTCGCGC TCACGATCGG GCTCGCCATC CACACCTGGA TCGTCGCGCT GATGCCCGCC 
GAGCGGGAGC GTGAGCTCAC CGAGCGGGTC GACGCGCTCA CCCGCACCCG CCGCGGCGCG 
CTCGACGGGC AGGCCGCCGA GCTCAAGCGG ATCGAGCGGG ACCTGCACGA CGGCGCCCAG 
GCGCGGATCG TCTCGCTGGC GATGAACCTC GGCATGGCCG AGGCCCTGCT GCACAGCGAC 
CCGGCGGCGG CGGCGAAGCT GCTCAGCGAC GCCCGGCTGT CCGCGGTCGG CGCGCTCGAC 
GACCTGCGGG CCGTCATGCA CAGCATCCAC CCCTCGGTGC TCGCCGACCG GGGGCTCGCC 
GGGGGCATCC GCGCGCTCGC GCTCGACCTG TCCCTGCCGG TCCGCGTCGA CGGCGACGTC 
CCGTCCGGGC TGCCGGCGGC GGTCGAGTCG GCCGTCTACT TCGCGACCGC GGAATGCCTG 
GCCAACGTCG TCAAGCACAG CCGGGCCGCG CACGGCACGG TGCGGTTCGC GCACGACGGC 
AGGATGCTGA GCGTGGTCGT CACGGACGAC GGGCTCGGCG GGGCGGATCC CGCGTTCGGC 
CAGGGCCTGC GCGGGGTGGT GCGCCGGCTC GAGGCGTTCG ACGGCCGGAT GTCGGTACAC 
AGCCCGTCCG GGGGACCGAC GAGGATCACG ATCACCCTGC CGTGCCCGGT CCTGCCGGGC 
GCGGAGGCCT GA

Protein sequence

MASARVPGPV APPVVIGLAA GAVVLLIWAA VGGGYFWPRW VWFGIGTVFW AAILVGWVRR 
IPPGRRRWLA ATRAVAALAI PVDVVVWALS GGGYFWPVWT ILALTIGLAI HTWIVALMPA 
ERERELTERV DALTRTRRGA LDGQAAELKR IERDLHDGAQ ARIVSLAMNL GMAEALLHSD 
PAAAAKLLSD ARLSAVGALD DLRAVMHSIH PSVLADRGLA GGIRALALDL SLPVRVDGDV 
PSGLPAAVES AVYFATAECL ANVVKHSRAA HGTVRFAHDG RMLSVVVTDD GLGGADPAFG 
QGLRGVVRRL EAFDGRMSVH SPSGGPTRIT ITLPCPVLPG AEA