Gene Franean1_6937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6937
Symbol
ID	5675250
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	8451033
End bp	8452775
Gene Length	1743 bp
Protein Length	580 aa
Translation table	11
GC content	72%
IMG OID	641245786
Product	GAF sensor signal transduction histidine kinase
Protein accession	YP_001511177
Protein GI	158318669
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.399913
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCCCCA CGGTGGCCCG TCTCGAACTC GACGACCTGC TCAGCCAACT CGTCGACCGC 
GCCCAGGACG TTCTCGCCAC CCAGGGCCGG CTGCGCGGCC TGCTGCACGC GAACCGGGTC 
ATCGCCACCG ACCTGCGACT GCCTGTCCTA CTCCGGCACA TCGTCGAGGC CGCAACGGAT 
CTGCTGGGTG CCCGCTACGG CGCACTCGGC GTCGTGGCCC CCGACCGCAC ACTCGAGGAA 
TTCGTCCACG TCGGCATGAC CGACGCGGAC GTGGAGCGGA TCGGCCACCT GCCCACCGGT 
CACGGCCTGC TCGGCATCCT GATCGACGAC CCGCGGCCGC GCCGCGCCGA CGACATCGCC 
CATGACCCGG CGTCCCAGGG CTTCCCGGCC GGGCATCCGC CGATGCGGAC CTTCCTCGGC 
GTCCCGATCA CTGTGCGGGG CGAGGTGTTC GGCAATCTCT ACCTCACCGA CAAACGCGAC 
GGCGTCCCCT TCACCGCGGA GGACGAGGAG CTCGCCCAGG CCCTGGCCGC CAACGCCGGG 
GTGGCGATCG CGAACGCGCG GCTCTACCAC GAGGCGCAGC AGCGGCACCT GTGGATGACC 
GCCTCGGCGG AGATCAGCCG TCAGGTGATG GTCGGCGCCG ACAACGCGCT CGCCACCCTC 
GTGCACCGGG TGCAGGAGGT CGCCGACGCC CCCTTCGTCG CCCTCGCGCT GCACACCACG 
AACCAGGGCA CTGCGGACGG AGGCGATCGG AGCAAGGAGG CCGGGTACGC GCGCGTCGCC 
GTCGCCGTCA CGGAGCGTCA CGTTACCGGC TCGGCCCACG CCGGTCTGGG CACCGATGCC 
AGCCGTGCCG GCCGCCTGAT TCCCCTCGAG CACACCCTGA CCGGCCGGGT GATCGCCGAG 
CAGCAGGCTC TTCGCGTCGA CGACTCGGAG CTCGACGCGC TCCCCGACGA GCGCGCGGCA 
CGCACCGGGC CGCTCATGGT CGTCCCGCTC GTCGCCGGCG GCGACCAGTG CGGCGGAGCG 
CTGCTCATCG GCCGCGACCG CGGCGTCCGC GCCTTCACCG ACGGCGACCT CGACATGGCG 
GCAGGCTTCG CCGGCCACGT CGCCGTAGCC CTCGAGCTCG CCCGGGCCCG AGCCGACCAG 
GAACACCTGC GGGTACTCGC CGACCGCGGC CGGATCGCCC GTGACCTGCA CGACCACGTC 
ATCCAGCGGA TGTTCGCCGT CGCGCTCGGC ATGCAGGATC TCGCCCAGTA CGAGAACCCC 
TCCAACGCCG GCCGGCTCAA CGGCTACGTC GAGGACATCG ACGCGACCAT CAAGGACATC 
CGCCGTTCCA TCTTCGAGCT GCGCGGACAG AGCCCCACCA AGCGCGGTCG CCTGCGCGCC 
GGCCTCAACA AGATCGCGGA CGACGTTCGG CTGGCCCTCG GCTTCGCCCC CGCCATCTCC 
CTGACCGGGC CCCTCGACAC CGTCGCGGAC GACCAGCTCA CCGACCATCT GCTCGCCGTC 
ACCCGCGAGG CCCTCACGAA CACCGCCCGC CACGCCCACG CGACCAGCGT CGAGGTGCGG 
CTGGCCGTGG ACGGGGACAT GGTCACCCTG GACGCCGTCG ACAACGGGGT CGGCATCGGT 
GACACCACCC GCCGCAGCGG CCTGGACAAC CTGCGCGCCC GCGCCGAGAG CCTCGGCGGC 
ACCTTCACCG CCACGACACC GCCCACCGGC GGCACCCACC TCCGCTGGGC CGCCCCGTTC 
TGA

Protein sequence

MFPTVARLEL DDLLSQLVDR AQDVLATQGR LRGLLHANRV IATDLRLPVL LRHIVEAATD 
LLGARYGALG VVAPDRTLEE FVHVGMTDAD VERIGHLPTG HGLLGILIDD PRPRRADDIA 
HDPASQGFPA GHPPMRTFLG VPITVRGEVF GNLYLTDKRD GVPFTAEDEE LAQALAANAG 
VAIANARLYH EAQQRHLWMT ASAEISRQVM VGADNALATL VHRVQEVADA PFVALALHTT 
NQGTADGGDR SKEAGYARVA VAVTERHVTG SAHAGLGTDA SRAGRLIPLE HTLTGRVIAE 
QQALRVDDSE LDALPDERAA RTGPLMVVPL VAGGDQCGGA LLIGRDRGVR AFTDGDLDMA 
AGFAGHVAVA LELARARADQ EHLRVLADRG RIARDLHDHV IQRMFAVALG MQDLAQYENP 
SNAGRLNGYV EDIDATIKDI RRSIFELRGQ SPTKRGRLRA GLNKIADDVR LALGFAPAIS 
LTGPLDTVAD DQLTDHLLAV TREALTNTAR HAHATSVEVR LAVDGDMVTL DAVDNGVGIG 
DTTRRSGLDN LRARAESLGG TFTATTPPTG GTHLRWAAPF