Gene Franean1_4980 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4980
Symbol
ID	5673319
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5975058
End bp	5976953
Gene Length	1896 bp
Protein Length	631 aa
Translation table	11
GC content	75%
IMG OID	641243834
Product	GAF sensor signal transduction histidine kinase
Protein accession	YP_001509250
Protein GI	158316742
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.691708
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.877049
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCCAGA CCGGCGCCGG CCCAGATGCG CCGGCGACCA GCAGCGCCGA GCCGCGGACG 
CTCGGCGGCG CCGGCCGTCG CCTCAAGCCC GGGCCGAGGT CGGAGGTCTA CGCGGTGCAG 
AGCCGGATGC GCGGCCTGCT CGACGCCGTG GTCGATGTCG CGCGCGAGCT GAGCCTGCCA 
GTGACGCTAC GCCGGATCGC GCAGGCGGCC CGCTCCCTGG TGGACTGCGA GCTCGGCGCG 
CTCGGGGTCC TCGGCCAGGA CGGCGCCATC ACCGAGCTGA TCGCGGTCGG CCCGGGGGAG 
GAGGTTCCCC GCGACATCGC CCGGATGCCG CCCGGCCGCG GCCTGATCGG CGAGCCCGGG 
GGCGGCCCCC ACCCGGGCGG GAACGCACCG CGGGTGGGCA CCGCCGTCGT CGCGCCGGAG 
ACGCTCGGCT TCCCGCCCGG CCGGCCTCGT TTCACCACGT TCCTCAACGT CCCGATCGCC 
GTCCGCGGGG AGGCGTTCGG CAACCTGTAC CTGGTGGGCA AGCGCGGCCC CGAGTTCACC 
CAGGAGGACG AGGACCTGGT CGAGGCGCTC GCCGCGGCCG TCGGCTTCGC CATCGAGAAC 
GCCCGCCTTT ACGAGGCCAC CCGGCGGCGC CAGGCCTGGC TCACCGCGAG TGCCGAGATC 
ACCACGGCGC TGCTGTCGGT GGCCGAGCCC GTCGACGCGT TACGGCTGGT CGCCCGGCGT 
GCCAGGCAGA TCACCTCGGC CCTGCTCGCC GCGATCGTGC TCCCGGTGAA CAGCGCGGAG 
GCGGCCCGGC CCGGCCGCTT CGGCGTCCGG CCCCGCCGGC CCGCCGCGCG GGCCGGCGGG 
GCCCCGAGGT CGCTGGAGGT GGCCGTCGTC GACGGTCCGC TCGCCGAGCA GTTGCGGGGG 
CGGATGCTGC CCGAGCGGGT CGGGCTGTTC AAGATCATGA AGGCGGGCCG GGCGGTGCTC 
GTCCCCGCCG AGCGCGCCGA TCCCGCCGCG CACAGCCTGC TGGGCGAGGC CGTCGACGGC 
CTGGTGATCG GCACCGTGAT GGTCATCCCG CTGTTGGCCG CCGGGCGGCC GCTGGGGGTG 
CTCATGCTCA CCGCGGCCCC GGGCGCGGTC CCGTTCGGCC AGCTCGACCT GGAGATGGCG 
GCGGCGTTCG CCGGTCAGGC CGCGCTCGCC CTGGAACTCG CCCGCGTGCA GTGGGACAGG 
GAACGCCTCG CGGTGTTCGA GGAACGCGAC CGCATCGCCC GCGACCTGCA CGACGTCGTC 
ATCCAGCGGC TGTTCGCCAC CGGTCTGCAG ATGCAGGGCC TCGCCCGGGT GATCGACGAG 
GGCGCCGCGG TGCGGCTCAA CGACGCCGTC CGCGAGCTGG ATCAGACGAT CGCCGACATC 
CGCCATACGA TTTTCTCGCT GACGGCGTCC GCCGGCGCCG TCGACCTGCG GGCCGAGATC 
GCCGGAATCG TGTCACAGGC CGAGCAGGCG CTGGGCATCC GGCCCACGGC CCGCATCGAC 
GGCCCGGTCG ACCGCGGTAT CCCGGAGGTG ATCCATCCGC ACCTGCTGGC GGCCATCCGT 
GAGGCGCTGT CGAACATCGC ACGGCATGCC CGGGCGACCC GCATCGAGGT GCTGGTGCGG 
GTCACCAACA CCGACGTCTC GGTGCAGGTG CGCGACGACG GCTGCGGCCC GGGTGGCGCG 
TCGCGCAGCA GCGGCCTGAC GAACCTGCGC CGCCGGGCGC TCGACCTCGG CGGCCGGATG 
GAGTTCGGCC CAGGCGAAGA CGGCATCGGC ACGACGGTGA CCTGGTACGT GCCGCTGGTT 
CAGCCCATCC CGCCACCGCG CGCGCTGCCG CGGGCCGGGG ACACCCCCGC CCCGCGACTC 
GGCGTCGGGC CCGCGGAGGG GCCTGGTGGG CCCTGA

Protein sequence

MVQTGAGPDA PATSSAEPRT LGGAGRRLKP GPRSEVYAVQ SRMRGLLDAV VDVARELSLP 
VTLRRIAQAA RSLVDCELGA LGVLGQDGAI TELIAVGPGE EVPRDIARMP PGRGLIGEPG 
GGPHPGGNAP RVGTAVVAPE TLGFPPGRPR FTTFLNVPIA VRGEAFGNLY LVGKRGPEFT 
QEDEDLVEAL AAAVGFAIEN ARLYEATRRR QAWLTASAEI TTALLSVAEP VDALRLVARR 
ARQITSALLA AIVLPVNSAE AARPGRFGVR PRRPAARAGG APRSLEVAVV DGPLAEQLRG 
RMLPERVGLF KIMKAGRAVL VPAERADPAA HSLLGEAVDG LVIGTVMVIP LLAAGRPLGV 
LMLTAAPGAV PFGQLDLEMA AAFAGQAALA LELARVQWDR ERLAVFEERD RIARDLHDVV 
IQRLFATGLQ MQGLARVIDE GAAVRLNDAV RELDQTIADI RHTIFSLTAS AGAVDLRAEI 
AGIVSQAEQA LGIRPTARID GPVDRGIPEV IHPHLLAAIR EALSNIARHA RATRIEVLVR 
VTNTDVSVQV RDDGCGPGGA SRSSGLTNLR RRALDLGGRM EFGPGEDGIG TTVTWYVPLV 
QPIPPPRALP RAGDTPAPRL GVGPAEGPGG P