Gene Francci3_3030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3030
Symbol
ID	3904383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3596486
End bp	3598216
Gene Length	1731 bp
Protein Length	576 aa
Translation table	11
GC content	72%
IMG OID	637880350
Product	periplasmic sensor signal transduction histidine kinase
Protein accession	YP_482116
Protein GI	86741716
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.280253
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGGC GCATCCTGGC CGCCCAGCTC GCGCTCACGA CGGCGCTGCT TGTCGGCCTG 
TGCGTCCCGA TGGGGCTCGA CGCCACCCGT CACGACCGGG CGCTGTTCGG CCTGCGGCTC 
ACGGCCGCGA TGCAGGCCTA CTGCGCCGAG GTGAAGTGGC GGCGACTGTC CGCCGGCGCG 
GCCCCGCTGC CCGCCGCCGT ACGCGACAGT ACGGCCGTGC CACCGGACGA GCTCCGGCTG 
TTCGACCCGA ACGGTACGCC CGTGGCCGAC ACCGGTGACG ACATCCCGAT CATGGGCTGG 
GATCTGGATC GGGCCCGCCG GGAGAACGTG GTCATCAACC CGAACGCGGC CAATCGACAC 
CGGATGATCC TTGTTGCTCC GGTGTCCAAC GCGCAGGGTC TGGTCGGCAT CCTGGCCGTC 
GCGCGCAGCG ATGCCGGGCT GCGCGCCTCG ATCATCCACC GGTGGACGAT GATCGCCCTC 
GCGGGCGTCC TGGTCACGCT GGCCGCATTG GGGATCTCGA TACTGCTGGC CCGCTGGGTG 
GGCCGGCCGC TGCGCCGGCT CGAGCAGGCA GCGACCGAAC TCGGTGCCGG TGATCTCACG 
ATCCGGGCCA GAGCCGTCGG TGGCCCGCCC GAGGCACGCA AACTTGCCAC GACGTTCGAC 
GCGATGGCGG GACGGCTCCA GTTGCTGGTC GACAGCCAGC GCCGGTTCCT CGCCGACGTC 
TCCCACCAGA TCCGCACCCC GCTGACGGCG ATGCGCCTGC GCCTGGAGCT GCTGCAACAG 
GACGTGGACG CGGACACCAC CGACGAGGTC GCGGGCACCC TGGTCGAGGT GCACCGGCTC 
TCCCGGATGG TCGACGGGCT GCTGGCGGTC TCCCGGGCCG AGCATGCGCC GATCCCGACC 
CAGCCGATCC CCCTCGCGGT CGTCGCCGAG GAACGATGCC TGATCTGGCG ACCGGTCGCA 
GCCGCCGCCG GAGTGACGCT GACCTGCGAC GTCGACGCGG ACCAGGTCGT CCAGTGCACC 
CCGGGGCACC TGGAGCAGAT CCTCGACAAT CTCCTCAGCA ACGCGCTGGA GGCCACCCCG 
TCCGGCGGCC GGGTCAGCGT CACGTCCGGG ACGAACCCAC CGGCCCAGCC ACGCCCGGTG 
GGCGCCGGAG GCACCGCGGA GGCGGGCCTC GGGACGGGGA GCGCCGCGGA CGAGTTGGAC 
GAGATGAACG TCACCGGGCC GCAGAGCACC ATGACGGCGG AAAGCATGAC GGCGGAAAGC 
ATGACGCGGC TCACGGTCGC CGACAGCGGA CGCGGCATGA GCGCCGAGCA GCGGGCCGCC 
GCCTTCCGCC GGTTCAGCTC CAACCTCAGT GCCGACCAGC GAGAAGCCGA CCAGCGAGGA 
GAGGTGCCCG GCCGGGCCGA TCGGCGCGGG AACGGCCTCG GGCTCGCCAT CGTGCATGCC 
CTGACGACCG CCGACGGCGG GACGGTCACT CTGGCCGAGG GTGACAACGG GGGTCTGTGC 
GTCGTCCTTG ACCTGCCCCG GACACATCCA GACCGACGGC CGACGGCCGC CCGGCCGGCA 
CCCGCGCAGA GATCCGTGGA CGCGGCGGGC GGCACCCGCA TCGCGGCCAC GCCGGGTTCT 
GGGGGCACGG ACGGCCCGGG CCCTCGGCGG ACATCGGCCA CCATCCACGA ACTACTGGAA 
GTAGTGGATT ACGTCACGAC AGATTACGCC ATGGCCGACG ACAGGCCGTG A

Protein sequence

MTRRILAAQL ALTTALLVGL CVPMGLDATR HDRALFGLRL TAAMQAYCAE VKWRRLSAGA 
APLPAAVRDS TAVPPDELRL FDPNGTPVAD TGDDIPIMGW DLDRARRENV VINPNAANRH 
RMILVAPVSN AQGLVGILAV ARSDAGLRAS IIHRWTMIAL AGVLVTLAAL GISILLARWV 
GRPLRRLEQA ATELGAGDLT IRARAVGGPP EARKLATTFD AMAGRLQLLV DSQRRFLADV 
SHQIRTPLTA MRLRLELLQQ DVDADTTDEV AGTLVEVHRL SRMVDGLLAV SRAEHAPIPT 
QPIPLAVVAE ERCLIWRPVA AAAGVTLTCD VDADQVVQCT PGHLEQILDN LLSNALEATP 
SGGRVSVTSG TNPPAQPRPV GAGGTAEAGL GTGSAADELD EMNVTGPQST MTAESMTAES 
MTRLTVADSG RGMSAEQRAA AFRRFSSNLS ADQREADQRG EVPGRADRRG NGLGLAIVHA 
LTTADGGTVT LAEGDNGGLC VVLDLPRTHP DRRPTAARPA PAQRSVDAAG GTRIAATPGS 
GGTDGPGPRR TSATIHELLE VVDYVTTDYA MADDRP