Gene Francci3_0470 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0470
Symbol
ID	3903201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	550454
End bp	551731
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	70%
IMG OID	637877801
Product	histidine kinase
Protein accession	YP_479585
Protein GI	86739185
COG category	[T] Signal transduction mechanisms
COG ID	[COG5002] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.53157
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGCGG TGCCTGGAAC AGCCGGTTCG ACGACTGACC TGACTACTGG TTCGGCGTCC 
GGCGGGGACA CCGGCGGCAT GACCTTGCCG GCAAGGCTCG TGCGTCGGGT GATCGCCGGC 
CTGCCGACCG GTCTGCTCGT CCTCGACGCC GCGGACCGGG TGGTCCTGGT GAACATGGTC 
GCGCGACGTA TGGGTGTGGT CGCCGCCGAC GAGATCGCGG TGGCGGAGCT GGCCGATCTC 
GTCCGGGCCA CCCGGCTCGC GGGCAGTGAC CAGGAGCGGC AGCTTGAGCT GCCGCCCGTC 
CCCGAGCCCC CCCTCACCCG TCCCCGACCG GACCAGGAGG GGCTGGCGGT GCGTGCCCGG 
GCCCGGCTGC TGGACTCGTC CGGTCATGTC GCCGTCATCG TGGATGACAT TACCGAGTCG 
CGTCGGGTCG AGGCCGTCCG TCGGGACTTC GTGGCGAACA TCAGCCACGA GCTCAAGACG 
CCGGTCGGTG CGTTGCACGT CCTCGCCGAA GCGGTCGCCG CGGCCTGCGA GGACCCGGTG 
GCAGTCCGCC GGTTCGCCTC CCGGATGACC CACGAATCGA CCCGGCTCGC CCGTCTTGTT 
CAGGAGATCA TCGATCTCTC CCGGCTGCAG GGCGCCGATC CGCTGCCCAA CCTGCGGCCG 
ATGCGGGCGT CCGCGGTGCT CACCGAGGCG GTCGACCGCA CCCGGCTGGC AGCGCAGGCC 
CAGGCGATCT CGGTTGCGGT GATCGGCGAC GGTGACCTGC CGGTGTGTGG GGATGAGGGC 
CAGCTCGTGA CCGCCGTCGC GAACCTGCTC GACAATGCGA TCAGCTACTC GCCGCGTGGC 
ACCCGGGTTG TGCTCGGGGT TCGGCGCAGC GGTGAGACCG TGGAGATCTC CGTCGCCGAC 
GAGGGCATCG GGATCGCGGA GAAGGACCTG GAACGGGTCT TCGAACGCTT CTATCGGGCG 
GATCCGGCGC GATCCCGCGC GACCGGTGGG ACCGGCCTGG GGCTCGCCAT CGTCAAGCAC 
ATCGCGACCA ATCACGGCGG CGTGGTCTCT GTGTGGAGCG CCGAGGGCGC GGGTTCCACC 
TTCACGCTCC GGTTGCCGCT GTTCACCGGC GACGATGACG ATGCGATGAC GGACGGCTCG 
GACGAAACCC GCGAGGATGA CGGGGTGGAT GGCTTCGACG TCGTCGGGGC CGATGCCGAC 
GCCCGCGGTC GGGGCGATGG TGAACATCAT GGCGATGGTG AACATCATGG CGATGATGAA 
CTCGGTGGCG GTTCGTGA

Protein sequence

MTAVPGTAGS TTDLTTGSAS GGDTGGMTLP ARLVRRVIAG LPTGLLVLDA ADRVVLVNMV 
ARRMGVVAAD EIAVAELADL VRATRLAGSD QERQLELPPV PEPPLTRPRP DQEGLAVRAR 
ARLLDSSGHV AVIVDDITES RRVEAVRRDF VANISHELKT PVGALHVLAE AVAAACEDPV 
AVRRFASRMT HESTRLARLV QEIIDLSRLQ GADPLPNLRP MRASAVLTEA VDRTRLAAQA 
QAISVAVIGD GDLPVCGDEG QLVTAVANLL DNAISYSPRG TRVVLGVRRS GETVEISVAD 
EGIGIAEKDL ERVFERFYRA DPARSRATGG TGLGLAIVKH IATNHGGVVS VWSAEGAGST 
FTLRLPLFTG DDDDAMTDGS DETREDDGVD GFDVVGADAD ARGRGDGEHH GDGEHHGDDE 
LGGGS