Gene Franean1_5401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5401
Symbol
ID	5673732
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6517219
End bp	6518538
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	73%
IMG OID	641244256
Product	integral membrane sensor signal transduction histidine kinase
Protein accession	YP_001509662
Protein GI	158317154
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATCG AGGTGGTCGG GTTTGGGGGG CGCTGGGCCC GCGTGCGGGC GGCCGTCCAG 
GCGCGGGAGC CGTGGCCCCG CGACCGGCGC GCGCTGGTGT TCGACCTCGT GGTCGCGCTA 
GCCGCCACGG TCGCCGAGCT CAGCCTCCTC CTCAACGACG ACCACACTGT GCGTGCGCCG 
ATGGTGCTGC TAGCGGTCGC GGCCGGCGGT GCGCTCACCG CGCGTCGCCG GGCACCGTGG 
ACGGTGCTTG TGATGACGTT GGCCCTGTCC GGAGCGCTGG TGGCCATCGG TGACGCGCCC 
GGCGGGGTGC CCGTCCTGGT GGCGCTCTAC ACGGTCGCCG ACCTCGACGA CTGGCGCCTC 
TCGCTCGCCG CGCTCGCGCC CACCGCGGTG CTCCTGACCA TGTTGTCCAT CGTCTCCGTC 
CCGCCGACGG CGGGGGTGTG GGCGCTGGGC GCCTACGCGC AGACCCGCCG CCGCTACGTC 
CGCGCGCTCG AGGAACGCGC GGAGCACCTT CAACGCGAAC GGGAGCAACT AGCCCGGATC 
GCGGTGCACG AGGAGCGGGC GTCGATCGCC CGCGAGCTGC ACGACATCGT CGCTCACTCG 
GTGACCGTGA TGCTGCTGGG CGTGCGTGGC GCCCGCGACG TGCTGCGCGT CTCCCCAGAC 
CGAGCCGACG ACACACTGGC GCGGGTGGAG ACGAACGGGG AGCAGAGCCT CGTCGAGCTG 
CGGCGGATAC TGACCGTGCT GCGTGCTCCC GACACCCCCG CCGACTCACG TCCCGCCCCA 
TCTCTGACGG AACTGGACGA GCTCGTCGTC GACTACCGTG ACGCCGGGCT GCCCATCCAC 
CTACGGGTGA CGGGGGAGCG AAGACCGCTT CCCGGCGGCG TGGAGCTCTG CGTCTACCGC 
GTCATCCAGG AGGCGTTGAC CAACGCGCTG AAGCACTCGC GCCCCAGGCA TGTCACGGTC 
ACGCTGGCCT TCCTGGGCTG GTGCCTCGAC GTCGAGGTGG CCAACGACAG CACGGCCCCA 
GCGCCGGGGC CGACCGGCGA TGGCGCCGGG GATATGCCCG AGACCGGGAA CCCCGCTGGG 
CACGGCCTTA TCGGGATGCG CGAGCGGGTT GGGGTGCTCG GCGGCGAGCT GGAGTTCGGG 
CACCGACCCG GCGGCGGCTT CCGCGTCGCG GCCCGCCTGC CGCTGGGCGG CGGAGCTGCA 
CGCCGCCAGC TACGCCGGCC GCGTCGACGT GGTCCGTCTG CTGCTCGACC GCGGCGCCGA 
CATCGACGCC GCGGACCGGC ATACGTGCCC AAGGGATCCG CGCGACCGTC GAGGAGATGA

Protein sequence

MTIEVVGFGG RWARVRAAVQ AREPWPRDRR ALVFDLVVAL AATVAELSLL LNDDHTVRAP 
MVLLAVAAGG ALTARRRAPW TVLVMTLALS GALVAIGDAP GGVPVLVALY TVADLDDWRL 
SLAALAPTAV LLTMLSIVSV PPTAGVWALG AYAQTRRRYV RALEERAEHL QREREQLARI 
AVHEERASIA RELHDIVAHS VTVMLLGVRG ARDVLRVSPD RADDTLARVE TNGEQSLVEL 
RRILTVLRAP DTPADSRPAP SLTELDELVV DYRDAGLPIH LRVTGERRPL PGGVELCVYR 
VIQEALTNAL KHSRPRHVTV TLAFLGWCLD VEVANDSTAP APGPTGDGAG DMPETGNPAG 
HGLIGMRERV GVLGGELEFG HRPGGGFRVA ARLPLGGGAA RRQLRRPRRR GPSAARPRRR 
HRRRGPAYVP KGSARPSRR