Gene Franean1_1647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1647
Symbol
ID	5670049
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1967102
End bp	1968202
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	76%
IMG OID	641240565
Product	helix-turn-helix type 11 domain-containing protein
Protein accession	YP_001505991
Protein GI	158313483
COG category	[K] Transcription
COG ID	[COG2378] Predicted transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.242588
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.121155
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGTGCCA GCCGGCTCCT CTCCGTCCTC CTGCTGCTGC AGACCCGCGG CCGGCTGACG 
GCCCGCGAGA TAGCCGCCGA GCTGGAGGTG TCGGTCCGCA CGGTCTACCG GGACCTGGAC 
GCGCTCGCCG AGGCCGGCGT CCCGGTGCTG GCGGAGCGTG GGGCCACCGG CGGTTACGAG 
CTGCTCGCCG GCTACCGCAC CCGGCTGACC GGGCTGACCG CGGACGAGGC CGACTCCCTG 
CTGTTCGCCG GGCTCCCGGA CGCCGCCGCC GAGCTCGGTT TCGGCGCGGT AGTCGCCGCC 
GCCGAGCTCA AGCTGCTCGC CGCGCTCCCG GCCGAGGCCC GTGAGCGGGC ACTTCGGGTG 
CGGGAGCTGT TCCACCTCGA CGCGCCCGGC TGGTTCCGTG CCGCCGAGCC GGTGCCGCTG 
CTCGCCGAGG TCGCCGGTGC GGTGTGGGGG CGGCGGCGCA TCCGGATCAC CTACCTGCGC 
TGGCGCGCAC CGCGCCGGGT CGTCCGCGAG CTGGAGCCGC TCGGTGTGGT CCTCAAGAGC 
GGCACCTGGT ACGTCGTAGC CGCCGCCTGC CCCGGCGACG GCCGGGCCGA CATCGCGGAC 
GCTCCGCCCG CGGAGACACC GGAGACACCG GAGACACCTG AGGCGGCGGC GGAGGCGTTC 
GAGGCGTCCG TGCGGGTGTA CCGGGTCGCG AAGATTCTCG GTCTCGAGGC GATGCCGGAG 
ACGTTCGAAC GGCCGGAGCG GTTCGACCTG GCGGCCTATT GGGAGCAGTG GACCGCCAGG 
TACGAGGCCG GCGTCTACCG GGGGACCGCC ACGGTGCGCC TGTCGCCGGA GGGCCGGCGG 
ATGGTTCCCT TCCGGCTCGC CCCGGCGGTG GCGCGGGCCG TCGAGCAGAC CGCGGGCGAT 
CCCGACGCCG ACGGCTGGGT GCGCGCCGAG CTCCCGATCG AGTCGGTCCG GCACGCCCGG 
GGCGACCTGC TCCTCCTCGG CCCTGACCTG GAGGTGCTCG ATCCCCCGGA GCTGCGGGCG 
GCGATGGCGG ACGCGGCCGC GGGCCTGGCG GCGCTCTACA GCCCGCCCGC GAACCCGCCC 
GCGAACCCGC CCGCGTGCTG A

Protein sequence

MRASRLLSVL LLLQTRGRLT AREIAAELEV SVRTVYRDLD ALAEAGVPVL AERGATGGYE 
LLAGYRTRLT GLTADEADSL LFAGLPDAAA ELGFGAVVAA AELKLLAALP AEARERALRV 
RELFHLDAPG WFRAAEPVPL LAEVAGAVWG RRRIRITYLR WRAPRRVVRE LEPLGVVLKS 
GTWYVVAAAC PGDGRADIAD APPAETPETP ETPEAAAEAF EASVRVYRVA KILGLEAMPE 
TFERPERFDL AAYWEQWTAR YEAGVYRGTA TVRLSPEGRR MVPFRLAPAV ARAVEQTAGD 
PDADGWVRAE LPIESVRHAR GDLLLLGPDL EVLDPPELRA AMADAAAGLA ALYSPPANPP 
ANPPAC