Gene Franean1_0285 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0285
Symbol
ID	5668709
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	334755
End bp	335654
Gene Length	900 bp
Protein Length	299 aa
Translation table	11
GC content	74%
IMG OID	641239215
Product	ECF subfamily RNA polymerase sigma-24 factor
Protein accession	YP_001504657
Protein GI	158312149
COG category	[K] Transcription
COG ID	[COG1595] DNA-directed RNA polymerase specialized sigma subunit, sigma24 homolog
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family [TIGR02983] RNA polymerase sigma-70 factor, sigma-E family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCACCG ATGCGGCCGC CAGCGGCGCC CTGCCCCAGC GCCAGGGCTC CGACGACGGG 
CTCACCGGCT CCGATGATCG GCTCCTGGGC CGGCACACGG CCCGGGACGA GGCGGGGTGG 
TCCGACCTGG AGGACCCCGA GCCTGTTCCG GGCGAGGCGG CTGGGCCGGA GTCTGCCGGC 
GGCACGGGCA CGCCCCTGAA CGCGCCGGTC GAGTTCCGGG AGTTCTTCGA GCGCCACCAC 
CGCGAGCTGT CGCGTTTCGC CTATCTGCTC ACCGGCGACC ACGACGCGGC TGACGACCTC 
ACCGCCGAGG CGCTCACGGC CGCCTGGTCC AAGTGGGAGC GGGTCAGCAG CGCGGACAGC 
CCACTCGCCT ACGTGCGGCG CATCGTGGCG AATCTGGCCA CCAGCCGGCT GCGGCGGGTG 
ATCCGGGAAC GCCGGGGGAT GACCGTCCTC GGCATGCTGG CCGAACGTAC CGAGCACGCT 
GCGGACGACG CCGACGTTCC CGCCGCCGTG GACCTGCGCG CCGCGCTGAT GACCCTTCCA 
GCCAGGAAGC GGGCGTGTGT CGTGCTGCGG TACGCCTTCG ACCTGTCCGA GGCGGACACT 
GCCCGGACGC TGGGAATCTC CGTCGGAACG GTGAAGAGCC AGACATCCAA GGCGGTGGCC 
GAGCTCGAAC GGGTACTCGG CACCAGGCCC GAACTGACCC ACTCCGACCC GCCGGACGGC 
ACCCCGGCCC GAAAACCGGA CGCGCGCCCC CTGGCCCCGC AGGCACCGCG CCGAGCCGGT 
GCCACGCGCG GCCGCCGGCG TGCGGCCGGC GGAACGGATC CGGCGAGCGT CGCCCGGTCG 
GCGCTGAACC GGCTGCGCGA CAGCGAGGCA CCCGGACGGC TCCGCGGCAG CGAGGGCTGA

Protein sequence

MSTDAAASGA LPQRQGSDDG LTGSDDRLLG RHTARDEAGW SDLEDPEPVP GEAAGPESAG 
GTGTPLNAPV EFREFFERHH RELSRFAYLL TGDHDAADDL TAEALTAAWS KWERVSSADS 
PLAYVRRIVA NLATSRLRRV IRERRGMTVL GMLAERTEHA ADDADVPAAV DLRAALMTLP 
ARKRACVVLR YAFDLSEADT ARTLGISVGT VKSQTSKAVA ELERVLGTRP ELTHSDPPDG 
TPARKPDARP LAPQAPRRAG ATRGRRRAAG GTDPASVARS ALNRLRDSEA PGRLRGSEG