Gene Franean1_4326 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4326
Symbol
ID	5672681
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	5168304
End bp	5169449
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	75%
IMG OID	641243199
Product	RNA polymerase ECF-subfamily sigma factor
Protein accession	YP_001508616
Protein GI	158316108
COG category	[K] Transcription
COG ID	[COG4941] Predicted RNA polymerase sigma factor containing a TPR repeat domain
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGAGC TCCTGCTCCG GAGCCTCACA CCGAGCGTGC TCGGGATCCT CGTCCGCCGC 
GGAGCCGACT TCGCGGCGGC CGAGGACGCC GTGCAGGACG CGCTGGTCGA GGCGGTCCGT 
GTCTGGCCGG CCGACCCGCC GCGGGACCCG AAGGGCTGGC TGGTCACCGT GGCCTGGCGC 
CGGTTCCTCG ACGCGACCCG GGCGGACACC TCCCGCCGCC GGCGGGAGGA CCTCGCCGAC 
GAGGAACCGG CGCCCGGGCC CGCGCCCGCG GTCGACGACA CGCTCCAGCT CTACTTCCTG 
TGCGCCCACC CGTCGCTGAC ACCGTCGTCC GCGGTCGCGC TCACGCTGCG CGCCGTCGGC 
GGGCTGACCA CCCGCCAGAT CGCCCAGGCC TACCTGGTGC CCGAGGCGAC CATGGCGCAG 
CGCATCAGCC GGGCCAAGCG CACCGTCACC GGCGTGCGGT TCGACCAGCC CGGCGACGTC 
GCCACCGTGC TGCGCGTCCT CTACCTGGTC TTCAACGAGG GCTACTCCGG TGACGTCGAC 
CTCGCCGCCG AGGCCATCCG GCTCACCCGG CAGCTCGCGG CCGCGATTGA CCACCCCGAG 
GTGGCGGGGC TGCTCGCCCT CATGCTGCTC CACCACGCCC GGCGCGCCGC CCGGACCGCG 
CCCGACGGCA GCCTCATCCC CCTCGCCGAG CAGGACCGCC GCCGGTGGGA CACCACGTCG 
ATCGCCGAGG GCGTCGCAAT CCTGCAGGCG GCCCTCGCCC GCGACCAGCT GGGCGAGTTC 
CAGGCCCAGG CCGCCATCGC GGCACTCCAC GCCGACGCAC CCACCACCGA GGAGACAGAC 
TGGGTGCAGA TCGTCGAGTG GTACGACGAG CTCACGCGCC TGACCGACAG CCCGGTCATC 
CGCCTCAACC GCGCGGTGGC CGTCGGCCAG GCCGACGGAC CGCGCGCCGG CCTGGCGGCG 
CTCGCGGCGC TGGACGACTC ACTACCCCGC CACGCGGCCG TGGCGGCCTA CCTCCACGAA 
CGCGACGGCA ACCTGGCGAC CGCGGCACGG CTGTACGCCG AAGCAGCCCA CAAGGCACCC 
AATCTCGCCG AACGCGACCA CCTGACCCGC CAGGCCGCCC GACTCAACAC CCACCGGTGC 
CACTGA

Protein sequence

MDELLLRSLT PSVLGILVRR GADFAAAEDA VQDALVEAVR VWPADPPRDP KGWLVTVAWR 
RFLDATRADT SRRRREDLAD EEPAPGPAPA VDDTLQLYFL CAHPSLTPSS AVALTLRAVG 
GLTTRQIAQA YLVPEATMAQ RISRAKRTVT GVRFDQPGDV ATVLRVLYLV FNEGYSGDVD 
LAAEAIRLTR QLAAAIDHPE VAGLLALMLL HHARRAARTA PDGSLIPLAE QDRRRWDTTS 
IAEGVAILQA ALARDQLGEF QAQAAIAALH ADAPTTEETD WVQIVEWYDE LTRLTDSPVI 
RLNRAVAVGQ ADGPRAGLAA LAALDDSLPR HAAVAAYLHE RDGNLATAAR LYAEAAHKAP 
NLAERDHLTR QAARLNTHRC H