Gene Franean1_4939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4939
Symbol
ID	5673278
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5929218
End bp	5930243
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	74%
IMG OID	641243793
Product	RNA polymerase factor sigma-70
Protein accession	YP_001509209
Protein GI	158316701
COG category	[K] Transcription
COG ID	[COG1595] DNA-directed RNA polymerase specialized sigma subunit, sigma24 homolog
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family [TIGR02960] RNA polymerase sigma-70 factor, TIGR02960 family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.553857
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.665559
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGACG TTCCTCCCGG CGGCAGAACC GGCGGGGCTG CTCTGGCCGG GGCGGAGGCG 
GGTGTCGAGA ATCTTCTCGA GCCGTACCGC CGCGAGCTGA CCGGCTATTG CTACCGAATG 
CTCGGCTCGC CGTTCGAGGC GGAGGACGCC GTGCAGGACA CGATGATCCG CGCCTGGCGC 
GGAATCGACC GGTTCGAAGG CCGGGCCGCG CTGCGGTCGT GGCTGTACCG CATCGCGACG 
AACGTGTGCC TGTCGATGCT CGGCGCCAGT CAGCGGCGGG CACGGCCGAT GGACCTCGCC 
GGCCCGTCGG CGGCCGACTC CCCGCTGCCC GCGCCGCTGC CGGAGACGGC CTGGATCGTG 
CCCGCGCCGG ACGGCCAGGT CTACTCCAGC GCCGCCGACG CGGCCGACCC CGCCGATCTC 
GCCGCCCGTC GCGAGACGAT CAGGCTCGCG TTCGTCGTCG CGCTGCAGCA CCTGCCGGCC 
CGCCAGCGGG CGGTGCTCAT CCTGCGCGAG GTGTTCGGCT GGCCGGCCGC CGAGGTCGCC 
GACCTGCTGG AGACCTCCGT CGCCTCGGTC AACAGCGCCC TGCAGCGGGC GCGCGCCACG 
ATCGCCGCGA CGGAGATCTC CGACGCCGAC CCGCTGCGCC CCGCCGACGC CGAGCAGCGG 
GAGCTGCTCG CCCGCTATGT CGACGCGTTC GAGCGGTACG ACCTCGAGTC CCTCGCGGCG 
CTGCTGCACG AGGACGTCAC GATGTCGATG CCGCCGCTGG GCCTGTGGCT GCGGGGCCAC 
GCCGACGTCC GGGCATGGAT GCTCGGTACG GGCCAGGGCT GCCGGGGCTC GCGGCTGCTG 
CCAACCGTGG CCAACGGCCA CCCGGCCTTC GGGCAGTACC GGCCCAGCGC CACGGGTTCC 
GGGCACGACC CGTGGGGCCT GGTCGTCCTG GAGATCTCGG CCGGGCGGGT CGCCGGCATC 
AACACGTTCC TGGACGTCGA ACGCCTCTTC CCGCTGTTCG GCCTGCCGGC CCGGTTGCCT 
GGCTAG

Protein sequence

MGDVPPGGRT GGAALAGAEA GVENLLEPYR RELTGYCYRM LGSPFEAEDA VQDTMIRAWR 
GIDRFEGRAA LRSWLYRIAT NVCLSMLGAS QRRARPMDLA GPSAADSPLP APLPETAWIV 
PAPDGQVYSS AADAADPADL AARRETIRLA FVVALQHLPA RQRAVLILRE VFGWPAAEVA 
DLLETSVASV NSALQRARAT IAATEISDAD PLRPADAEQR ELLARYVDAF ERYDLESLAA 
LLHEDVTMSM PPLGLWLRGH ADVRAWMLGT GQGCRGSRLL PTVANGHPAF GQYRPSATGS 
GHDPWGLVVL EISAGRVAGI NTFLDVERLF PLFGLPARLP G