Gene Anae109_4037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_4037
Symbol
ID	5375442
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	4727443
End bp	4728432
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	76%
IMG OID	640845564
Product	RNA polymerase factor sigma-70
Protein accession	YP_001381199
Protein GI	153006874
COG category	[K] Transcription
COG ID	[COG1595] DNA-directed RNA polymerase specialized sigma subunit, sigma24 homolog
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family [TIGR02960] RNA polymerase sigma-70 factor, TIGR02960 family

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGGAC CCGCCGCTCA CCTCGAGGAG CACCGCGCCG CGCTCACCGG GCACTGCTAC 
CGGATGCTCG GCTCGGTGGT GGACGCCGAC GACGCCGTCC AGGAGACGAT GGTCAGGGCC 
TGGAGAGGCC TCGACCGGTT CGACGGGCGC TCGTCGCTGC GCACCTGGCT CTACCGCATC 
GCGACGAACG TGTGCCTCGA CGCGCTGGCC GACCGCTCGC GGCGGGAGCG CCCGGTGGAG 
GAGGGGCCGG CCGGATCGGT GGACGACCCG CTGGAGACGC GTCCACGTTC CCACTGGCTC 
GAGCCGGTGC CCGACGCGCG GGCCGTGCCG GCGGACGGGG ACCCGGCGGA GCGGGTGGTG 
CTCCGGCAGA GCATCCGGCT CGCCTTCGTG GCGGCGCTCC AGCACCTCCC GCCCCGGCAG 
CGCGCCGCCC TGCTGCTCAC CGACGTGCTC GGCTGGTCCG CCGCGGAGGT CGCGCAGGGC 
CTCGACACCT CCGTCGCCGC CGTGAACAGC GCGCTGCAGC GGGCGCGCGC CACGCTCGCC 
ACGCGCGACC TGGGGGACGA CCCGACGGGC ACGCTCTCCG ACGCGCAGGC AGCGCTGCTC 
GACCGTTACG TCGCGGCGTT CGAGCGCTAC GACGTGGACG GGCTGACCGC GCTCCTGCAC 
GAGGACGCGG CCATGTCGAT GCCGCCGCAT GCCCTGTGGC TGCGCGGGAG GGAGGCGGTC 
CGTGCCTGGC TGCTCGGACG CGGGCTGGGT TGCCGTGGCT CGCGGCTGCT CCCGACCGCC 
GCGTGCGGCG CCCCCGCCTT CGCCCAGTAC CGTCCCGCGC CGCAGGGGGG GCACCGGGCG 
TGGGGGCTCA TCGTGCTGGA CCTCGCCGGC GACCGCATCT CGGGGTGGAC CACCTTCCTC 
GACACCGAGT CGCTCTTTCC GAGGTTCGAG CTCCCGCTGG AGCTCCCGCC GGTCGACGCG 
GCCTCGAGCT CGCCGAGCTC GCCCGCCTGA

Protein sequence

MPGPAAHLEE HRAALTGHCY RMLGSVVDAD DAVQETMVRA WRGLDRFDGR SSLRTWLYRI 
ATNVCLDALA DRSRRERPVE EGPAGSVDDP LETRPRSHWL EPVPDARAVP ADGDPAERVV 
LRQSIRLAFV AALQHLPPRQ RAALLLTDVL GWSAAEVAQG LDTSVAAVNS ALQRARATLA 
TRDLGDDPTG TLSDAQAALL DRYVAAFERY DVDGLTALLH EDAAMSMPPH ALWLRGREAV 
RAWLLGRGLG CRGSRLLPTA ACGAPAFAQY RPAPQGGHRA WGLIVLDLAG DRISGWTTFL 
DTESLFPRFE LPLELPPVDA ASSSPSSPA