Gene Anae109_1938 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_1938
Symbol
ID	5376617
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	+
Start bp	2198367
End bp	2199386
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	65%
IMG OID	640843447
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_001379125
Protein GI	153004800
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGATC CCATCGTCAC GAAGAACTGG CGCGACCTCA TCAAGCCGCG CGGCCTGGTC 
GTGGACCAGG AGAGCCTCTC CAACACCTAC GGGAAGTTCG TCGCCGAGCC GCTGGAGCGC 
GGCTTCGGCA TCACGCTCGG CAACTCGCTG CGCCGCGTGC TCCTCTCGAG CCTGCAGGGC 
GCCGCCATCA CCTCGGTGAA GATCGAGGGC GTCGAGCACG AGTTCATGAC GATCCCGGAG 
GTGGCCGAGG ACGTCACCGA CATCATCCTC AACCTGAAGG AAGTCCTCCT CCAGATCCAC 
ACGAACGAGG TGAAGACCCT CCGGATCGAG GCGGACGGTC CCCGCGAGAT CAAGGCGGGC 
GACATCATCG CCGACGGTCA GGTGGAGATC CTGAACCCCG GCCACCACAT CCTCACCATC 
AGCGAGGGTG GTCGGGTGCG GATGGAGATG ACCGCGCGCC GCGGCCGTGG CTACGTCCCG 
GCCGACAAGA ACAAGGTGCC GGGCCAGCCC ATCGGGACCA TCCCCATCGA CGCGCTGTTC 
AGCCCGATCC GGAAGGTCAA CTACCAGGTC ACCAACGCCC GCGTCGGCCA GCAGACCGAC 
TACGACAAGC TGTCGCTCGA GGTCTGGACC GACGGGTCGG TGGCGCCGAA CGACGCCGTC 
GCCTACGCGG CGAAGATCGT GAAGGAGCAG CTCTCCATCT TCATCAACTT CGACGAGGCC 
GAGGAGCCCG CCGAGGAGGT GAAGCCGGTC GAGGAGCAGA AGCTCAACGA GAACCTCTTC 
CGGTCGGTGG ACGAGCTCGA GCTCTCCGTG CGGAGCGCGA ACTGCCTCCA GAACGCCAAC 
ATCAAGACGA TCGGCGATCT CGTCCAGAAG ACGGAGGCCG AGATGCTGAA GACGAAGAAC 
TTCGGCCGGA AGTCGCTCAA GGAGATCAAG GAGATCCTGG CCGAGATGGG CCTCTCGCTC 
GGGATGAAGC TCGAGAACTG GCCGCCCAAG GCGGCCCCGC AGGGCGCGCC CAAGGTCTAG

Protein sequence

MVDPIVTKNW RDLIKPRGLV VDQESLSNTY GKFVAEPLER GFGITLGNSL RRVLLSSLQG 
AAITSVKIEG VEHEFMTIPE VAEDVTDIIL NLKEVLLQIH TNEVKTLRIE ADGPREIKAG 
DIIADGQVEI LNPGHHILTI SEGGRVRMEM TARRGRGYVP ADKNKVPGQP IGTIPIDALF 
SPIRKVNYQV TNARVGQQTD YDKLSLEVWT DGSVAPNDAV AYAAKIVKEQ LSIFINFDEA 
EEPAEEVKPV EEQKLNENLF RSVDELELSV RSANCLQNAN IKTIGDLVQK TEAEMLKTKN 
FGRKSLKEIK EILAEMGLSL GMKLENWPPK AAPQGAPKV