Gene Apre_1547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1547
Symbol
ID	8398359
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1682522
End bp	1683478
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	36%
IMG OID	644995911
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_003153289
Protein GI	257067033
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGAAA AATTAGATAC AAATATACAG ATATTGGATA TAGACGAAGA AGAAAATTAC 
GGTAAATTCG CCCTATATCC ACTTGAGCGA GGATATGGTA CAACCATTGG AAACAGTATG 
AGAAGGGTGC TTTTATCATC CTTACCTGGT TCTAGCGTCT CAAAAATACT TATAGAAGGA 
GTGCTTCACG AATTCTCCAC TATAGATGGA GTAGTAGAAG ATGTTCCTGA AATAGTTCTA 
AACATTAAGG GTCTAGACGT TACAAAACAT GTAGATGAAG ATGTAACATT GTTTTTAGAC 
ATTGAAGGAC CAAAGATTGT AACAGCAAAA GATATCAAAG CAGATAGTTC CGTAGATATA 
GCAAATCCTG ACCACTACAT CGCAACAGTT AACGAGAAGT CAAGACTATT TATAGCGATG 
GATGTTACAG ATGGTAAGGG TTATAGGGTA TCTGATGATA ACAAGAAAGA AAGCGACCCA 
ATCGGTGCAA TCGCAATTGA TTCATCATTT ACTCCAGTTG AGAAAGTAAA CTTTACTGTA 
GAAAATACAA GAGTAGGCGA ATCAACCGAC TATGACAAAC TCGTTATGGA AGTTTGGACA 
AATGGAACTA TTACACCACA AGAAGCCCTT GCAGAAGGAT CATCAATCTT AATAGAAAAC 
TTCTCTTTCT TCAACGAATT GCCTAACCAA CAATTCCCAC CTGAAGTGGA AGAAGAAGAA 
ATAGAAGAAG TAGAAGAAGA AGATAGTCTT TCAGAAGATT TGGCAATGAC AATAGAAGAA 
TTAGACCTAA GTCTAAGATC ATTTAATTGT CTAAAAAGAG CAGGCTTCGA CAGAGTTGGC 
GATATAATCA AGGTTAGCGA ATCTGAGCTA AAAACAATCA AGAACTTCGG TAAAAAGTCA 
CTCACAGAAG TAATAGAAAA GCTAGACGAG TTAGGTCTAA GCTTAAAAGA TGAATAG

Protein sequence

MIEKLDTNIQ ILDIDEEENY GKFALYPLER GYGTTIGNSM RRVLLSSLPG SSVSKILIEG 
VLHEFSTIDG VVEDVPEIVL NIKGLDVTKH VDEDVTLFLD IEGPKIVTAK DIKADSSVDI 
ANPDHYIATV NEKSRLFIAM DVTDGKGYRV SDDNKKESDP IGAIAIDSSF TPVEKVNFTV 
ENTRVGESTD YDKLVMEVWT NGTITPQEAL AEGSSILIEN FSFFNELPNQ QFPPEVEEEE 
IEEVEEEDSL SEDLAMTIEE LDLSLRSFNC LKRAGFDRVG DIIKVSESEL KTIKNFGKKS 
LTEVIEKLDE LGLSLKDE