Gene Apre_1642 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1642
Symbol
ID	8398454
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1784272
End bp	1785303
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	38%
IMG OID	644996006
Product	RNA polymerase, sigma 32 subunit, RpoH
Protein accession	YP_003153384
Protein GI	257067128
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000000192835
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTGATA AAATGGATAA AATAAATTTA AAAGATAAAA AAACCCTAGA GAAATTACAA 
GAGTATCTCA ACTCAGAGGA CTTGACCGAA GAGGAGATTA TCTCAATTCT TGAAGGTTTA 
ACAGAAGAAG AAAAAGACGA GATAATGGAT ATTATATCAG ACGAAGTGGA TGACGATGAT 
GAAGATGATG ACTTTGAAGA AAGAAAGACA AATGTGTCAA AAGCTTCCAT CATGCCTATA 
AGCCGCCGTG ATATGATAGA GCTATCAGAC CTTACTAATG AACAAATAGT GGAACAATTC 
CAAATAGGAA ATCAGAATGC CCTAGCAGCC CTTGTAGAAA AAAACCAAGG ACTTGTTAGA 
AGTAGGGCCT CATATTTCTT TAGATCTCAC GGAAACGATC TAGACCTAGA GGACTTAGTC 
CAATCAGGTA TGCTCGGTAT GATTCGTGCG GCAGAAAAGT TCGACCTATC CCTAGGCTAT 
AAGTTTACAA CCTATGCCTA TAAGTGGATC GATAAGGCCA TAAGAAAGGC CATAAACAAG 
GAAGGCCACA CTATAAGAAT ACCTGCCGGT AAATACCTAA AACTTAATAA GCTTAAGCAA 
ATTCTTAAAG CAAATCCAGA AGCAAGCGAT GAGGAGCTTT ATAGGATTTT GGAAAAGGAG 
GGAATCGATA AGAAACAAGC AGACGACCTT TTCCTAATAA ATAGAAACCA AGTAAACTCC 
ACATCCCTTA ACATCAACTT GGACAGTGAG GATTCGACAG GTGATGAGCT TATGGATATG 
GTAGGAGATG AGTCAACTCC AGTCGATATG CTAATACTCG AAAAAGACAT GGAAAACTTC 
CTCCTTAAGG CCCTAGACCA ACTAACAGAT AGGGAAAAGC AAATCATAAT ATTTAGATAT 
GGACTAGATA ACGAAAAACC TAAGACCCTT GAAGAAATAG GTAAAATCTA CGACTTATCT 
AGAGAAAGAA TCAGACAAAT TGAAAATCAA GCCTTGGGCA AACTGAAAGA ATTTTCTGAA 
AGAGAAGAAT AA

Protein sequence

MGDKMDKINL KDKKTLEKLQ EYLNSEDLTE EEIISILEGL TEEEKDEIMD IISDEVDDDD 
EDDDFEERKT NVSKASIMPI SRRDMIELSD LTNEQIVEQF QIGNQNALAA LVEKNQGLVR 
SRASYFFRSH GNDLDLEDLV QSGMLGMIRA AEKFDLSLGY KFTTYAYKWI DKAIRKAINK 
EGHTIRIPAG KYLKLNKLKQ ILKANPEASD EELYRILEKE GIDKKQADDL FLINRNQVNS 
TSLNINLDSE DSTGDELMDM VGDESTPVDM LILEKDMENF LLKALDQLTD REKQIIIFRY 
GLDNEKPKTL EEIGKIYDLS RERIRQIENQ ALGKLKEFSE REE