Gene Paes_2037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_2037
Symbol
ID	6459696
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	-
Start bp	2233993
End bp	2234979
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	44%
IMG OID	642726020
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_002016694
Protein GI	194334834
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.000319536
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.322219
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATATACC AGATGCAGAT GCCTGAGCGA ATCGAGGTGG ATGAGGCAAC ACATAGTGAG 
AGTATAGGAC AGTTTGTGGC TCAGCCTCTG GAAAGAGGAT ATGGTGTAAC CTTAGGTAAT 
GCAATGCGCC GGGTATTGCT GGCATCTCTG CCGGGTACGG CTATTACCGG TATAAAAATA 
GATGGTGTTT TTCATGAGTT TTCGACAATT GACGGCGTTC GTGAAGATGT TCCGGAAATT 
GTCCTTAACC TGAAAAAGGT GCGTTTTAAA TCGACGACGA AGCGAAGCTG TAAAACCAGT 
CTATCCATCG AAGGGCCTGC TGATTTTAAA GCCGGAGATA TCGTCGCTCA GGAAGGTGAG 
TTTGAAGTCC TCAACAAGGA CATGCATATT GCAACCCTTA ATGGTGATGC AAAACTCAAT 
ATAGATATTT ATATCGGACG AGGCAGAGGC TATGTTCCTG CTGAAGAAAA TCGGGGCGAA 
GGTATGCCGA TCGGCTTTAT CGCTATCGAT TCGATTTTTA CACCGATCAA GAATGTCAAG 
TTCTCTGTAG AAAATACCCG TGTCGGTCAG AGAACAGACT ATGAGAAAAT GATTCTCGAC 
GTTGAAACCG ATGGTTCGAT TTCCCCTGAT GATTCAATCA GTCTTGCAGG AAAGGTCATC 
AACGAGCATG TTTCTCTTTT CGCCAATTTT TCTCCTACAG AGGAAGAGTT CGCCGAAGAA 
GAGTACAAGC AGCAGGATGA CGAGTTTGAA AATATGCGAA AACTCCTTCA GACCAGAATT 
GAGGATCTTG ATCTTTCGGT CCGATCACAT AACTGTCTGA GACTTGCTGA AATAGATACT 
CTGGGTGACC TGGTTTCCCG TAAAGAGGAC GAACTGTTGA CATACAAGAA CTTCGGGAAA 
AAGTCGTTGA CAGAGCTTAA AGAGCAGTTA GACAAATGTG AATTGAAATT TGGTATGGAT 
ATTACCAAGT ATCAGATGAA GAGCTAA

Protein sequence

MIYQMQMPER IEVDEATHSE SIGQFVAQPL ERGYGVTLGN AMRRVLLASL PGTAITGIKI 
DGVFHEFSTI DGVREDVPEI VLNLKKVRFK STTKRSCKTS LSIEGPADFK AGDIVAQEGE 
FEVLNKDMHI ATLNGDAKLN IDIYIGRGRG YVPAEENRGE GMPIGFIAID SIFTPIKNVK 
FSVENTRVGQ RTDYEKMILD VETDGSISPD DSISLAGKVI NEHVSLFANF SPTEEEFAEE 
EYKQQDDEFE NMRKLLQTRI EDLDLSVRSH NCLRLAEIDT LGDLVSRKED ELLTYKNFGK 
KSLTELKEQL DKCELKFGMD ITKYQMKS