Gene Emin_1390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1390
Symbol
ID	6262862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1491357
End bp	1492346
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	41%
IMG OID	642611870
Product	DNA-directed RNA polymerase, alpha subunit
Protein accession	YP_001876276
Protein GI	187251794
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTTTA ATCAGTTAGT TTTACCGACA AAAATTCAGT TGGATGAAAA AACAGTAACC 
CCGTTTTACG GTCGCATAAT AGCGGAACCG TATGAAAGCG GCTATGGTCA TACTGTTGGA 
AATTCACTTA GAAGAATTTT ACTTTCGGGA CTTGACGGTT CGGCTGTAAC GGCTGTCAGA 
GTTAGGGGTG CTGTACACGA ATACAGCACA ATCCCCAACG TTAAGGAAGA TGTTATCAAT 
ATTTTGCTCA ACCTTAAAAA ATTAAGAGTT AAACTTGAAG GGAAAAACAG AGAATATGTT 
TATTTAACTG CTTCTAAACC CGGCAAAGTA ACGGCAAAAG ATATTGCGGA AGTATCCGGC 
GTTGAAATCA TTAATAAGGA TTTGGAAATC GCTAATTTAG AACAGGGCGG CAAACTTGAG 
CTTGAAATTG AAATTTCACA AGGCAAAGGT TATGTTCCTG CGGAAGATTT AAGCAAAATC 
CAAAGACCTG CGGGCTTTAT TCCCGTGGAC GCAATTTTCT CACCCATTCT TAAGGTTCAC 
TATGATGTTG AACCCGCGCG CGTAGGGCAG AAAACGGATT ATGACAGGCT TGTTATACAA 
ATAACCACAG ACGGTACTCT TGAACCTGCG AAGGCTTTAC ATAAAGCGGC GGTCCTTCTT 
TCACAATCAC TTCATATTTT CACGATTGAA GGTGAAGAAG TTAACGCTGC GGCGCCTGAA 
ACTGAGCCTT TGTCAACCAC AGGCAGCGTA AGCGGCGTAA GCGCGGTTAA CAGCAAAGTT 
GAAGAACTTT TAAACCAGTC TGTTGAGTTT ATTGAACTTT CATCACGTTC AATTAACTGC 
CTTAAATCAG AAGGCGTAAA CACGGTTAAA GATTTGGTAA GCAAGACTGA AGATGATCTC 
AAAATGATAA AGAACTTTGG TACTCGTTCA CTTGATGAGG TTAAAGAAAG ACTTGCGGAA 
ATGAATCTTT CCCTCGGTAT GAAATTTTAA

Protein sequence

MAFNQLVLPT KIQLDEKTVT PFYGRIIAEP YESGYGHTVG NSLRRILLSG LDGSAVTAVR 
VRGAVHEYST IPNVKEDVIN ILLNLKKLRV KLEGKNREYV YLTASKPGKV TAKDIAEVSG 
VEIINKDLEI ANLEQGGKLE LEIEISQGKG YVPAEDLSKI QRPAGFIPVD AIFSPILKVH 
YDVEPARVGQ KTDYDRLVIQ ITTDGTLEPA KALHKAAVLL SQSLHIFTIE GEEVNAAAPE 
TEPLSTTGSV SGVSAVNSKV EELLNQSVEF IELSSRSINC LKSEGVNTVK DLVSKTEDDL 
KMIKNFGTRS LDEVKERLAE MNLSLGMKF