Gene Shel_19710 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shel_19710
Symbol
ID	8395860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Slackia heliotrinireducens DSM 20476
Kingdom	Bacteria
Replicon accession	NC_013165
Strand	-
Start bp	2205629
End bp	2206579
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	60%
IMG OID	644986722
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_003144334
Protein GI	257064662
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00120516
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.467008
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGAGT TCATGAGGCC AACCGTCACA ACTGAAGAAG TGAGCGATAC CGACGCTCGT 
TTCGTTGTGG AGCCGCTCGA GCGTGGTTTC GGCTATACGC TGGGCAACTG CATGCGTCGC 
GTTCTGCTGT CCTCCCTGGA CGGCGCCCGC GCGACCGCCA TCCAGATTGA AGGCGTGCAG 
CACGAGTTCA CGACCGCTGA AGGCGTCATC GAGGATGTCA CCGACATCGT CCTGAACGTC 
AAGGGTCTTG TTTTCGCCGC TCTCACCGAG GACTACACTG AAGCAACCGC AACTATCTCC 
GTCGAGGGTC CCTGCACGGT GACCGGCGCC GACATCCAGG TGCCCACCGA GTTCACCCTC 
ATCAACCCGG AGCATGTCAT CGCGACCGTT GCTGACGGCG GAACTCTCAA CATGAGCATC 
CGTATTGGTG TTGGCCGCGG CTACGTCTCC GCCGAGCGCA ACAAGCGCAC GGAAGACCCG 
ATCGGCATCA TTCCTGTCGA CAGCCTGTTC TCGCCGGTTC GTCGTTGCAC GCTCGCCGTC 
AACGACACCC GCGTGGGTCA GCGTACCGAC TTCGATCAGC TGCTGCTGGA AGTCGAGACC 
GATGGCTCCA TCGCTCCGAA CGAAGCAGTC TGCCGTGCAG CTAACATCAT TAACCAGTAC 
ATGGGTGCTT TCCTGACCCT GGCTGACATC ACCGACGAGG ACGAGGGCGA CATCCCCTCC 
ATCTTCGCCA CCGAAGGCCA GGAGTCCAAC GCTGAGCTTG ACAAGCAGAT CGAGGATCTG 
GACCTTTCCG TCCGCTCCTA CAACTGCCTC AAGCGCGCCG GCATCCATTC TGTGCGCCAG 
CTGGTCGAGT TCTCCGAGAA CGACCTGCTC AACATTCGTA ACTTTGGCGC GAAGTCCATC 
GAGGAGGTCA AGGACAAGCT GATCTCCATG GACCTCAACT TGAAGCAATA G

Protein sequence

MAEFMRPTVT TEEVSDTDAR FVVEPLERGF GYTLGNCMRR VLLSSLDGAR ATAIQIEGVQ 
HEFTTAEGVI EDVTDIVLNV KGLVFAALTE DYTEATATIS VEGPCTVTGA DIQVPTEFTL 
INPEHVIATV ADGGTLNMSI RIGVGRGYVS AERNKRTEDP IGIIPVDSLF SPVRRCTLAV 
NDTRVGQRTD FDQLLLEVET DGSIAPNEAV CRAANIINQY MGAFLTLADI TDEDEGDIPS 
IFATEGQESN AELDKQIEDL DLSVRSYNCL KRAGIHSVRQ LVEFSENDLL NIRNFGAKSI 
EEVKDKLISM DLNLKQ