Gene Lcho_3542 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_3542
Symbol
ID	6160914
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	-
Start bp	3959226
End bp	3960167
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	68%
IMG OID	641666315
Product	RNA polymerase, sigma 32 subunit, RpoH
Protein accession	YP_001792561
Protein GI	171060212
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02392] alternative sigma factor RpoH [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0000381173
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTCTACCA TGAACCTGTC TGCATCTGCT GCCTCGACCG CCGTCATCGT CCGTGATCCG 
TGGGCCCTGG TTCCCTCGCT GGGCAATCTG GACGCCTACA TCAGCGCGGT CAACCGTCTG 
CCGCTGCTCA CGCACGAGGA AGAAGTGAGC TTCGCGCGGC GTCTGCGTGA CAGCCAGGAC 
GTCGAAGCGG CCGGCCGGCT GGTGCTGTCG CATCTGCGCC TGGTGGTGTC GGTGGCGCGT 
CAGTACCTCG GTTACGGCCT GCCGCACGGC GACCTGATCC AGGAAGGCAA CGTCGGCCTG 
ATGAAGGCGG TCAAGCGTTT CGACCCCGAG CAGGGCGTGC GCCTGGTCAG CTACGCCATG 
CACTGGATCA AGGCCGAGAT CCACGAGTAC GTCCTGAAGA ACTGGCGCGT GGTCAAGCTC 
GCCACCACCA AGGCGCAGCG CAAGCTGTTC TTCAACCTGC GCTCGATGAA GCGCCAGCTC 
AAGGGCGAAG CCGCCGACGG CGACACCCAT CGCAGCTCGC TGACCGAAGC CGAGATCGAC 
ACCGTCGCGC GCGAACTCAA CGTCAAGCGC GAAGAAGTGA TCGAGATGGA GGCGCGTTTC 
GCCGGCGGCG ACGTGGCGCT CGAGCCCGGC TCCGACGAGG ACGACGAGAG CTACACGCCG 
ATCGCCTACT TGGCCGACGA GCGCCAGGAG CCGACCCGCG CGCTCGAGGC CGCGCACCGC 
GACGAACTCG CCGGCCCCGG CCTGCTGCGC GCGCTCGACG CGCTCGACGC CCGCAGCCGC 
CGCATCGTCG AGGAGCGCTG GCTGAAGGTC AACGACGACG GCTCGGGCGG CCTGACGCTG 
CACGACCTGG CGGCCGAATA CGGCGTCAGC GCCGAACGCA TCCGCCAGAT CGAGGTGGCG 
GCGATGAAGA AGATGCGCAA GGCGCTGGTC GAACACGCCT GA

Protein sequence

MSTMNLSASA ASTAVIVRDP WALVPSLGNL DAYISAVNRL PLLTHEEEVS FARRLRDSQD 
VEAAGRLVLS HLRLVVSVAR QYLGYGLPHG DLIQEGNVGL MKAVKRFDPE QGVRLVSYAM 
HWIKAEIHEY VLKNWRVVKL ATTKAQRKLF FNLRSMKRQL KGEAADGDTH RSSLTEAEID 
TVARELNVKR EEVIEMEARF AGGDVALEPG SDEDDESYTP IAYLADERQE PTRALEAAHR 
DELAGPGLLR ALDALDARSR RIVEERWLKV NDDGSGGLTL HDLAAEYGVS AERIRQIEVA 
AMKKMRKALV EHA