Gene Acid345_4296 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4296
Symbol
ID	4071869
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	5103453
End bp	5105177
Gene Length	1725 bp
Protein Length	574 aa
Translation table	11
GC content	57%
IMG OID	637986329
Product	sigma 38, RpoS
Protein accession	YP_593370
Protein GI	94971322
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02393] RNA polymerase sigma factor RpoD, C-terminal domain [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.939988
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCTCTCG ACGACAAGTA CGACGATATC AAAAAACTGA TTGATACCGG CAAGGAAAAG 
GGTTACCTGA CGTACAGCGA GGTGAATGAT CTCATCCCGC ACGACGTTCA CTCGCCCGAC 
GATCTTGATG ATCTCCTGAC GACGATCGGT ACGCAAGGCA TTGACGTTCT CGAAGGTCCG 
GGAAAACTTC CCTCCGCCGC AGTTCTCGAC AAGCGCTATG ACGATGTCGA GGCCGGCGAA 
GAGGAGATGG AACTCGACCT CACTCCGGGA GCGCTCGAAA AGACGAATGA CCCCGTGCGC 
ATGTATTTGC GCGAAATGGG CACGGTACCG CTGCTGACAC GTGAAGGCGA AGTTGAAATC 
GCCAAGCGTA TCGAGCGCGG ACAACTTCGC GTATTAAAAG CAATCTCGCG TTCTCCCATC 
GTCATTCGCG ACATCATCGC GATTGGCGAA GACCTGAAGC GCGGCGTGCG CAGCATCAAG 
GAAATCGTGA TCTTCGATGA AGAAGAAATC ACGGATGAAG TCCTTGCTGC TCGCCTGAAA 
GACACCACCG GGCGCATCGA TGAGCTGAAC AAGCACTACA AGAAGAGTTC CCAGCTCGAG 
CAGAAGCTTG AAGAGATTGC TCCCGGCGGC GTTAAGGAAA TCAAGGACAA GAAAAAAGCA 
CGCGACGTGC GCAAGGTCCG TTGGACGCTG GGCCGCGAAT TGGTCTCGAT CTCGCGCATC 
ATTCGCAAGA TCAACTTCAC CAACGTCGAA CGCAAGCGCT TGATCGATCG CGTGAGCAAG 
ACGGTCGAGA ACCTGCGCAT TCTCGAGCGC CAGGTTTCGC ATCTCGAGCA TCGTGCCAAC 
GAAACGCGTT CGGAAGAGAC GAAGAAAGAG CTCAAGAAGC AGAGCCGCAC CCTTAAGGGC 
GACCTGGAGC GCATGGAGCA GGAGGCTGGC GTTTCCATCG CCGAGCTGAA GCGTACCCAG 
CGCGAAATTA TCCAGGGAGA CATGGATGCC GAGCAGGCGA AGAAGGAGCT CATCGAAGCT 
AACCTTCGAC TCGTCGTCTC GATCGCGAAG AAGTACACCA ACCGCGGACT CCAGTTCCTC 
GACCTCATCC AGGAAGGCAA CATCGGCCTG ATGAAAGCCG TGGACAAGTT CGAGTACCGC 
CGTGGCTACA AGTTCTCAAC GTACGCCACG TGGTGGATTC GCCAGGCCAT TACACGCGCG 
ATTGCCGATC AGGCCCGCAC CATCCGTATT CCGGTGCACA TGATCGAAAC CATCAACAAG 
CTCATCCGCA CCTCGCGTCA ACTGGTGCAG GAACTTGGGC GTGAACCGAG CAGCGAAGAA 
ATCGCCAAGC GGATGGATAT CCCCGTGGCG AAGGTCCGCA AAGTGCTGAA GATCGCACAG 
GAACCGATCT CGCTCGAAAC ACCGATCGGC GAAGAGGAAG ATTCACACCT TGGCGATTTC 
ATCGAGGACC GCTCGATGGT TTCGCCGGCC GAGGCCGTCA TCAACGTGAA CCTCAAGGAC 
CAGACAGCCC AGGTCCTGCG CACGCTCACC GCGCGCGAAG AAAAGGTCAT CAAGATGCGG 
TTCGGACTCG AAGACGGTTC AGAGCACACG CTCGAGGAAG TCGGCCAGTC GTTCGCCGTT 
ACACGCGAAC GCATCCGCCA AATCGAGGCG AAGGCGTTGC GCAAGCTGCG TCATCCGTCA 
CGCTCGCGGA AGCTGCGGGC ATTTCTCGAT GGAGTGCGCG ACTAG

Protein sequence

MALDDKYDDI KKLIDTGKEK GYLTYSEVND LIPHDVHSPD DLDDLLTTIG TQGIDVLEGP 
GKLPSAAVLD KRYDDVEAGE EEMELDLTPG ALEKTNDPVR MYLREMGTVP LLTREGEVEI 
AKRIERGQLR VLKAISRSPI VIRDIIAIGE DLKRGVRSIK EIVIFDEEEI TDEVLAARLK 
DTTGRIDELN KHYKKSSQLE QKLEEIAPGG VKEIKDKKKA RDVRKVRWTL GRELVSISRI 
IRKINFTNVE RKRLIDRVSK TVENLRILER QVSHLEHRAN ETRSEETKKE LKKQSRTLKG 
DLERMEQEAG VSIAELKRTQ REIIQGDMDA EQAKKELIEA NLRLVVSIAK KYTNRGLQFL 
DLIQEGNIGL MKAVDKFEYR RGYKFSTYAT WWIRQAITRA IADQARTIRI PVHMIETINK 
LIRTSRQLVQ ELGREPSSEE IAKRMDIPVA KVRKVLKIAQ EPISLETPIG EEEDSHLGDF 
IEDRSMVSPA EAVINVNLKD QTAQVLRTLT AREEKVIKMR FGLEDGSEHT LEEVGQSFAV 
TRERIRQIEA KALRKLRHPS RSRKLRAFLD GVRD