Gene Acid345_1656 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1656
Symbol
ID	4069804
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2002212
End bp	2003372
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	58%
IMG OID	637983665
Product	sigma-54 activating ATPase
Protein accession	YP_590732
Protein GI	94968684
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3604] Transcriptional regulator containing GAF, AAA-type ATPase, and DNA binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0864275
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTCTC CAATCATCAA CGAACTCACC GCGAACCCGG GGGTTCTCAT TGCAAGTCCG 
AACCCGGCGT TTCGTCGCCA GGTGATCGAC ACGCTGCCGA CTACCTGGCG GCCTGTACTG 
GAGGCGCAGG GAGGGGCGGA CGCGCTTGGC AAGCTCGAAG CCAGCGATTG CCGAATGCTG 
CTTCTCGATC GGCAGTTGCT GGACCTCGAT GTCGAGGAAT TGGCGGGACT GGTGAGACTC 
CGGTATCCGG GGGTGGACGT TCAGACGCTG GAAACGCCTC GCATAAAAGG CAGCGCGGTT 
GATATTCCCG AGAGGCATAG CAACATCAAC CAACTCGCGA TTGACACGCA ACTCTCACCG 
CTGGATGGCA TGATCGGCAA TTCGGAGCGA ATGGGATCGG CGTATCGAGC TATCCGCAAA 
GTCGCACCAC GGGACACGCC GGTATTGGTC ATGGGAGAGA CGGGCACGGG AAAAGAGCTG 
GTAGCACAAG CAATTCATCG GCTCAGCCGC CGCTGTGAAA AAGCCATGGT AGTGATCAAC 
TGTGCGGCCA TTCCCGAGAG TCTTTTGGAA AGCGAACTCT TTGGGTATGT CCGCGGCGCG 
TTCACGGGCG CAGCACAGAC GCGGCAAGGA CGGATACAGG CGGCGAACGG GGGGACCTTG 
TTCCTGGATG AAATCGGTGA GATGCCGTTC GAATTGCAGG CAAAGCTCCT CCGCTTTCTC 
GAAACCGGCG AACTGCAACG CCTCGGAAGC TCTGAGACTT GGCGAGTCGA TGTGCGCTTG 
GTTGCGGCGA CGAACCGGAA CCTGCGAGAG AGCGTCCAGA TGCAACGGTT TCGCGCTGAC 
CTGTTCTATC GGCTTTGCGT TTTTCCGATC GTCCTACCAC CTCTGCGAGA CCGAAACGGG 
GATATTTCCC AGCTTGCGAC CCACTTTCTC TCTACCTTCG ATCGCGATTG TTACTTCACC 
CCGGCGGCAA TCAAGAAGCT CGACGCTCAT GACTGGCCGG GAAACGTACG CGAACTGAAG 
CATGTGATCG AGAGGGCGAC TATTCTCGCG AACGACAAAG CCATCACGGT CGAGGACGTG 
GTCCTCGATG CGGAAGCAGT CATGAACTAT GCAACCGATC TCAGCGTGCG GGGAGTGAAC 
CATGCCGGAA CTTTCAACTG A

Protein sequence

MISPIINELT ANPGVLIASP NPAFRRQVID TLPTTWRPVL EAQGGADALG KLEASDCRML 
LLDRQLLDLD VEELAGLVRL RYPGVDVQTL ETPRIKGSAV DIPERHSNIN QLAIDTQLSP 
LDGMIGNSER MGSAYRAIRK VAPRDTPVLV MGETGTGKEL VAQAIHRLSR RCEKAMVVIN 
CAAIPESLLE SELFGYVRGA FTGAAQTRQG RIQAANGGTL FLDEIGEMPF ELQAKLLRFL 
ETGELQRLGS SETWRVDVRL VAATNRNLRE SVQMQRFRAD LFYRLCVFPI VLPPLRDRNG 
DISQLATHFL STFDRDCYFT PAAIKKLDAH DWPGNVRELK HVIERATILA NDKAITVEDV 
VLDAEAVMNY ATDLSVRGVN HAGTFN