Gene Acid345_0795 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0795
Symbol
ID	4068576
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	985164
End bp	986699
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	60%
IMG OID	637982802
Product	thiol oxidoreductase-like
Protein accession	YP_589874
Protein GI	94967826
COG category	[C] Energy production and conversion
COG ID	[COG3488] Predicted thiol oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.39359
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTTCG GTCGTTCCTG GATGTTGATG TGCTCGTTGC TAACCGTCCT GTTGTTGACC 
ACCCTTGTCG CAGCTCAGAA AGATCCCGGA GTACGAAAAG GTGCGCCTGG CGCCGGCACT 
CCGCTCAATG GATTAACGCC AATAGAACTC AACATGTTCT TTGAAGGATT CCAACGCACT 
GTCCAGTTGG AAGGTGTTTG CGATGACTGT ACAGATGTCA CGCTGGGTAC TTTTGTGGAT 
CCGGCCAAGG CCAACTTGGT GACCCAGACG AACTCGTCCG GGCTCGGCGT CCGCTTCAAT 
GGAGACCAGT GCAGCTCTTG CCACAACCAG CCGGCAGTGG GCGGTTCGGG TGGCTTCATG 
GTTCCTAACC CACAAGCTCC GGCGAATCTT CAGCGCCCGC CTGAGAACCC GATGTTCGAT 
CTCATCCCGC ATCGGAAGGG CGCGACGAAC GCGGTACCGT CGTTCATCCA TCAGTATGGG 
CCGATCCGCG AAGTACGTTT TGCACGGAAG CCTGACGGCT CGCCCGATGG CGGAGTCCAT 
CAGCTTTTCA GCGTCGTCGG CCGTTCTGAC ATCTTTCCCG CCGGCCAGGA AAATACCTGT 
ACGAGTGCCG TGTTGCCGCC GACGGACTTC GAGTCGCAAT ACCGTTCTGG TAACCTGCGC 
TTTCGGATAC CGCTGCAACT CTTCGGGCTC GGCATCATCG ACGGAATCCA GGACCGCGAG 
ATTCTCGGCC GGCACCAGGC GACAGCGTCG GTGCGCCAGC TCTTCGGTAT CCAGGGAGTG 
CCCAATCACA GTGGCAATGA CGGCACGATC ACGCGTTTCG GTTGGAAGGC ACAGAACAAG 
TCGATCGCGA TCTTCTCCGG CGAGGCCTAC AACGTGGAGA TGGGCGTGAC CAACGATCTG 
TTCACGCAGG CGACCGACGA GTCACCGCTG TGCACCGCCG ACAAGAGCGA GCCCAACGAC 
ATCACGCGGC TCGACCCTGA CGACACGCGC AACCAGAGCT TCTACAACCC GAACCACGAG 
GTCGCCGACT GGCTGATGTT CGCGATCTTC ATGCGCTTCC TGGACGCGCC GCAACCGGCG 
ACGTTCACGG ACAGCGCCCA ACATGGGCAG CAGCTCTTCG GCACGGGGCC GGACAATCCG 
GGTGTCGGCT GCGTGCTCTG CCATACCGCA ACCATGAATA CTCCGGCGAG GAGCGAGACC 
CCTGCGCTGG AGAATCTGAC GGTGCATCCG TATACCGACC TGCTCATCCA TCACATGGGA 
AGCGGCCTGG CGGACGACAT CACGCAAGGA CAAGCAACCG GCGACATGTT CCGCACTACG 
CCACTCTGGG GAGTCGGCCA GCGCATGTTC TTCCTGCACG ATGGCCGAAC CAGCGACTTG 
CTGCAGGCCA TTGAAGCGCA CGCTTCAGGC GGCGATTCGC ACGGGATGAA ACCGTACGGC 
TACGGGCCAT CGGAGGCGAA CGCCGTGATC CGGAAGTTCA ACGCACTGCC TGCGAAAGAC 
CAGCAATCGG TGCTCGATTT CCTGAGAGCA CTGTGA

Protein sequence

MKFGRSWMLM CSLLTVLLLT TLVAAQKDPG VRKGAPGAGT PLNGLTPIEL NMFFEGFQRT 
VQLEGVCDDC TDVTLGTFVD PAKANLVTQT NSSGLGVRFN GDQCSSCHNQ PAVGGSGGFM 
VPNPQAPANL QRPPENPMFD LIPHRKGATN AVPSFIHQYG PIREVRFARK PDGSPDGGVH 
QLFSVVGRSD IFPAGQENTC TSAVLPPTDF ESQYRSGNLR FRIPLQLFGL GIIDGIQDRE 
ILGRHQATAS VRQLFGIQGV PNHSGNDGTI TRFGWKAQNK SIAIFSGEAY NVEMGVTNDL 
FTQATDESPL CTADKSEPND ITRLDPDDTR NQSFYNPNHE VADWLMFAIF MRFLDAPQPA 
TFTDSAQHGQ QLFGTGPDNP GVGCVLCHTA TMNTPARSET PALENLTVHP YTDLLIHHMG 
SGLADDITQG QATGDMFRTT PLWGVGQRMF FLHDGRTSDL LQAIEAHASG GDSHGMKPYG 
YGPSEANAVI RKFNALPAKD QQSVLDFLRA L