Gene Acid345_3038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3038
Symbol
ID	4071945
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3605562
End bp	3607133
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	57%
IMG OID	637985057
Product	radical SAM family Fe-S protein
Protein accession	YP_592113
Protein GI	94970065
COG category	[C] Energy production and conversion
COG ID	[COG1032] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.345739
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGGGTACG ACCCTAAGCA GTGTATAAAC AGTGTCCAAA TCCGCCCGAG TACTCACATG 
GGACCCATGA AGAAATTCAA AGCGCTGTTT GTGCACCCAA GTGCACTGAT GTCGTCCAAA 
GTGTTTTTGC GTTTGGAGCC GATTGGCTGC GAGCTAGTGG CGGCGGCCTG CAAGGCTGCG 
GGATATGACG TCCGGCTGCT GGATCTGCAG ATCTTTTCGC ACAAGGATTA TTTCCGCATT 
CTTGATGAGT GGAAGCCGGA TGCGATTGGG TTCTCTCTGA ACTATTTGCC TAACGTTCCC 
GAAGTTGTGG ATTTGGCGAA AGAGACGAAG CGGAAGATGC CGGGCGTGTT TTTCTTCGTC 
GGCGGGCATA GCGCGTCGTT TGTGGCGAAG GACATTTTGA ACCACGCCGA AGGCGCGATT 
GATTGCGTAG TGCGCGGCGA GGGCGAGGGA GTCGCTCCAC GTGTTTTGGA AGCCGCGGCA 
GACGATCGCA AGCGGGTGCA TGAATTGCCG GGTGTGGTGT CCCTGGATGG CGAAGGGCCG 
CATGCGGAGA TGGTGAAGTC GATTGACGAT TTGCATCCGG CACGCGAGCT GACTTCAAAG 
CGGAAGAGTT ATTTCATCGG GGTGCTGGAT CCGGCAGCGT CGGTGGAGTT CACGCGCGGG 
TGTCCGTGGG ATTGCGTGTT CTGCAGCGCG TGGACGTTTT ATGGACGCAG CTATCGGAAG 
CGCAGTCCGG AAAGCGCCGC GGAAGAGATG GCTCGCATCA AGGAGCCGGG CGTTTTCCTG 
GTGGACGATG TGTGCTTTAT CGAGCCCGAG CATGGGTTCG CCATCGGTCG AGAACTCGAG 
AAACGCAACG TGAAGAAGGA GTACTACCTC GAGACCCGTG GCGACGTCCT TCTGCGCAAC 
AAAGAAGTGT TCAAGTACTG GCGCAAGCTG GGGCTGGAAT ATATGTTCCT CGGGCTCGAG 
GCGATCGACG ACGAAGGTCT GAAGGCGAAC CGCAAACGCA CGACGGCCGG CAAGAACCTC 
GAGGCGCTGG AGTTCACGCG CAAAGAGGGA ATCACGGTCG CACTGAACAT CATTGCTGAT 
CCGAGCTGGG ACAAGGCGAA ATTCGCGGCG GTGCGCGAGT GGTCGTTGAG TGTGCCGGAG 
ATCGTTTCGA TATCGGTGAA TACGCCGTAT CCGGGGACGG AGTCGTGGCT GACGGAGTCG 
CGCGAATTCA GCACTCGGGA TTACCGGCTG TTCGACGTGC AGCACGCGGT GATGCCGACC 
AAGATGTCGC TGGAAGAGTT CTATCGAGAG CTCGTCAATA CGCAGAAGGC GATGACCATG 
AAGTATATGG GCTGGCGCGC AGCGCTGGAT GCGACGTCGA TTGCGGCGAA GCTGTTGATG 
CGTGGGCAGA CGAACTTTGT GAAGATGCTG TTCAAGTTCG ACAGCGTGTA CAACGCCGAG 
CGGCAGATCG CCGAGCATCG CGAGCCGGTG AAATATGAGA TGAGCATGCC GCAACGCATG 
ACTGGGAAGG TTGACCGGTC GAAACTGTAT ATCCATCCGC AGGAACTGGT GAAGCTGCAG 
CCGCAGGGAT AG

Protein sequence

MGYDPKQCIN SVQIRPSTHM GPMKKFKALF VHPSALMSSK VFLRLEPIGC ELVAAACKAA 
GYDVRLLDLQ IFSHKDYFRI LDEWKPDAIG FSLNYLPNVP EVVDLAKETK RKMPGVFFFV 
GGHSASFVAK DILNHAEGAI DCVVRGEGEG VAPRVLEAAA DDRKRVHELP GVVSLDGEGP 
HAEMVKSIDD LHPARELTSK RKSYFIGVLD PAASVEFTRG CPWDCVFCSA WTFYGRSYRK 
RSPESAAEEM ARIKEPGVFL VDDVCFIEPE HGFAIGRELE KRNVKKEYYL ETRGDVLLRN 
KEVFKYWRKL GLEYMFLGLE AIDDEGLKAN RKRTTAGKNL EALEFTRKEG ITVALNIIAD 
PSWDKAKFAA VREWSLSVPE IVSISVNTPY PGTESWLTES REFSTRDYRL FDVQHAVMPT 
KMSLEEFYRE LVNTQKAMTM KYMGWRAALD ATSIAAKLLM RGQTNFVKML FKFDSVYNAE 
RQIAEHREPV KYEMSMPQRM TGKVDRSKLY IHPQELVKLQ PQG