Gene Acid345_4010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4010
Symbol
ID	4071146
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4737385
End bp	4738515
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	58%
IMG OID	637986037
Product	Rieske (2Fe-2S) protein
Protein accession	YP_593084
Protein GI	94971036
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.514457
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCACGG CATATACCAA CATCAGACCG GCGCTTGACG CTTCGGAAGC GATGACGCTG 
CCGCAGCAGT ATTACACCGA TCCGGCACAT TTTCAGCGCG AGATGGAGGC CATTCACTTC 
GACATGTGGT TGTGCGCCGG ACGCACCAAC CAGATTCCGA ATGCCGGCGA CTACTTCACG 
CGCCGCGTGG CCAATGCCAG CGTGATCATT GTGCGCGACG AACAGGGCGG CATTCGCGCC 
TTCCACAACG TCTGCCGGCA TCGTGGTACC CAGCTGTGTA AACAGGAGTC AGGCAGCTTC 
AGCGGGAGCA TCCAGTGCGG CTACCATGCC TGGACTTACA AGCTGGATGG CGGGCTGCTG 
CGCGCCCCAC ACATGGAAAA AGTTGAGGGC TTCTGCGAGG CCGATTATCC GCTCAACCAC 
GTGGCTGCGG AGGTTTGGGA TGGGCATATC TTCATCAATC TCTCGGCGCA TCCGATACCG 
TTCTCGGAGC ACCTGGCCGG GCTCGACCAG AAGTTTCGTC CGTGGCGGAT GGAAGAATTG 
CAGATGGTGG AGCGGCGCGT CTATCACCTG AAGGCCAATT GGAAGCTGGT CATCCAGAAC 
TACTCGGAAT GCCTGCACTG CCCGATTGTT CATCCGCTGT TGCAGAAGCA GTCGCATTAC 
ATGAGTGGCG ATAACGAACC GCCGCAACCT ACCTACCTGG GCGGACGCAT GGACCTCCGC 
GATGGCGTCA AGAGCTTAAC GATGGATGGC AATTCCATCC GCTGTGCGCT GCCGGGTTTG 
AGCAGCGCTG ACGAGCGGCA TGTCTATTAC TACTGCCTGC TGCCGAACTT CTTTTTGAAC 
CTGCATCCGG ATTACATGCT GACCTTCACC ATGTGGCCGA AGGCCGCGGA CCAGACGGAG 
ATCGTCTGCG AATGGCATTT CCACCCGGAT GAGATTGCCA AGCCGGGTTT CAACCCCAAC 
GATGCGATTG AATTCTGGGA CATCACCAAC AAGCAGGACT GGGAACTCTC CGACCTGGCA 
CAGGCAGGCA TCTCATCTAA GGGCTATCAG CCTGGACCGT ATTCCAACCG TGAAGAATTG 
CTGCTGGCGC TGGACCGCTT TGTGCTGGAA CGGACTCAGG GAAGGAAATG A

Protein sequence

MSTAYTNIRP ALDASEAMTL PQQYYTDPAH FQREMEAIHF DMWLCAGRTN QIPNAGDYFT 
RRVANASVII VRDEQGGIRA FHNVCRHRGT QLCKQESGSF SGSIQCGYHA WTYKLDGGLL 
RAPHMEKVEG FCEADYPLNH VAAEVWDGHI FINLSAHPIP FSEHLAGLDQ KFRPWRMEEL 
QMVERRVYHL KANWKLVIQN YSECLHCPIV HPLLQKQSHY MSGDNEPPQP TYLGGRMDLR 
DGVKSLTMDG NSIRCALPGL SSADERHVYY YCLLPNFFLN LHPDYMLTFT MWPKAADQTE 
IVCEWHFHPD EIAKPGFNPN DAIEFWDITN KQDWELSDLA QAGISSKGYQ PGPYSNREEL 
LLALDRFVLE RTQGRK