Gene Acid345_4240 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4240
Symbol
ID	4073167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5027197
End bp	5028888
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	60%
IMG OID	637986272
Product	nickel-dependent hydrogenase, large subunit
Protein accession	YP_593314
Protein GI	94971266
COG category	[C] Energy production and conversion
COG ID	[COG0374] Ni,Fe-hydrogenase I large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAAC GAATCACCAT CGATCCGATC ACCAGAATTG AAGGCCACCT CCGCGTAGAT 
GTCCAAGTGG ACAACAACTC GGTCACAAAC GCCTGGGCCT CGTGCACTAT GTGGCGCGGC 
ATTGAAAACA TCCTCAAGGG CCGTGACCCC CGCGATGCAT GGCTCTTCAC CCAGCGTTTC 
TGCGGTGTGT GCACCACCGT GCACGCGATG GCCAGCGTCC GCGCGGTAGA GGATGCGTTG 
AAGCTGGAGA TCCCGCTAAA CGCGCAATAC ATCCGCAACC TCATTCTGAT TGCCCACGCG 
CTGCACGATC ACATCGTGCA TTTCTACCAG CTCTCGGCTC TCGACTGGGT TGATGTCATG 
CAGATTCCGA AAGCCGATCC TGCCGCGACT TCAAAGCTCG CCGAGAGCCT TTCGCCATGG 
TTCCGCAACT CGCGCAACGA ACTCAAGCAG GCGCAGGACC GCGTGAACGC TGTTGCTGCC 
AGCGGCCAGC TCGGCATCTT CGCCAACGGC TACTGGGGAC ACCCAGCGAT GCGCCTCTCG 
CCCGAGGTGA ATCTGCTTGC CTTCTCGCAC TACATGCAGG CGCTGGAGTA TCAGCGCAAA 
GCGCTGCAGA TCGTCGGCAT CCTCGGCTCA AAGACACCGC ACATCCAGAA CCTCACGCCC 
GGTGGTGTCT CGAACGCGAT TGATCTCGAT AGTCAGTCGG CGCTGAACAT GGAGCGCCTT 
GAGATGATCC GCGGCCTCTT TGCAGAGGTC TCGCGTTTCA TCAACGAGGT TTACCTCGTG 
GATGTCTGCG CTGTAGCTTC GATGTACCCC GAGTGGTTCA ATATCGGCAG CGGCGTCACC 
AATTACCTCG CCGTTCCGGA CTTGCCGCTC GACAGCCGCG GTTCCAGCTA CGATCTTCCG 
GGCGGCTACA TCGGTGCAGG AGGACTGAAA TCGTTCCAGA CTGCTTCTGA CGACGCCTTC 
CGCAAAGGCG TGACCGAAGA CGTAACCCAC GCCTACTACT CGGGCGATAA ACCGCTTCAT 
CCCTGGGAAG GCGAGACTAA CCCGCAGTTC ACCGGCTGGA ACGGTGACGA GAAGTACTCC 
TGGGTGAAGG CGCCACGCTT CAACGGCGAT CCTGCGCAGG TCGGTCCACT GGCACAGGTG 
CTGATCGGTT ACACCCAAGG TCACGCGCTC ACCAAGAAGT ATGTCGGCCT AGCTGCGGAG 
AAGGTTCATG CCGTCAGCGG CATCCAACTG CAACCGGCAA TGCTCCACTC CACTCTCGGC 
CGCCACGCCG CGCGCGCCAT CCGCGCCGGC ATGCTCGCCG AGTTGGCGCA AAAGCATCTT 
GACCTGCTCA CCAACAACAT CGCAAAGGGT GACTACTCCG TCTACAACGC ACCGGTCTTC 
CCCAGCCACG AAGTAGAAGG TGTCGGCACC CACGAAGCTC CGCGCGGTAC GCTCTCGCAC 
TGGATTGTGA TCAAAGACGA GAAGATCAAG AATTACCAGG CCGTCGTTCC TTCGACCTGG 
AACGCCAGCC CGCGCGACCA AAAGAACGCG CATGGCCCGT ACGAGGCATC GCTACTGCAC 
ACGCCGCTAG CGCGCCCGCA AGAGCCACTT GAGGTCTTGC GCACCATTCA CTCGTTCGAT 
CCGTGCATGG CTTGTGCCTG CCACACCTTC GATCCATCCG GAAACAAGAT CGCAGCGGTC 
AATATTTTAT GA

Protein sequence

MAKRITIDPI TRIEGHLRVD VQVDNNSVTN AWASCTMWRG IENILKGRDP RDAWLFTQRF 
CGVCTTVHAM ASVRAVEDAL KLEIPLNAQY IRNLILIAHA LHDHIVHFYQ LSALDWVDVM 
QIPKADPAAT SKLAESLSPW FRNSRNELKQ AQDRVNAVAA SGQLGIFANG YWGHPAMRLS 
PEVNLLAFSH YMQALEYQRK ALQIVGILGS KTPHIQNLTP GGVSNAIDLD SQSALNMERL 
EMIRGLFAEV SRFINEVYLV DVCAVASMYP EWFNIGSGVT NYLAVPDLPL DSRGSSYDLP 
GGYIGAGGLK SFQTASDDAF RKGVTEDVTH AYYSGDKPLH PWEGETNPQF TGWNGDEKYS 
WVKAPRFNGD PAQVGPLAQV LIGYTQGHAL TKKYVGLAAE KVHAVSGIQL QPAMLHSTLG 
RHAARAIRAG MLAELAQKHL DLLTNNIAKG DYSVYNAPVF PSHEVEGVGT HEAPRGTLSH 
WIVIKDEKIK NYQAVVPSTW NASPRDQKNA HGPYEASLLH TPLARPQEPL EVLRTIHSFD 
PCMACACHTF DPSGNKIAAV NIL