Gene Acid345_1705 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1705
Symbol
ID	4070488
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2069604
End bp	2070719
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	61%
IMG OID	637983713
Product	hydrogenase expression/formation protein HypD
Protein accession	YP_590780
Protein GI	94968732
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0409] Hydrogenase maturation factor
TIGRFAM ID	[TIGR00075] hydrogenase expression/formation protein HypD

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.340264
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTTTG TCGATGAGTA CCGCGACCGC GAAAAAGCTG AGCAATACGC ACGCGCCATT 
CGAACCGAAG CCACGCGCCC CTGGTCCATC ATGGAAGTCT GCGGCGGTCA GACCCACACC 
ATCGTCAAGT ACGCGATTGA CGAAATCCTG CGCGACAAGA TCACGCTCCT CCATGGTCCC 
GGCTGCCCAG TGTGCGTCAC GCCACTCGAG TTGATCGACA AAGCTTGCGA GATTGCGACG 
CGGCCCGACG TCATCTTTTG TTCGTATGGC GACATGCTTC GAGTGCCCGG ATCGCACACA 
GATTTGTTCA CCGTGAAAGC CAGGGGCGGC GATGTGCGCA TCGTGTACTC GCCGATGAAC 
GCACTAGAGC TTGCGAAAGC GAACCCAACG AAGCAGGTTG TCTTCTTCGC GGTTGGCTTC 
GAAACCACCG CGCCCGCCAA TGCCATGGCC GTATTCCAAG CCAAGCAGCA AGGCATCTCG 
AACTTCTCGG TGCTCGTCTC GCACGTGCTT GTGCCGCCCG CGATTGAGGC CGTGCTGAGC 
GCACCCGACA ACCGCACGCA AGCGTTTCTG GCTGCCGGAC ACGTCTGCAC TGTGATGGGA 
TATGAAGAGT ACCGGCCGCT ATCAGAGAAA TATCGCGTGC CGATCGTCGT CACCGGCTTT 
GAGCCACTCG ACATTCTCCA GGGCGTGTTG ATGTGCGTAC GGCAGCTTGA GAACGGTCGC 
GCTGAGGTTG AGAACCAGTA CGCGCGCTCG GTGCGCGAGT TTGGCAATGT TCCGGCGCAG 
GATCTCATCG GCCAGGTCTT TCGTGTGATT CCGCGCAAGT GGCGCGGCGT TGGCGAGATC 
CCGCAGAGCG GCTTCGGTCT CGCAGCGGAG TTCGCCGAAT ACGACGCGGA GTTGCGCTTC 
GGTGTCGCGG ACCTCACGGT AGAAGAGGAC CGCGAGTGCA TCGCCGGAGA GGTTTTGCGT 
GGTGTGAAGA AGCCGCAGGA GTGTCCGGCG TTCGGCGGGC GCTGCACGCC AGATCATCCA 
CTGGGAGCGA CAATGGTCTC GAATGAAGGC GCCTGTGCTG CGTACTACCA ATACCGGCGG 
CACGAAGCTA AGGCCGCGGT CGGGAGCGAA CGATGA

Protein sequence

MKFVDEYRDR EKAEQYARAI RTEATRPWSI MEVCGGQTHT IVKYAIDEIL RDKITLLHGP 
GCPVCVTPLE LIDKACEIAT RPDVIFCSYG DMLRVPGSHT DLFTVKARGG DVRIVYSPMN 
ALELAKANPT KQVVFFAVGF ETTAPANAMA VFQAKQQGIS NFSVLVSHVL VPPAIEAVLS 
APDNRTQAFL AAGHVCTVMG YEEYRPLSEK YRVPIVVTGF EPLDILQGVL MCVRQLENGR 
AEVENQYARS VREFGNVPAQ DLIGQVFRVI PRKWRGVGEI PQSGFGLAAE FAEYDAELRF 
GVADLTVEED RECIAGEVLR GVKKPQECPA FGGRCTPDHP LGATMVSNEG ACAAYYQYRR 
HEAKAAVGSE R