Gene Acid345_1704 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1704
Symbol
ID	4070487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2068555
End bp	2069607
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	61%
IMG OID	637983712
Product	hydrogenase expression/formation protein HypE
Protein accession	YP_590779
Protein GI	94968731
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.337224
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTGA AATCGTTTTC CCTCAACTGT CCCCTGCCAC TAAATACCTC GGCCGTTGTG 
CTACTGGCGC ATGGAGGCGG TGGCCGCCTG ATGCACCAAT TCCTTGAGCA ATACGTCATT 
CCAGCGTTCC AGAACGACCA GCTCGCGACG CGGCACGACG GCGCAGTCTT CGACGTGAAA 
AACGCGCGGC TCGCCTTCAC GACGGACTCC TACGTTGTTA GCCCACTGTT TTTTCCCGGT 
GCGGACATCG GCTCCCTGGC CGTGAGCGGC ACCGTGAACG ATCTCGCAAT GTGCGGTGCC 
CGGCCGCTGT TCCTGAGCGC AGCATTCATC ATGGAAGAAG GACTTCCCTT CGAAACGCTG 
GAGCGCGTGA TTGCTTCCAT GCGCGCGACC GCTGAGGCCG CGGGCGTGCA TATCGTCACC 
GGCGATACCA AGGTTGTGGA CCGCGGCAAG TGCGACAAAC TCTTCATCAA CACCGCCGGC 
GTCGGCGTCA TTGAGCATAC GCAAACGATC GGACCGAGCG CGGTCCGTTC GGGCGACGCG 
ATCCTTCTCA GTGGCGACGT TGGCCGACAC GGCGTAGCCG TGATGGCTAC ACGAGAAGGA 
CTGGAGTTCG CGACGGCGAT TGAATCTGAC TGCGCTCCGC TCGCAGAGCC AGTGCTTGCG 
CTACTCGAAG CCGGCATCGA AGTTCATTGC TTCCGCGATC TGACGCGGGG CGGATTGGCC 
ACCACGCTGG TGGAGATTGC CGAATCGAGC AAGCTTGGAA TTCATATCGC TGAACGCAGC 
GTTCCCGTGG AAGAAGGCGT GCGCGGAGCG TGCGAAATTC TGGGCCTGGA TCCACTCTAC 
CTGGCGAATG AAGGCAGATT CGTTGGGTTC GTTGCTGAAA GAGATGCGGA AAATGCGCTG 
GATATCATGC GGAAGCACGC CGTGTCGGCG CAGGCCAAGC GGATCGGAAC CGTGGCCGAG 
GCGCCCGCCT CGCTGGTCAC GCTCGAAAAT CTGCTTGGGA CAAAGCGCAT CCTCGACATG 
GAACGCGGCG AACCTCTTCC ACGGATTTGC TGA

Protein sequence

MSVKSFSLNC PLPLNTSAVV LLAHGGGGRL MHQFLEQYVI PAFQNDQLAT RHDGAVFDVK 
NARLAFTTDS YVVSPLFFPG ADIGSLAVSG TVNDLAMCGA RPLFLSAAFI MEEGLPFETL 
ERVIASMRAT AEAAGVHIVT GDTKVVDRGK CDKLFINTAG VGVIEHTQTI GPSAVRSGDA 
ILLSGDVGRH GVAVMATREG LEFATAIESD CAPLAEPVLA LLEAGIEVHC FRDLTRGGLA 
TTLVEIAESS KLGIHIAERS VPVEEGVRGA CEILGLDPLY LANEGRFVGF VAERDAENAL 
DIMRKHAVSA QAKRIGTVAE APASLVTLEN LLGTKRILDM ERGEPLPRIC