Gene Cphamn1_1084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_1084
Symbol
ID	6374758
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	+
Start bp	1172611
End bp	1173639
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	54%
IMG OID	642683585
Product	zinc-binding alcohol dehydrogenase family protein
Protein accession	YP_001959503
Protein GI	189500033
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID	[TIGR02822] zinc-binding alcohol dehydrogenase family protein

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.31
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.438887
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCGC AGGTTATTGA AAGGATTACA GACTTGTCAG AGAGCTCTGA ACCGCTGAGG 
ATGGTTGAGA TGCCGGTTCC TGAGCCTGCT GCTGGTGAGG TGCTGCTGAA GGTGCTGACC 
TGCGGGGTTT GTCATACGGA GCTGGATGAG ATAGAAGGGA GAACCCCGCC TGCTTTTTTT 
CCGATCGTTC CGGGCCATCA GGTTGTGGGA GAGGTTGTCG CTCAAGGAGC AGGGGTAAGC 
CAACCCGAAA TCGGGAGCAG GGTAGGGGTA GCCTGGATAT ATTCCGCCTG CGGGAAATGT 
GAACTGTGCC TCGACGGTAA AGAGAATCTG TGCCTGGAGT TTCGTGCCAC CGGACGGGAC 
GCTCATGGGG GGTATGCGGA ATATATGACT GTTCCCGTTT CTTCTGCCTA TTCACTTCCT 
GATCTCTTTT CCGATGCTGA AGCCGCGCCT CTTCTGTGTG CGGGTGCTGT CGGGTATCGG 
TCACTGAAGC TGCTGAATCT GCAAAACGGC CAGCCTGCGG GGTTGACAGG TTTCGGGGCT 
TCAGCGCATC TTGTTTTGAA ATTGATGCGG TTTCTCTACC CTGATTCGCC GGTTCATGTT 
TTTGCCCGAA ACCTGCAAGA GCGTGAATTC TCCCTTGCTC TCGGAGCAGT CTGGGCTGGA 
GATACAACCG ATTCATCTCC GGAACTCCTT GCCGGTATCA TCGACACCAC GCCGGTCTGG 
CTGCCCGTCC TGTCCGCACT TGAGAATCTC AGACCATCAG GCCGTCTGGT CATCAATGCG 
ATCCGCAAAG AAGCGTCGGA TACAGATGTG CTTACGCAGC TCGATTATGC GAAGCATCTC 
TGGATGGAGA AGGAGATCAA AAGCGTGGCC AACGTTGCCG CTGAGGATGT CAGGCAGTTC 
CTGAAGATTG CTGCATCCAT GCACATGAAG CCGGAAGTGC AGATCTATTC TTTTGAAGAG 
GCGAACAGAG CCCTTATTGA CATAAAGCAG CGCCGGATCA GGGGCGCGAA AGTGCTTCAG 
ATTGCCTGA

Protein sequence

MKAQVIERIT DLSESSEPLR MVEMPVPEPA AGEVLLKVLT CGVCHTELDE IEGRTPPAFF 
PIVPGHQVVG EVVAQGAGVS QPEIGSRVGV AWIYSACGKC ELCLDGKENL CLEFRATGRD 
AHGGYAEYMT VPVSSAYSLP DLFSDAEAAP LLCAGAVGYR SLKLLNLQNG QPAGLTGFGA 
SAHLVLKLMR FLYPDSPVHV FARNLQEREF SLALGAVWAG DTTDSSPELL AGIIDTTPVW 
LPVLSALENL RPSGRLVINA IRKEASDTDV LTQLDYAKHL WMEKEIKSVA NVAAEDVRQF 
LKIAASMHMK PEVQIYSFEE ANRALIDIKQ RRIRGAKVLQ IA