Gene Cpha266_1004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_1004
Symbol
ID	4570926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	+
Start bp	1141515
End bp	1142666
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	51%
IMG OID	639765606
Product	iron-containing alcohol dehydrogenase
Protein accession	YP_911475
Protein GI	119356831
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGGCAA TTCATTTTGG CGCCGGTATG TTTGATCGCC TTGTCGATTT TTCCCTTCCT 
TATGGTCGAA ACGCTCTTCT TGTTACCGGC AGAGGTTCGC TGCAACGGCA GGGTTATCTC 
CACTCTCTTT TTAATTCGTT CAGCAAGGCA GGTATACAGT ATGCCCATAT CATTGTTGAC 
CATGAGCCAT CTCCCGAGCT GATAGATCAT GCAGTGTCCT GTTACAGGGA TCTTTCGATT 
GATGTTGTTC TTGCCGTTGG CGGCGGAAGC GTGATCGATG CAGGCAAGGC TATTGCAGCA 
ATGCTTCCCT CTGGTGATGC GGTTGAGCGA TATATTGAAG GTTTACCGGG CGCTGTTCCG 
CACAATGGAA GAAAAGTGCC GTTTATTGCT GTTCCGACCA CCTCCGGCAC TGGCAGTGAG 
GTGACCAATA ATGCTGTTAT CAGCCGAACC GGAAAAAACG GGTTCAAGCG TTCGCTTCGT 
CACTCATCCT TTGTACCGGA TGTTGCCGTT GTTGATCCTT TGTTGATGTG TTCTGCTTCC 
CGGGAACTTA CCGCCTCGTC AGGTATGGAT GCCTGCACCC AGCTTCTTGA AGCGTACGTG 
TCGCCTTTTG CGACGCCGTA TACCGATCTT CTTGCCTTTC AGGGGCTTGA ATATTTTGCA 
CGATCATTTC TCTCGGCCTG TTCTGACGGT GCCGATGATT CTGCGGTACG TGCCGATATG 
GCATATGCTG CGCTTCTTTC GGGTGTTGTC CTTTCTAATG CCGGACTTGG TATTGTGCAC 
GGGTTTGCCT CTTCTGTTGG CGGGGAGTAC GATATTCCCC ATGGAATGCT ATGCGCCACC 
CTGCTTGCCG AAGCGACACG GACAAACATT CGCGAGTTGC GTGCCAGCCG AAACGAATAT 
CCTGCTTTGA AAAAATATGC GCAGGCAGGA CAACTGTTTT CAGGCAGAGA TGCAACGGAT 
TGTTCTGAAG GGTGCAATAT GCTGATTGAA AAGCTTGAGG AGTGGCAGCA GCAGCTTGCA 
ATACCAAAGC TCAGCGCTTA TGGAATCGGT ATCTTCGACA CAGAGCGCCT TGCCTCTCGA 
ACTCGCAGCA AGAGCAACCC TGTTGATCTC ACTCTTCAAA GTATGCAAGC TATTCTCGCT 
GCGAGAGTTT AG

Protein sequence

MPAIHFGAGM FDRLVDFSLP YGRNALLVTG RGSLQRQGYL HSLFNSFSKA GIQYAHIIVD 
HEPSPELIDH AVSCYRDLSI DVVLAVGGGS VIDAGKAIAA MLPSGDAVER YIEGLPGAVP 
HNGRKVPFIA VPTTSGTGSE VTNNAVISRT GKNGFKRSLR HSSFVPDVAV VDPLLMCSAS 
RELTASSGMD ACTQLLEAYV SPFATPYTDL LAFQGLEYFA RSFLSACSDG ADDSAVRADM 
AYAALLSGVV LSNAGLGIVH GFASSVGGEY DIPHGMLCAT LLAEATRTNI RELRASRNEY 
PALKKYAQAG QLFSGRDATD CSEGCNMLIE KLEEWQQQLA IPKLSAYGIG IFDTERLASR 
TRSKSNPVDL TLQSMQAILA ARV