Gene RPD_2972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2972
Symbol
ID	4023475
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3311348
End bp	3312406
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	64%
IMG OID	637963171
Product	alcohol dehydrogenase GroES-like protein
Protein accession	YP_570099
Protein GI	91977440
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.679689
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.328694
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAGA TGCGTCGCCA ATCTCTGGTG AAATTCGACG CCCCGCTGTG CGAGACCATC 
ATCGACGCGC CAAAGCCGCA AGGCCGCGAA GTGCTGGTCC GGATCGAACG CTGCGGTTTG 
TGCCACTCCG ATCTGCATAT TCAGGACGGC TATGCCGACC TCGGCGGCGG CAAGAAGCTC 
GACACCACGC GCGGCATGAC GCTGCCGTTC ACGCTGGGGC ACGAGATTGC CGGCGTCGTC 
GATCAAGTCG GCCCCGATGC GCCCGCCGAT CTGATCGGCA AGAAGATGGC GGTGTTTCCC 
TGGATCGGCT GCGGCAAGTG CCGCGACTGC CTGACCGGCG ACGAGAACCT CTGCGCCCGG 
AACCGCTTCC TCGGCGTCTC GATCGACGGC GGCTTCGCCA CGCATGTGCT GGTGCCCGAT 
GCGAAGTACC TGCTCGACTA CGATCCGCTG CCGACCAATG TCGCGGCGAC GCTGATGTGC 
TCCGGCATCA CCGCTTATGG CGCGCTGAAG CGCCTTGTCG ATCGGCCGCG CCAGCGCAAC 
ATCCTGCTGA TCGGTCTCGG CGGCGTCGGC ATGATGGGCC TATCGCTGGC CCAGGCGATG 
TTCAAACAGC CGATCTCGGT CGCCGATCTC AGCGAGGCTG CGCGCGAGGC TGCGCTCAAG 
AATGGCGCGT CCTTCGCGTA TGATCCGTCG GAACCTGATG TGATCAAGCG CATCGTCAAG 
GAAACCGATG GCGGCTTCGA CTGCGTGGTC GATTTCGCCG GCAACGACAA GTCGATGAAC 
TTTGCGGTCG GCGCAGTGGC GCGCGGCGGC AAGATCGTCG TGTCCGGGCT GATGGGCGGA 
CAGTTCAGCC TGCCGATGGT GCAATGGATC TACAAGCGCA TGACCGTCGA AGGCTTCATG 
GTCGGCACGT TGGAAGAGAC CAAGGAGCTC TTGGCGCTGG CGCGTACCGG CAAGATCAAG 
CCGACGCCGA TGAAGGAAGA GCCGATGGGC GACGCGCAAA AATGGATCGA TCAGTTGCGC 
GCCGGCAAGG TCGTCGGCCG CATCATGCTG ACGAACTAA

Protein sequence

MTQMRRQSLV KFDAPLCETI IDAPKPQGRE VLVRIERCGL CHSDLHIQDG YADLGGGKKL 
DTTRGMTLPF TLGHEIAGVV DQVGPDAPAD LIGKKMAVFP WIGCGKCRDC LTGDENLCAR 
NRFLGVSIDG GFATHVLVPD AKYLLDYDPL PTNVAATLMC SGITAYGALK RLVDRPRQRN 
ILLIGLGGVG MMGLSLAQAM FKQPISVADL SEAAREAALK NGASFAYDPS EPDVIKRIVK 
ETDGGFDCVV DFAGNDKSMN FAVGAVARGG KIVVSGLMGG QFSLPMVQWI YKRMTVEGFM 
VGTLEETKEL LALARTGKIK PTPMKEEPMG DAQKWIDQLR AGKVVGRIML TN