Gene Rpal_1398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1398
Symbol
ID	6409055
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	1470990
End bp	1472141
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	66%
IMG OID	642711297
Product	iron-containing alcohol dehydrogenase
Protein accession	YP_001990413
Protein GI	192289808
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.145523
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGCAA CGACCTTCTT CATTCCCTCT CTCAATCTGT TCGGCGCCGG CTGCGTATCG 
AGCGCAGCGG ACCACGCCAA GGCACGCGGC TTCAAGCGCG CGCTGATCGT CACCGACAGC 
GGGCTGCACA AGCTCGGCGT CGCCGATCAG ATCGCCTCGA TGCTGATCGA GCGCAACGTG 
ACCAGCGTCG TCTTCCCGGG CGCGAAGCCA AACCCGACGA TCAAGAACGT CGAGGACGGG 
CTTGCACTGC TGAAGCAGGA ACACTGCGAC TGTGTGATCT CGCTCGGCGG CGGTTCAGCG 
CACGACTGCG CGAAGGGCAT CGCGCTGACC GCCACCAATG GCGGCAGCAT CAAGGACTAT 
GAAGGCGTCG ATCGGTCGGC GCACGCTCAG CTTCCGCTGA TCGCCATCAA CACCACGGCC 
GGTACGGCGA GTGAGATGAC GCGGTTCTGC ATCATCACCG ACGAGGAACG CCAGGTGAAG 
ATGGCGATCG TCGACCGCCA CACCACGCCG CTGCTGTCGG TCAACGATCC GGTACTGATG 
CTCGGCAAGC CGCCGGCCCT CACCGCCGCG ACCGGCATGG ACGCGCTGAC GCACGCGATC 
GAAGCCTATG TGTCGATTGC CGCAACGCCG ATCACTGACG CCTGCGCGCT GAAGGCGATG 
TCGATCATCT CCAACAGTCT GCGCACCGTG GTCGCCGAGG GCCAGAACCT CGTCGCCCGC 
GAGGCGATGT CGTATGCGGG CTTCCTCGCC GGCATGGCGT TCAACAATGC CTCGCTCGGC 
TATGTACATG CGATGGCGCA CCAGCTCGGC GGCTTCTACG ACCTGCCGCA CGGCGTCTGC 
AACGCGGTGC TGCTGCCGCA CGTGCAGGCC TACAACGCGC AAGTCGCGGC GGGACGGCTG 
AAGGACGTCG CACACGCGCT CGGCGTCGAC ACCACCGGCA TGACCGATGC CCAGGGCGCC 
GATGCCGCCA TTCATGCCAT CCAGCGGCTA TCGGCCGATG TCGGCATTCC GCCCGGTCTC 
GGCGGTCTCG GCATGAAGGA AACCGACGTG CCGATCCTCG CCGCCAACGC GCTGAAGGAT 
GCGTGCGGCT TCACCAATCC GAAGCAGGCG ACGCAGACCG AGATCGAAAC CATCTTCCGG 
GCGGCCGCCT GA

Protein sequence

MTATTFFIPS LNLFGAGCVS SAADHAKARG FKRALIVTDS GLHKLGVADQ IASMLIERNV 
TSVVFPGAKP NPTIKNVEDG LALLKQEHCD CVISLGGGSA HDCAKGIALT ATNGGSIKDY 
EGVDRSAHAQ LPLIAINTTA GTASEMTRFC IITDEERQVK MAIVDRHTTP LLSVNDPVLM 
LGKPPALTAA TGMDALTHAI EAYVSIAATP ITDACALKAM SIISNSLRTV VAEGQNLVAR 
EAMSYAGFLA GMAFNNASLG YVHAMAHQLG GFYDLPHGVC NAVLLPHVQA YNAQVAAGRL 
KDVAHALGVD TTGMTDAQGA DAAIHAIQRL SADVGIPPGL GGLGMKETDV PILAANALKD 
ACGFTNPKQA TQTEIETIFR AAA