Gene Rpal_1399 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1399
Symbol
ID	6409056
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	1472331
End bp	1473851
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	64%
IMG OID	642711298
Product	Aldehyde Dehydrogenase
Protein accession	YP_001990414
Protein GI	192289809
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.398004
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCTCA TCACAACGAT GCATCCTGAC GCCAGCACAG TCTTCAAGGC CCGCTATGGC 
AACTTCATCG GCGGCCGCTG GGTTGCGCCG GTCGATGGCA GATACTTCGA CAACACCACG 
CCGATCACCG GCGCAAAACT GACGGAAATT CCGCGTTCGC AGAAGGAAGA CGTCGAACTC 
GCGCTTGATG CAGCGCACAC CGCGAGCGTC ACCTGGAGCA AGACCACGAC GACAGAGCGG 
TCACTCATTC TCAATCGCAT CGCCGATCGG ATGGAAGCCA ATCTCGATCT GCTGGCGATC 
GCCGAGACGC TCGACAACGG CAAGCCGATC CGCGAGACGC GGGCCGCCGA CCTGCCGCTG 
GCGATCGATC ACTTCCGCTA TTTCGCAGGT GCACTGCGCG CGCAGGAAGG TTCGATCTCG 
GAGATCGATC ACGACACCAT CGCGTATCAC TTCCACGAGC CGCTCGGCGT CGTCGGCCAG 
ATCATTCCGT GGAACTTCCC GTTGCTGATG GCCGCCTGGA AGCTGGCGCC GGCACTCGCC 
GCCGGCAACT GCGTGGTGCT GAAACCGGCC GAGCAGACCC CGGCCTCGAT CCTGGTATGG 
GCCGAACTGG TCGGCGATCT GTTGCCTCCC GGCGTCGTCA ACGTCGTCAA CGGCTTCGGC 
GTCGAAGCCG GCAAGCCGCT GGCGTCCAGC CCGCGCATCG CCAAGATCGC CTTCACCGGC 
GAGACCTCGA CCGGGCGGCT GATCATGCAA TATGCAAGCG AGAATCTGGT GCCGGTGTCA 
CTGGAACTCG GCGGCAAATC GCCGAACATT TTCTTCGGCG ACGTCACTGC CGAAGACGAC 
CCATTCTTCG ACAAGGCGAT CGAAGGCTTC GTGATGTTCG CGCTCAATCA AGGCGAAGTC 
TGCACCTGCC CGAGCCGCGC GCTGGTGCAG GAATCGATCT ACGATCGCTT CATGGAGCGG 
GCGCTCGCCC GCGTCGCCGC GATCCGGCAG GGCGATCCGC GCGATCCGGC AACGATGATC 
GGTGCGCAGG CGTCTCAAGA GCAGCTCGAC AAGATCCTGT CCTACATCGA CATCGGTCGG 
CACGAAGGTG CCGAACTGCT GGCCGGCGGC GGGCGGGCGC AGCTGCCCGG CGATCTCGCC 
GGTGGCTACT ACGTGCATCC GACCGTGTTC CGCGGCCACA ACCAGATGCG GATCTTCCAG 
GAGGAGATCT TCGGCCCCGT GGTGTCGGTC ACCACCTTCA AGGACGAAGC CGAAGCGATC 
GCCATCGCGA ACGACACCCA GTACGGACTC GGCGCAGGCG TCTGGACGCG GGACGGCACT 
CGCGCCTATC GGTTCGGACG CGCCATCGCT GCGGGCCGGG TGTGGACCAA TTGCTACCAC 
GCCTATCCGG CGCATGCCGC CTTCGGCGGC TACAAGCAGT CCGGCATCGG GCGTGAGACC 
CACAAGATGA TGCTCGATCA CTATCAGCAC ACCAAGAACC TGCTGGTGAG CTACGGCACC 
GGCCCACTCG GCTTCTTCTA G

Protein sequence

MNLITTMHPD ASTVFKARYG NFIGGRWVAP VDGRYFDNTT PITGAKLTEI PRSQKEDVEL 
ALDAAHTASV TWSKTTTTER SLILNRIADR MEANLDLLAI AETLDNGKPI RETRAADLPL 
AIDHFRYFAG ALRAQEGSIS EIDHDTIAYH FHEPLGVVGQ IIPWNFPLLM AAWKLAPALA 
AGNCVVLKPA EQTPASILVW AELVGDLLPP GVVNVVNGFG VEAGKPLASS PRIAKIAFTG 
ETSTGRLIMQ YASENLVPVS LELGGKSPNI FFGDVTAEDD PFFDKAIEGF VMFALNQGEV 
CTCPSRALVQ ESIYDRFMER ALARVAAIRQ GDPRDPATMI GAQASQEQLD KILSYIDIGR 
HEGAELLAGG GRAQLPGDLA GGYYVHPTVF RGHNQMRIFQ EEIFGPVVSV TTFKDEAEAI 
AIANDTQYGL GAGVWTRDGT RAYRFGRAIA AGRVWTNCYH AYPAHAAFGG YKQSGIGRET 
HKMMLDHYQH TKNLLVSYGT GPLGFF