Gene Rpal_3940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3940
Symbol
ID	6411621
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4226990
End bp	4228486
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	66%
IMG OID	642713821
Product	methylmalonate-semialdehyde dehydrogenase
Protein accession	YP_001992911
Protein GI	192292306
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01722] methylmalonic acid semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.90589
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCACGG TCGGGCATTT CATCGGCGGC AAAGAGGTCG AGGGCAAGTC GGGGCGTTTC 
GCCGACGTGT TCGAGCCGAT GACCGGCGAG GTGAAGGCCA AAGTCGCCCT CGCCACCAAA 
GCCGAGCTCC GCGCAGCGGT TGAAAACGCC AAGGCCGCGC AGCCGGAATG GGGCGCCACC 
AACCCGCAGC GCCGCGCCCG CGTGCTGATG AAGTTCCTCG AATTGGTGCA GCGCGATTAC 
GACAAGCTCG CCGAGCTGCT CGCGCGCGAA CATGGCAAGA CCATCCCCGA CGCCAAGGGT 
GACATTCAGC GCGGCCTCGA AGTCGCCGAG TTCGCCTGCG GCATTCCGCA TCTGATGAAG 
GGCGAATACA CCGAGGGCGC CGGCCCCGGC ATCGACATCT ATTCGATGCG CCAGCCGCTC 
GGCGTCGTCG CCGGCATCAC CCCGTTCAAC TTCCCGGCGA TGATCCCGAT GTGGAAGTTC 
GCCCCGGCGA TCGCCTGCGG CAACGCCTTC ATCCTGAAGC CGTCGGAGCG TGACCCCGGC 
GTGCCGATGG CGCTGGCGGC GCTGATGCTC GAAGCCGGTC TGCCGCCGGG CATCCTCAAC 
GTCGTCAACG GCGACAAGGA AGCGGTCGAC GCCATCCTCG ACGATCCGGA CATCAAGGCG 
GTCGGCTTCG TCGGCTCCTC GCCGATCGCG CAGTACATCT ATGAGCGTGC GGCGCAGACC 
GGCAAGCGCG CGCAATGCTT CGGCGGTGCC AAGAACCACG CCATCATCAT GCCGGATGCC 
GATATCGACC AGACCGTCGA CGCGCTGATC GGTGCCGGCT ACGGCTCGGC CGGTGAGCGC 
TGCATGGCGA TCTCGGTCGC GGTGCCGGTC GGCAAGGCCA CCGCGGAAGC GCTGATGAGC 
AAGCTGATCC CGCGCGTCGA AGCGCTGAAG ATCGGTCCGT CCACCGATCC GACCGCCGAT 
TACGGTCCGC TGGTCACCAA GGAAGCGCTG GAGCGCGTCA AGAACTACGT CGATATCGGC 
GTCAAGGAAG GCGCGACGCT CGCGGTCGAC GGCCGCGGCT TCAAGATGCA GGGCTACGAG 
AACGGCTTCT ACATGGGCGG CTGTCTGTTC GACAACGTCA CCAAGGACAT GCGGATCTAC 
AAGGAAGAGA TCTTCGGCCC CGTCCTGAGC GTCGTCCGCG CCCACGACTA TGCCGAAGCG 
CTGGCGCTGC CGTCCGACCA CGACTACGGC AACGGCGTCG CGATCTTCAC CCGCGACGGT 
GACGCCGCCC GCGACTTCGC CGCCAAGGTC AATGTCGGCA TGGTCGGGAT CAACGTGCCG 
ATCCCGGTGC CGATCGCCTA CTACACCTTC GGCGGCTGGA AGAAGTCCGG CTTCGGCGAC 
CTCAACCAGC ACGGCCCGGA CTCGATCCGA TTCTACACCA AGACCAAGAC CGTCACCTCG 
CGCTGGCCGT CGGGCGTGAA GGAAGGCGCG GAGTTTTCGA TCCCGCTGAT GAAGTAA

Protein sequence

MRTVGHFIGG KEVEGKSGRF ADVFEPMTGE VKAKVALATK AELRAAVENA KAAQPEWGAT 
NPQRRARVLM KFLELVQRDY DKLAELLARE HGKTIPDAKG DIQRGLEVAE FACGIPHLMK 
GEYTEGAGPG IDIYSMRQPL GVVAGITPFN FPAMIPMWKF APAIACGNAF ILKPSERDPG 
VPMALAALML EAGLPPGILN VVNGDKEAVD AILDDPDIKA VGFVGSSPIA QYIYERAAQT 
GKRAQCFGGA KNHAIIMPDA DIDQTVDALI GAGYGSAGER CMAISVAVPV GKATAEALMS 
KLIPRVEALK IGPSTDPTAD YGPLVTKEAL ERVKNYVDIG VKEGATLAVD GRGFKMQGYE 
NGFYMGGCLF DNVTKDMRIY KEEIFGPVLS VVRAHDYAEA LALPSDHDYG NGVAIFTRDG 
DAARDFAAKV NVGMVGINVP IPVPIAYYTF GGWKKSGFGD LNQHGPDSIR FYTKTKTVTS 
RWPSGVKEGA EFSIPLMK