Gene RPD_2981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2981
Symbol
ID	4023484
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3321148
End bp	3322542
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	64%
IMG OID	637963180
Product	ethanolamine ammonia lyase large subunit
Protein accession	YP_570108
Protein GI	91977449
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4303] Ethanolamine ammonia-lyase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0857022
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.119389
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGCTACC GGACCGCAAT CGACCAGCAA CTATTCGCCT TCGACAGCCT GAAGCAGGTG 
ATGGCTTACG CCAGCCCCGC GCGCTCGGGT GACTATCTTG CGGGCATCGG CGCCGCCACC 
GCGCAGGAGC GGATGGCGGC GCGGCATGTG CTGGCGGAGG TGCCGCTGAA GCAGTTCCTC 
AACGAGGCGC TGATCCCCTA TGAAGACGAC AACATCACGC GGCTGATCAT CGACGGTCAT 
GATGCAAAGG CGTTCGCGCC GGTGTCGCAC ATGACCGTCG GCGATTTCCG TAACTGGCTT 
CTGTCCGAAC AGGCGACGAC GCAGGCCCTC GCCGCGCTGG CGCAGGGCCT GACTCCGGAG 
ATGGTCGCGG CGGTCTCCAA GATCATGCGC AATCAGGATC TGATCGCGGT GGCGCGCAAG 
GTCCGGGTCG TCACCCGCTT CCGCAACACC ATCGGGCTCG CGGGGCACCT CGCGGTCCGC 
CTGCAACCCA ACCATCCCAC CGACGATCTA CGCGGCGTCG CCGCGTCGAC GCTGGACGGC 
CTGTTGATGG GCTCCGGCGA CGCCGTCATC GGGCTCAATC CCGCCTCCGA CAGCCTGCCG 
GTGCTCGGCG ATCTGCTGCG GATGCTGGAC GAGGTGATCC ATCGTTTCGA AATCCCGACC 
CAGAGCTGTG TACTGACCCA TGTCACCAAC ACGGTGCAAC TCATCAACGA CGGCGCGCCG 
GTCGATCTCG TCTTCCAGTC GATCGGCGGC ACCGAAAAAA CCAACCTGTC GTTCGGGGTG 
ACGCCGGAGA TTTTGCACGA GGCGCGCGAG GCGGCGCTGT CGTTGAAACG CGGCACCGTC 
GGCGACAACG TGATGTATTT CGAGACCGGG CAAGGCAGCG CGCTGTCGGC CGACGCGAAT 
TTCGGCGTCG ATCAGCAGAC CTGCGAGGCG CGCGCCTACG CCTTGGCGCG GCTCTACCAG 
CCGCTGCTGG TGAACACCGT GGTCGGCTTC ATCGGCCCGG AATATCTCTA TGACGGCAAA 
CAGATCATCC GCGCCGGACT GGAAGATCAT TTCTGCGGCA AGCTGCTCGG CCTGCCGCTC 
GGTTGCGACA TCTGCTATAC CAACCACGCC GAGGCCGATC AGGACGACAT GGATACGCTG 
CTGGTGCTGC TCGGCGCCGC CGGCATCAGT TTCATCATGG GCATTCCCGG CGCCGACGAC 
GTGATGCTCA ACTATCAGAG CACCTCGTTT CACGACGCGC TGTTCCTTCG CGACCTCATG 
AACCTGAAAC GCGCGCCCGA ATTCGAGATG TGGCTGCAAC GTATGCAGAT CACCGACGAT 
GCCGGGCGGC TGCGCCCGCC CTCGCCGAAC CCGCTGCTCG GCGGCATGGG CAAGCTGAAA 
TCGCTGGTCG CATGA

Protein sequence

MRYRTAIDQQ LFAFDSLKQV MAYASPARSG DYLAGIGAAT AQERMAARHV LAEVPLKQFL 
NEALIPYEDD NITRLIIDGH DAKAFAPVSH MTVGDFRNWL LSEQATTQAL AALAQGLTPE 
MVAAVSKIMR NQDLIAVARK VRVVTRFRNT IGLAGHLAVR LQPNHPTDDL RGVAASTLDG 
LLMGSGDAVI GLNPASDSLP VLGDLLRMLD EVIHRFEIPT QSCVLTHVTN TVQLINDGAP 
VDLVFQSIGG TEKTNLSFGV TPEILHEARE AALSLKRGTV GDNVMYFETG QGSALSADAN 
FGVDQQTCEA RAYALARLYQ PLLVNTVVGF IGPEYLYDGK QIIRAGLEDH FCGKLLGLPL 
GCDICYTNHA EADQDDMDTL LVLLGAAGIS FIMGIPGADD VMLNYQSTSF HDALFLRDLM 
NLKRAPEFEM WLQRMQITDD AGRLRPPSPN PLLGGMGKLK SLVA