Gene RPB_1717 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1717
Symbol
ID	3908242
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	1956442
End bp	1957824
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	66%
IMG OID	637883611
Product	ethanolamine ammonia lyase large subunit
Protein accession	YP_485336
Protein GI	86748840
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4303] Ethanolamine ammonia-lyase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.133607
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.24055
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCTATC GTCACGCTAT CGGTAACGTC GCTTACGTCT TCGACAATCT GCGCGACCTG 
CTCGCCAGAG CCACGCCCCC TCGATCCGGT GACCGGCTCG CCGGCGTCGC CGCCGACAGT 
GCCGAGCAGA TGGTCGCGGC GCGGATGGCG CTCGCCGAGG TGCCGCTGCG GCAATTTCTC 
AATGAGACCG TCATCCCCTA TGAAGACGAC GAGGTCACAA GGCTGATCGT CGACAGCCAC 
GACGCGCAAA GCTTTGCTCC GATTGCCGCG CTCACCGTCG GAGGTTTCCG CGACTGGCTG 
CTGTCGGATG CGGCGACGCC CGCGACGCTC GCCGCGATCG CGCGCGGCGT CACTCCCGAA 
ATGGCCGCCG CGGTCAGCAA GCTGATGCGC AACCAGGATC TGATCCTGGT CGCCAAGAAG 
TGCAGCGTCG TCACCCGTTT CCGCAACACG ATCGGCCTGC CGGGCCGGAT GAGCGTGCGG 
TTGCAGCCCA ATCACCCGTT CGACGATGTT CGCGGCATCA CCGCCTCGAC GCTGGACGGC 
CTGCTGCTCG GCGCCGGCGA TGCCTGTATC GGCATCAACC CGGCGAGCGA CGATCCGGCG 
GTGCTTGGGC AATTGGTGCG GCTGCTCGAC GACGTCATCA CGCGGCTGGC GATCCCCACC 
CAGAGTTGCG TGCTGACCCA CGTCACCACC TCGCTGCGAT TGATGGAGGA GGGAGTGCCC 
GTCGATCTGG TGTTCCAGTC GATTGCCGGC ACCGAAGCCG CCAACCGCAG CTTCGGCATC 
GACCTGTCGA TCCTGAAGGA GGCGCACGAC GCCGGGCTCT CGTTGAAGCG GGGCACCGTC 
GGCGAAAATG TGATGTATTT CGAGACCGGG CAGGGCTCCG CGCTGTCGGC CGACGCCCAT 
CACGGCGTCG ATCAGCAGAC CTGCGAGGCG CGAGCCTATG CGGTGGCGCG GGCCTATGCG 
CCGCTGCTGG TCAACAGCGT CGTCGGATTC ATCGGCCCCG AATATCTCTA CGACGGCAAG 
GAGATCATCC GCGCCGGGCT GGAGGACCAT TTTTGCGGCA AGCTGCTAGG CCTGCCGCTC 
GGCGTCGACA TCTGCTATAC CAACCACGCC GAAGCCGACC AGGACGACAT GGACACGCTG 
CTGACGCTGC TGGCCACCGC CGGCGTCAGC TTCATCATGG GCGTGCCCGG CGCCGACGAC 
GTCATGCTGA ACTACCAGTC GACCTCGTTT CACGACGCGC TCTACGTCCG CGAACTTCTC 
GGTCTGAAGC GAGCCCCGGA GTTCGACGAC TGGCTCGTTC GCACCGGGCT CTCCCAGGCC 
GACCTCCGTC TGACGGCCGC CGATGGGCGG CTGCCGGACT TCGCCGCCCG GCTGATCGCC 
TGA

Protein sequence

MLYRHAIGNV AYVFDNLRDL LARATPPRSG DRLAGVAADS AEQMVAARMA LAEVPLRQFL 
NETVIPYEDD EVTRLIVDSH DAQSFAPIAA LTVGGFRDWL LSDAATPATL AAIARGVTPE 
MAAAVSKLMR NQDLILVAKK CSVVTRFRNT IGLPGRMSVR LQPNHPFDDV RGITASTLDG 
LLLGAGDACI GINPASDDPA VLGQLVRLLD DVITRLAIPT QSCVLTHVTT SLRLMEEGVP 
VDLVFQSIAG TEAANRSFGI DLSILKEAHD AGLSLKRGTV GENVMYFETG QGSALSADAH 
HGVDQQTCEA RAYAVARAYA PLLVNSVVGF IGPEYLYDGK EIIRAGLEDH FCGKLLGLPL 
GVDICYTNHA EADQDDMDTL LTLLATAGVS FIMGVPGADD VMLNYQSTSF HDALYVRELL 
GLKRAPEFDD WLVRTGLSQA DLRLTAADGR LPDFAARLIA