Gene RPB_3700 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3700
Symbol
ID	3911502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4238464
End bp	4239531
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	71%
IMG OID	637885602
Product	aromatic amino acid beta-eliminating lyase/threonine aldolase
Protein accession	YP_487306
Protein GI	86750810
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2008] Threonine aldolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCTACA CCCCTGCCCC GCCCGATCCG AACGCGCCGC CCGTCCGGAT CAATCTTCTC 
TCCGACACCC AGACGCGCCC CACGCCGGCG ATGCGCGAGG CGATGGCGCG GGCCGCGGTC 
GGCGACGAGC AGACCGGCGA CGATCCGACC GTCAACGCGC TGAACGAACG GGTCGCCGCA 
CTGCTCGGCA AGGAAGCCGC GGTGTTCCTG CCGTCCGGCA CGATGTGCAA CGTCACCGCG 
ACGCTCGCCA CCTGCCGCCC CGGCGACGAG ATCATCGCGC ATCGCACCGC GCACATCCTG 
TCGCGCGAGG GCGGCGCGCA TGCGGCGCTC GGCGGTTTCC AGATCACCGG CCTCGACGGC 
GACGACGGAC AGTTCTCGCT CGATGCGTTC CGCGCCGCAC TGCATCCGCG CTCGCGCTAC 
GAGCCGCCGC AGACCATGGT CAGCGTCGAG CAGACCGCCA ATATCGGCGG CGGCACGATC 
TGGCCGCAGG CCACGCTCGA CGCCATCGCG GCGGCCGGCA AGGAAGCCGG GCTCGCCACC 
CATATGGACG GCGCAAGGCT GATGAACGCG GCGGTCGCCA CCAGCATCGC GGCGCACGAG 
ATGGCGGCGG GCTGGGATTC GGCGTGGATC GATTTCAGCA AGGGCCTCGG CGCGCCGGTC 
GGCGCATCGC TCGCCGGTTC ACGCGCCTTC ATCGACGAGG TCTGGCGCTG GAAGCAGCGG 
CTCGGCGGTT CGATGCGGCA GGCCGGAATC ATCGCCGCCG CCTGCCACTA CGCGCTCGAT 
CATCACGTCG AACGCCTGGC GGAGGATCAC GCCAACGCCC GCGCGCTGGC CGCAGGGCTG 
GCGCAGATCG CCGGCGTCGA TGTGCAGCAG CCGCACACCA ATCTGGTGTT CTTCCGGCCC 
GACGGCGCGG GCGTTGCCGG CGACGCGATG GTCGCCGAGC TGCGGCAGCG CGGCGTGCTG 
CTGGCGATGA TGGACGGCCG GATCCGCGCC TGCACCCATC TCGACGTCAG CGCCGCGATG 
ATCGACGAGA CGCTGGCGCT GGTGCGCGAG ATCGTGCGCA AGGCCTGA

Protein sequence

MAYTPAPPDP NAPPVRINLL SDTQTRPTPA MREAMARAAV GDEQTGDDPT VNALNERVAA 
LLGKEAAVFL PSGTMCNVTA TLATCRPGDE IIAHRTAHIL SREGGAHAAL GGFQITGLDG 
DDGQFSLDAF RAALHPRSRY EPPQTMVSVE QTANIGGGTI WPQATLDAIA AAGKEAGLAT 
HMDGARLMNA AVATSIAAHE MAAGWDSAWI DFSKGLGAPV GASLAGSRAF IDEVWRWKQR 
LGGSMRQAGI IAAACHYALD HHVERLAEDH ANARALAAGL AQIAGVDVQQ PHTNLVFFRP 
DGAGVAGDAM VAELRQRGVL LAMMDGRIRA CTHLDVSAAM IDETLALVRE IVRKA