Gene RPB_4629 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4629
Symbol
ID	3912446
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	5230753
End bp	5231940
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	68%
IMG OID	637886533
Product	Serine--glyoxylate transaminase
Protein accession	YP_488223
Protein GI	86751727
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0075] Serine-pyruvate aminotransferase/archaeal aspartate aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGTCA GCGCCGGACG GGAATTCCTC GCGATTCCCG GCCCCACCAA TATGCCCGAC 
GAGGTGCTGC AGGCGATGCA TCGCCCGGCG CTCGACATCT ATTCGAGGCA GATGGTGGAG 
CTCAGCGACA GCTTGCTGAG CGACCTCAGC CGGCTGTTTG CGACGAAAGG CAAGTCCTAC 
ATCTACATCG CCAACGGCCA CGGGGCCTGG GAGGCGGTGA TCAGCAACGT GCTGTCGCGC 
GGCGACAAGG TGCTGGTGCT GGAGAGCGGC CGCTTCGCGC TGGGCTGGGG CAATGCCGCG 
CAGGCGATGG GCTGCGAGGT CGAGGTGCTG AAGGGCGACT GGCGTCGTGC GGTGCGGCCC 
GACGAGGTCG AGGAGCGGCT GCGCCGCGAC AAGGACCACA GCATCAAGGC GATCATGGTG 
GTGCAGGTCG ATACCGCATC GAGCGCCTAT AACGATATCG AAGCGATCGG GCGCGCGATC 
AAGGCCGCAG GGCATCCGGC GCTGTTCATG GTCGACGCCG TCGCCTCGCT CGGCTGCATG 
CCGTTCGCGA TGGACAAATG GGGCATCGAC GTCGCGATGT CCGGTTCGCA GAAGGGCCTG 
ATGTCGCCGC CCGGCCTCGG CTTCGTCGCG GTCGGCGATC GCGCCCGCGC GGCGCACCAG 
ACCGCCGGCC TGCGCACGCC GTATTGGGAC TGGACCCAGC GCGACGGGCC GGAGCATTAC 
CAGAAATATG CCGGCACCGC GCCGGTGCAT CTGCTGTTCG CGCTGCGCAA GGCGCTCGAC 
ATGCTGTTCG AAGAAGGGCT GGACAACACC TTCACACGCC ACCGGCTGCT CGCCGAAGCG 
GTGCGCCGCG CCGTCGCGGT GTGGTCCGAA GGCCAGGTGT TCAGCTTCAA TATCGCCGAT 
GCCGCCGAGC GCGCCGACAC GGTGACCACG GTGCGCGCCG CCGAGGGCCA CGACCTGTTC 
GCGCTGCACC GCTATTGCAA GGACAAATGC GGCGTGGTGC TGGGCGTCGG CATCGGCGAA 
CTGCAGAACC GCGCCTTCCG CATCGCCCAT ATGGGCCACG TCAACGCCCC GATGCTGCTC 
GGCACGCTCG GCGTCGTGGA AATGGCGCTG GCCGCCCTCG ACATCCCGCA CCGCAAAGGC 
GGCGTCGCCG CCGCGATCGG CTATCTGGCC GAAAGCGTGC CGGCGTAG

Protein sequence

MAVSAGREFL AIPGPTNMPD EVLQAMHRPA LDIYSRQMVE LSDSLLSDLS RLFATKGKSY 
IYIANGHGAW EAVISNVLSR GDKVLVLESG RFALGWGNAA QAMGCEVEVL KGDWRRAVRP 
DEVEERLRRD KDHSIKAIMV VQVDTASSAY NDIEAIGRAI KAAGHPALFM VDAVASLGCM 
PFAMDKWGID VAMSGSQKGL MSPPGLGFVA VGDRARAAHQ TAGLRTPYWD WTQRDGPEHY 
QKYAGTAPVH LLFALRKALD MLFEEGLDNT FTRHRLLAEA VRRAVAVWSE GQVFSFNIAD 
AAERADTVTT VRAAEGHDLF ALHRYCKDKC GVVLGVGIGE LQNRAFRIAH MGHVNAPMLL 
GTLGVVEMAL AALDIPHRKG GVAAAIGYLA ESVPA