Gene RPC_2817 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_2817
Symbol
ID	3970084
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	3059153
End bp	3060373
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	65%
IMG OID	637925929
Product	aminotransferase
Protein accession	YP_532684
Protein GI	90424314
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.547863
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGAAT TTTACCGCAT CCGCCGTTTG CCGCCCTATG TGTTCGAACA GGTCAATCGG 
GCCAAGGCTG CTGCGCGCAA CGCCGGTGCG GACATCATCG ACCTCGGGAT GGGCAATCCC 
GACCTGCCGG CGCCGGCGCA TGTCATTGAA AAGCTTAAAG AGACCCTCGG CAAACCGCGC 
ACCGACCGGT ATTCGGCGTC GCGCGGCATC ACCGGCTTGC GCAAGGCCCA GGCCGCCTAT 
TACGAGCGCC GCTTCGGCGT CAAGCTGAAC CCCGACACCC AGGTGGTGGC GACGCTCGGC 
TCCAAGGAAG GCTTTGCCAA CGTCGCCCAA GCGATTACCG CTCCTGGCGA CGTCGTGCTG 
TGCCCGAACC CGAGCTATCC GATCCACGCC TTCGGCTTCC TGATGGCCGG CGGTGTGATC 
CGCTCGGTGC CGTCCGAGCC GACGCCGCAA TTCTTCGAGG CTTGCGAGCG CGCGATCATC 
CATTCGATTC CGAAGCCGAT CGCGATGATC GTCTGCTATC CGTCGAACCC GACCGCCTAT 
GTGGCGAGCC TGGATTTCTA CAAGGATCTG GTGGCGTTCG CGAAGAAGCA CGAGATCTAT 
ATTCTGTCGG ATCTGGCCTA CGCCGAAGTG TATTTCGACG AGGCCAACCC GCCGCCCTCG 
GTGCTGCAGG TGCCGGGCGC GATGGACGTC ACCGTCGAAT TCACCTCGAT GTCGAAGACC 
TTCTCGATGG CTGGCTGGCG GATGGGCTTT GCGGTCGGCA ACGAGCGCAT CATCGCCGCT 
TTGGCGCGGG TGAAGTCCTA TCTCGATTAC GGCGCCTTCA CCCCGGTGCA GGTCGCCGCC 
ACCGCGGCGC TGAACGGCCC CGACGACTGC ATCAAGGAGA TGCGCGACAC CTACCGCAAG 
CGCCGCGACG CGCTGGTCGA GAGTTTTGGC CGCGCCGGCT GGGAGATTCC GCCGCCGCAG 
GCCTCGATGT TCGCCTGGGC GCGGCTGCCG CCGGCCTTCA AGGAGGTCGG CTCGATGCAA 
TTCGCCACCT TGATGGTGGA GAAATCCGGC GTCGTGGTGT CGCCTGGCGT CGCCTTCGGC 
GAGCACGGCG AGGGCTTCGT GCGCATCGCC ATGGTGGAAA ACGAGCAGCG GATCCGCCAG 
GCCGCCCGCG GCGTGCGCCG CTTCCTTGAA ACCGGCATTG AAACGTTGCA CAACGTCGTT 
CCACTCGCCA CCCGGCGATA G

Protein sequence

MEEFYRIRRL PPYVFEQVNR AKAAARNAGA DIIDLGMGNP DLPAPAHVIE KLKETLGKPR 
TDRYSASRGI TGLRKAQAAY YERRFGVKLN PDTQVVATLG SKEGFANVAQ AITAPGDVVL 
CPNPSYPIHA FGFLMAGGVI RSVPSEPTPQ FFEACERAII HSIPKPIAMI VCYPSNPTAY 
VASLDFYKDL VAFAKKHEIY ILSDLAYAEV YFDEANPPPS VLQVPGAMDV TVEFTSMSKT 
FSMAGWRMGF AVGNERIIAA LARVKSYLDY GAFTPVQVAA TAALNGPDDC IKEMRDTYRK 
RRDALVESFG RAGWEIPPPQ ASMFAWARLP PAFKEVGSMQ FATLMVEKSG VVVSPGVAFG 
EHGEGFVRIA MVENEQRIRQ AARGVRRFLE TGIETLHNVV PLATRR