Gene RPD_2494 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2494
Symbol
ID	4022985
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	2787788
End bp	2789008
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	66%
IMG OID	637962687
Product	aminotransferase
Protein accession	YP_569625
Protein GI	91976966
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.260589
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGAAT TTTACCGCAT CCGCCGTTTG CCGCCTTACG TGTTCGAGCA GGTCAACCGG 
GCCAAGGCGG CCGCGCGGAA CGCCGGCGCC GATATCATCG ATCTGGGCAT GGGCAATCCC 
GACCTGCCGG CGCCGCCGCA TGTGCTCGAG AAGCTCAAGG ACACGCTCGG CAAGCCGCGC 
ACCGACCGCT ATTCCGCCTC GCGCGGCATT ACCGGGCTGC GCAAGGCGCA GGCGGCCTAT 
TACGACCGCC GCTTCGGGGT CAAGCTGAAC CCCGACACCC AGGTGGTGGC CACGCTCGGC 
TCCAAGGAAG GCTTCGCCAA CGTGGCCCAG GCGATCACCT CGCCGGGCGA CGTCGTGCTG 
TGTCCGAATC CGAGCTATCC GATCCATGCT TTCGGCTTCC TGATGGCGGG CGGCGTGATC 
CGCTCGGTGC CGTCCGAGCC GACCCCGGAT TTCTTCGCCG CCGCGGAGCG CGCGATCATC 
CATTCGATTC CGAAGCCGAT CGCCCTGATC GCCTGCTATC CCTCGAATCC GACCGCCTAT 
GTGGCGAGCC TTGATTTCTA CAAGGATCTG GTCGCGTTCG CGAAGAAGCA CGAGATCTAC 
ATCCTGTCCG ACCTCGCTTA CGCCGAAGTC TATTTCGACG ACGCCAACCC GCCGCCCTCG 
GTGCTGCAGG TTCCGGGCGC GATGGACGTC ACCGTCGAGT TCACCTCGAT GTCGAAGACG 
TTCTCGATGG CCGGCTGGCG GATGGGCTTT GCGGTCGGCA ATGAGCGGAT CATCGCGGCG 
CTGGCCCGGG TGAAATCCTA TCTCGACTAC GGCGCCTTCA CGCCGGTGCA GGTCGCCGCC 
ACTGCGGCGC TGAACGGCCC CGACGATTGC ATCCGCGAGA TGCGCGAAAC CTACAAGAAG 
CGCCGCGACG CGCTGGTCGA GAGTTTCGGC CGCGCCGGCT GGGAGATCCC GCCGCCGTCG 
GCGTCGATGT TCGCCTGGGC GCCGCTGCCC CCGGCGTTCC GCGAACTCGG CAGTATGCAG 
TTCGCGACCC TGATGGTGGA GAAATCCGGC GTGGTCGTCT CGCCCGGCGT CGCCTTCGGC 
GAGCATGGCG AGGGCTATGT CCGCATCGCA ATGGTGGAAA ACGAGCAGCG CATCCGTCAG 
GCGGCGCGCG GCGTGCGGCG CTTCCTTGAA AGCGGCGTCG AAACATTGCA CAACGTGGTT 
CCTCTCGCCA CACGGCGATA G

Protein sequence

MEEFYRIRRL PPYVFEQVNR AKAAARNAGA DIIDLGMGNP DLPAPPHVLE KLKDTLGKPR 
TDRYSASRGI TGLRKAQAAY YDRRFGVKLN PDTQVVATLG SKEGFANVAQ AITSPGDVVL 
CPNPSYPIHA FGFLMAGGVI RSVPSEPTPD FFAAAERAII HSIPKPIALI ACYPSNPTAY 
VASLDFYKDL VAFAKKHEIY ILSDLAYAEV YFDDANPPPS VLQVPGAMDV TVEFTSMSKT 
FSMAGWRMGF AVGNERIIAA LARVKSYLDY GAFTPVQVAA TAALNGPDDC IREMRETYKK 
RRDALVESFG RAGWEIPPPS ASMFAWAPLP PAFRELGSMQ FATLMVEKSG VVVSPGVAFG 
EHGEGYVRIA MVENEQRIRQ AARGVRRFLE SGVETLHNVV PLATRR