Gene RPC_3743 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3743
Symbol
ID	3970338
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	4168327
End bp	4169307
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	69%
IMG OID	637926853
Product	aminotransferase, class I and II
Protein accession	YP_533597
Protein GI	90425227
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01140] L-threonine-O-3-phosphate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000372169
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACACG GCGGCGATTT GACGGACGCG ATGGCGCGGC ACGGCGGCGC GCCGCAAGCC 
TGGATCGATC TGTCCACCGG CATCAATCCG TGGCCGTGGC CGATTCCCGC GATCGCAGAC 
GAGGCCTGGC AGCGGCTGCC GTCGCGTGGC GATGAAGTCG CACTGATCGA CGCCGCGCGC 
GCGGCCTATC GCGTGCCCGC GGAGATAGCG ATCGTCGCAG CCTCCGGCAC CCAGGCGCTG 
ATCCAGTGGC TGCCGCATCT TGCTGCGCCC GGCGCGGTCG CGATTGTTGG CCCGACCTAC 
AGCGAGCACG CGAGCGCGTG GCGCAACGCC GGCCGCGAGG TGATCGCCAT TGATGATGCT 
TGCGCATTGC CGAGCAGCGC GCGCCATGCG GTGATCGTCA ACCCGAACAA TCCCGACGGC 
CGCGTCGTCG ATCGCGCGCA GCTCGCGGAT GTCGCCGCCG TGCTGCAGGC CCGCGGCGGC 
TGGCTGGTGA TCGACGAAGC CTTTGCCGAC GTGACACCTG ACATCAGCGC GACGGCGCTG 
TGCGCGGCGT TGCCGATCGT GATCCTGCGC TCGTTCGGCA AGTTCTATGG CCTCGCCGGA 
TTGCGGCTCG GCTTCGCGCT GGCCGCACCA TCGATCGCCG ATCGCATCGA AGCTGCGATC 
GGGCCGTGGT GCTGCTCCGG ACCGGCGCTG CGGATCGGCG CTGCCGCGCT GCGCGACCGG 
GCCTGGGCAG ACGCGACGCG CACCGCCTTG ACGCAACAAG CCATACGTCT CGATGCGGTG 
CTGAACAAAG CCGGGCTTAA CGTCGTCGGC GGCACCGCGC TGTATCGATT GACCCGGCAT 
CGCGAGGCGT TGCGGATCCA CGATGGCTTG GCGCGACAAC AGATCTGGTG CCGCCGCTTC 
GATTGGGCCG ACGATCTGCT GCGGTTCGGC CTGCCTCCGG ACGAGGCCGC ACTGGATCGG 
CTGGCGGCTG CGCTGGGATA G

Protein sequence

MKHGGDLTDA MARHGGAPQA WIDLSTGINP WPWPIPAIAD EAWQRLPSRG DEVALIDAAR 
AAYRVPAEIA IVAASGTQAL IQWLPHLAAP GAVAIVGPTY SEHASAWRNA GREVIAIDDA 
CALPSSARHA VIVNPNNPDG RVVDRAQLAD VAAVLQARGG WLVIDEAFAD VTPDISATAL 
CAALPIVILR SFGKFYGLAG LRLGFALAAP SIADRIEAAI GPWCCSGPAL RIGAAALRDR 
AWADATRTAL TQQAIRLDAV LNKAGLNVVG GTALYRLTRH REALRIHDGL ARQQIWCRRF 
DWADDLLRFG LPPDEAALDR LAAALG