Gene RPB_4420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4420
Symbol
ID	3912235
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	5006990
End bp	5008252
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	68%
IMG OID	637886325
Product	threonine synthase
Protein accession	YP_488017
Protein GI	86751521
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.698202
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAGG TCAAAGGGCT GCAGTGCCTG CGCTGCGGCG CCCTTTATGC CCCGGATCAT 
TACGCCGAGG ACTGCCCGGC CTGCCGGCCG GTGGTGCGGA GCAATCTCAT CGTCGTCTAC 
GATGAGCCGC TCGCCTTGCG CAAGCCGGAC GCGGCCGGCG CCGGGCCGTC GAGCGGCCTG 
TGGCGCTACG GCGACGTGCT GCCGGTGAGC GAGGCCGACG CCGTGTCGCT CGGCGAGGGC 
GGTTCGCCGC TCCGCCAACT GCGCGCGGTG GGCGATCAAC TCGGTCTCAA ACGGCTCTAC 
GGCAAGGACG AGAGCGGCAA TCCGACCTGG TCGTTCAAGG ACCGTCTCGC CTGCATCGCG 
GTGTCGGTCG CCAAGCAGAT GGGCGCCAAG ACTATCGTGT CGAGTTCATC CGGCAACGCC 
GGCGCCGCCG CCGCCGCTTA TGCGGCGAAA GCCGGCATCC CCTGCGTGGT GTTCACGTTC 
GGCTGGGCCG CAGGTCCGAT GGTGACGCAG ATGCGCGCCT ATGGGGCCAA GGTCGTCACC 
GTGCCGCAGA AGGAAGACCG CTGGCGGTTC ATGGAGCACG CCGTGCGGCA GTATGGCTGG 
TTTCCGACTT CGCCGTTTTT CGGCCCGGCC GTCGGCTCCA ATCCTTACGG CATCGAAGGC 
TACAAGACGC TGGCCTACGA GACCGTCGAG CAGCTCGGCT GGCGGGCCCC GGATTGGTGC 
ATCCTGCCGG TGTGCTACGG CGACGCGCTG ATCGGGATGT GGCGCGGCTT CACCGAGATG 
AAGGCGGCGG GCTGGATCGA TCGGATGCCG AAGATGGTCG CCGCGGAGGT CTACGGCTCG 
ATCGGCCGGG CGCTCGACGA CGACCTCGAA GCGCCGCCGG CGATGCCGAA GACCTTCGAC 
ACGGTGTCGG GCTCGATCGG CGCCGTGCAG GGCACCTATC AGGCGCTCGA GATCGTGCGA 
AAATCCGGCG GCCGAGCGGT GACGATCTCC AACGACGACA CCATGCGATG GCAGCGTCTG 
CTGGCGACGC GTGAGGCCCG CTATCTCGAG CCGGCGTCCG CCGGCGGACT GGTCGCGGTC 
GAGCGGCTCG CAAAATCGGG AATCATCAAG CCGGACGACG TCGTCGTCTC GCTGCTCACG 
GCGTCGGGTC TGAAAGACCC GGCGGTCACT GCCGCCACCC AGGGCGACAC CATGGCGGTG 
CCGTCCGATC TGTCGGCAGC CTGGCAAATC CTGCAATCGG CGGGAATAGT TCCAAGCAAC 
TGA

Protein sequence

MAKVKGLQCL RCGALYAPDH YAEDCPACRP VVRSNLIVVY DEPLALRKPD AAGAGPSSGL 
WRYGDVLPVS EADAVSLGEG GSPLRQLRAV GDQLGLKRLY GKDESGNPTW SFKDRLACIA 
VSVAKQMGAK TIVSSSSGNA GAAAAAYAAK AGIPCVVFTF GWAAGPMVTQ MRAYGAKVVT 
VPQKEDRWRF MEHAVRQYGW FPTSPFFGPA VGSNPYGIEG YKTLAYETVE QLGWRAPDWC 
ILPVCYGDAL IGMWRGFTEM KAAGWIDRMP KMVAAEVYGS IGRALDDDLE APPAMPKTFD 
TVSGSIGAVQ GTYQALEIVR KSGGRAVTIS NDDTMRWQRL LATREARYLE PASAGGLVAV 
ERLAKSGIIK PDDVVVSLLT ASGLKDPAVT AATQGDTMAV PSDLSAAWQI LQSAGIVPSN