Gene RPB_3361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3361
Symbol
ID	3911163
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	3844041
End bp	3845195
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	65%
IMG OID	637885264
Product	hypothetical protein
Protein accession	YP_486968
Protein GI	86750472
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.278871
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00419079
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAACAGGG TCTTCGCCGA TCTGCCCGTC ACCGTGTTCG AGGCGATGTC GCAGCTCGCA 
CGCGACAACA ACGCGATCAA TCTCGGCCAG GGGTTTCCGG ACGATCCGGG GCCGGAGGAC 
ATCCGCCGGG CCGCGGCCGA CGCGGTGCTG AACGGCTACA ACCAATATCC CTCGATGATG 
GGGATCCCGG AACTGCGGCA GGCGATCGCC ACCCATTACG GGCATTGGCA CGGCGTCGCG 
CTCGACCCGA TGACCGAGGT GATGGTGACC TCCGGCGCCA CCGAGGCGCT GGCCAGCGCC 
ATTCTCTCGG TGGTCTCGCC GGGCGATGAA GTCATCGTGT TTCAGCCGGT GTACGATTCC 
TACCTGCCGA TTATCCGGCA GGCGGGCGGC ATTCCGCGCC TGGTCCGGCT CGAGCCGCCG 
CACTGGCGGA TCACCGAGGA GGCGTTGCGC CGGGTCTTCA ACGCCAAGAC CAAGGCGATC 
GTCTTCAACA ACCCGCTCAA TCCCGCCGCG GTCGTCTATC CGCGCGAGGA TCTCGAACTG 
TTGGCGCGGT TCTGCCAGGA GTACGACGCC GTCGCCATCT GCGACGAGGT GTGGGAACAC 
GTCACCTTCG ATGGCCTCAG CCACATCCCG CTGATTGCGA TCGAGGGCAT GCGCGACCGC 
ACGATCAAGA TCGGCTCGGC CGGCAAGATC TTCTCTTTGA CCGGCTGGAA GGTCGGTTTC 
GTCTGCGCGG CGCCGCCGCT GTTGCGGGTG GCGGCCAAGG TGCATCAGTT CCTCGCCTTC 
ACCACGGCGC CCAATCTGCA GGTCGCGGTC GCCTACGGGC TCGGCAAATG CGACGACTAC 
TTTTTGCAGA TGCGCAAGGA CCTGGCGCGA AGCCGCGACC GGCTGGCGCG GGGCCTGTCG 
AGCATCGGCT TCCCGGTGAT CCGGTCGCAG GGCACGTACT TCCTCACCGT CGATCTGTCG 
CCGCTCGGCC TCAACGAGAC CGACGAGGTG TTCTGCAAGC GGATCGTCAA CGACTACAAG 
GTCGCCGCGA TTCCGGTGTC GGCATTCTAC GAGGAGGAGC CGGTCACTTC GGTGGTGCGG 
TTCTGTTTCG CCAAACAGGA TCAGACGCTC GACACCGCGC TCGAGCGGCT GTCGGATGCG 
GTGCACAGGC GTTAG

Protein sequence

MNRVFADLPV TVFEAMSQLA RDNNAINLGQ GFPDDPGPED IRRAAADAVL NGYNQYPSMM 
GIPELRQAIA THYGHWHGVA LDPMTEVMVT SGATEALASA ILSVVSPGDE VIVFQPVYDS 
YLPIIRQAGG IPRLVRLEPP HWRITEEALR RVFNAKTKAI VFNNPLNPAA VVYPREDLEL 
LARFCQEYDA VAICDEVWEH VTFDGLSHIP LIAIEGMRDR TIKIGSAGKI FSLTGWKVGF 
VCAAPPLLRV AAKVHQFLAF TTAPNLQVAV AYGLGKCDDY FLQMRKDLAR SRDRLARGLS 
SIGFPVIRSQ GTYFLTVDLS PLGLNETDEV FCKRIVNDYK VAAIPVSAFY EEEPVTSVVR 
FCFAKQDQTL DTALERLSDA VHRR