Gene Rru_A3040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A3040
Symbol
ID	3836486
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	3503624
End bp	3504769
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	68%
IMG OID	637827155
Product	aminotransferase, class V
Protein accession	YP_428122
Protein GI	83594370
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.130075
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTTCGT GCCAGCGTGA CCTCTTTGAG ATCCCCCAGG ATGTGGCTTA CCTGAACGCC 
GCCTTCATGG GCCCCTTGAT GACCGAGGTG GTCGCCGCCG GCCATGCCGG GGTGGCGGCC 
AAGGCCCGGC CCTGGGAAGT GGCGATCGAC GCCTTCTTCG ATCCGGTCGA AAAGGCGCGC 
GGCCTGTATG CCGGGCTGAC CGGCGCCGAT GTCGAGGGCA TCGCCGTCGT TCCCTCAGTG 
TCCTATGGCA TCGCCGTGGC GGCGGCCAAT CTGCCGCTGG CGGCGGGGAA GCGGGTGCTG 
GTTCTGGAAG AGCAGTTCCC TTCCAATCTT TATTCGTGGC GTCGTCTGGC GACCGAGAAC 
AACGCCGTCG TCCAGGTTGT CGCCCGCCCG GCCAACGGCA ATTGGACCGA GGCCCTGCTC 
GGCGCCATCA AGCCGGGGGT CGCCATCGTC GCCTGTCCCC AGGCCCATTG GTCGGATGGC 
TGCAAGATCG ATCTGGTCGC CATTGGTGCC GCCTGCCGTG CGGTCGGGGC GGCCCTGGTC 
ATCGACGGCA CCCAGTCCTT TGGCGCCATG CCCTTCGACA CGGCGGCGGT CGATCCGGAT 
TTCGCCGTCG CCGCCACCTA TAAGTGGCTG CTTGGCCCCT ATTCGCTGGG GTTCCTCTAT 
GTGGCGCCGC GCCATCGCAA CGGTCAGCCG CTGGAAGAGG GCTGGATCTG CCGCGAAGGT 
AGCCGGGATT TTTCGCGGCT GGTCGATTAC ACCGAGAGCA TGGACGCCGG GGCGCGGCGT 
TTCGATGTGG GCGAACGCTC GAACTTCGCC CTGATGCCGA TGGCGATCGC CGCCATGGAG 
CGCCTGACCG CCTGGACGCC CGCCGCCGTA TCGGCCTATG CCGGGCGGCT GACCGACCGG 
GTGGTCGCCG AAACGGCGGC CTGGGGCTGC ACCGCCGCCC CCGCTAGCGC CCGCTCGCCC 
CATTTGCTGG GGTTGGGTTT GCCGGAAGGG GTTGACGCCA AGGCCTTGGC GACCCGGCTG 
GCCGCCGCCC AGGTCAGCGT CAGCGTGCGC GGCAGCCGCC TGCGCATCTC GCCCCACGTC 
TATAACACCG ACGCCGATGT CGACCGCCTG CTTGGCGTTC TTGAAGACGC GCTGGCAAAG 
GCCTGA

Protein sequence

MLSCQRDLFE IPQDVAYLNA AFMGPLMTEV VAAGHAGVAA KARPWEVAID AFFDPVEKAR 
GLYAGLTGAD VEGIAVVPSV SYGIAVAAAN LPLAAGKRVL VLEEQFPSNL YSWRRLATEN 
NAVVQVVARP ANGNWTEALL GAIKPGVAIV ACPQAHWSDG CKIDLVAIGA ACRAVGAALV 
IDGTQSFGAM PFDTAAVDPD FAVAATYKWL LGPYSLGFLY VAPRHRNGQP LEEGWICREG 
SRDFSRLVDY TESMDAGARR FDVGERSNFA LMPMAIAAME RLTAWTPAAV SAYAGRLTDR 
VVAETAAWGC TAAPASARSP HLLGLGLPEG VDAKALATRL AAAQVSVSVR GSRLRISPHV 
YNTDADVDRL LGVLEDALAK A