Gene Rru_A2007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A2007
Symbol
ID	3835432
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	2318681
End bp	2319718
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	69%
IMG OID	637826107
Product	hypothetical protein
Protein accession	YP_427094
Protein GI	83593342
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.21006
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGTTT CTTCCGCTGC TCCGCGTCCG GGCGATCGTG CCGCCGGCGC TCCCGACGGC 
GCCCCTGACA GTGCCCCCGA TGGCGCCCCC GATGGCGTCC ATGATACGGC GCGCGGCGTC 
GCCTGGGTTC TGGTCGCCTG CGTCATCTTC ACCCTGGTTT ATGCTTCGGG CCGTCTGGCC 
GGCGGCGGTG TCGGCGGCCT GCAGATCATG GCCATCCGCT ATGCCTCGGC CCTGGTTTGC 
ATCGTCGGCT TCGCCTTGGC CCGGCGCGGC GGGGTGAGCG CCTGCCGCAG CCCGCGCCCC 
TTTCGCCATT TCAGCCGGGC GATGATGGGC GGCCTGGGCG GCGCCTGCCT GATCCAGGGG 
GTGACCTTGC TGCCGATGGC CGAGGCCTCG GCCATCGGTC TGCTGGACGG CGTCTTCTCG 
GTGATCCTGG GCATCGTGCT GCTGGGCGAG CGGGTGAGGC CCCTGCGCTG GCTTGGCGTG 
GCGCTGTCGC TGGTGGGGGG CGTGCTGGTG ATCGCCGGAC GGGCCGACCT CAGCGGCTTG 
CTTGATCACC TGCTGGCCGG CGGGGCGGTG TTCTATCCCC TGGCTGGCGC CGCCTTCGTC 
GCCATGGAAC GCGTTCTCAT GCGTCAATTG GCGCTGCGCG AGGGCAAGAT GGCGATCTTG 
TTCCACGTCA ATTTGTTTGG CACGCTGATC TTGATGCCGG TCGCCTTGAT GACCTGGGTG 
CCCCTTGAGG GGCCGACGCT GGCCTTGCTG ATCGCCTTCG GGCCGCTGGC CCTGCTGGGC 
CAGTTCTGCA ATATCCGGGG GTTCGCCCTG GCCGAGGTCT CGATCACCGG ACCGGTGTGG 
TATTCCTGGC TGATCTTCGC CGCCGCCCTC GGCTGGGTGA TGTTTGACGA GGTTCCCGGG 
CCGGGCGTCA TCCTGGGTGG CGCCGTTATC GCCCTCGGCG GAGTTTTCCT CTGCGCTTCG 
GGGCGCAAGC GGACCCCGGC CCTACCGGCC GATACCCTGG GCCCTTCGGA AACCCCCGGC 
AAGGCAGGGC GCGAATGA

Protein sequence

MAVSSAAPRP GDRAAGAPDG APDSAPDGAP DGVHDTARGV AWVLVACVIF TLVYASGRLA 
GGGVGGLQIM AIRYASALVC IVGFALARRG GVSACRSPRP FRHFSRAMMG GLGGACLIQG 
VTLLPMAEAS AIGLLDGVFS VILGIVLLGE RVRPLRWLGV ALSLVGGVLV IAGRADLSGL 
LDHLLAGGAV FYPLAGAAFV AMERVLMRQL ALREGKMAIL FHVNLFGTLI LMPVALMTWV 
PLEGPTLALL IAFGPLALLG QFCNIRGFAL AEVSITGPVW YSWLIFAAAL GWVMFDEVPG 
PGVILGGAVI ALGGVFLCAS GRKRTPALPA DTLGPSETPG KAGRE