Gene RSP_4200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_4200
Symbol
ID	3711893
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007490
Strand	+
Start bp	50383
End bp	51633
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	69%
IMG OID	640069524
Product	major facilitator transporter
Protein accession	YP_345391
Protein GI	77404819
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.279328
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGACGA CAAGGACGCC GTCCCTCAGC GAGCTCACGG GGCGGCAGGC CAGCTGGATT 
GCCGGCGGGC TGGTGATGAC ACTGGCGACC ATGCCGGGCC AGACCAACTT CATCGCGCAG 
TTCAATGCGG TGCTGCGGGC CGAGTTCGGC CTGAGCAGCG GCCTGTTCGG CGGCCTCTAC 
ACGCTCGCGA CCCTGACCAG CGCTACGGGG CTGATCTTCG CCGGGGCCCT GGCCGACCGG 
ATCGCGCCGC GGAAGCTGGC CTTGGCGATC ATGGCCGGGC TCGCGGCGAC GGCCCTTCTC 
ATGTCTCAGG TCCAGAACCT GCCGCTGCTG GTGGTGGCGC TGGCCCTGCT GCGCTTCTTC 
GGGCAGGGGA TGCTGATGCA TGTGGCGCTG ACCGCCATGG CGCGCTGGTT CGACAGGTTT 
CGCGGGCGGG CCCTGTCCTT CGCGATGTTC GGCATCACGC TGGGGGATTC AATCCTACCC 
TTCATGCTGA CCGTCTCGAT CACGGCCTTC GGCTGGCGGA CCGTCTGGAT CGGCACGGCC 
TGCACGCTGG CCCTGGCGTT GATGCCGCTG GTGTTCCTCC TGCTGCGCCG CTCGCCGGAA 
GGAGGGGCCG TCCCGGCAGG AGGCCCTGCG CCGGCGGCGA CCGGTCTCGA GTGGCGCCGC 
GCGCGCGTGC TGCGGGATCC GCTGTTCTGG GCGATCCTGC CGGGCATCAT GGCGATGCCC 
GGGATCGGGA CGCTCTTCAT CTTCCATCAG GCCAATCTGG TGGAGGCGAA AGGCTGGGAT 
CTGACCACCT TCACCGCCTT CTTCCCCGTT CTGGCGGTGA CGGTTGCGGC CTCGTCGCTC 
GCCGCAGGCG TTCTCGTCGA CCGGCTGGGC GCCTGGCGGC TGATGCCCGT CCTGCTCCTG 
CCACTTTCGG CCGCCTGCCT CGTGGTGGCG GCCCTGACCC CGGTCTGGTC CATCCCGCTA 
ATCTTCCTCG GCTTCGGTCT AACCCAAGGC GTGATGAACC CCGTCATGGG CGCCGTATGG 
GTGGAACTCT ACGGCAGCGC CCACATCGGC GCCGTGCGGT CGCTGGCCAC CGCGGCGCTT 
GTCGCGGCCT CGGCAATCGG GCCTGGCCTC GCGGGCTGGC TGCTCGACGC CGGCATCCCC 
CTTGAGCGGC AGGCGGTGTG CTACGCCGCG TTCTGCCTTG CCTGCACAGC GATCTACGCG 
CTCCTCCAAC CGCGGCTCCG CCGACGAACG GTTGCGAGCG CTACTGGCTG A

Protein sequence

MMTTRTPSLS ELTGRQASWI AGGLVMTLAT MPGQTNFIAQ FNAVLRAEFG LSSGLFGGLY 
TLATLTSATG LIFAGALADR IAPRKLALAI MAGLAATALL MSQVQNLPLL VVALALLRFF 
GQGMLMHVAL TAMARWFDRF RGRALSFAMF GITLGDSILP FMLTVSITAF GWRTVWIGTA 
CTLALALMPL VFLLLRRSPE GGAVPAGGPA PAATGLEWRR ARVLRDPLFW AILPGIMAMP 
GIGTLFIFHQ ANLVEAKGWD LTTFTAFFPV LAVTVAASSL AAGVLVDRLG AWRLMPVLLL 
PLSAACLVVA ALTPVWSIPL IFLGFGLTQG VMNPVMGAVW VELYGSAHIG AVRSLATAAL 
VAASAIGPGL AGWLLDAGIP LERQAVCYAA FCLACTAIYA LLQPRLRRRT VASATG