Gene Rsph17025_3896 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_3896
Symbol
ID	5085444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009429
Strand	+
Start bp	794306
End bp	795511
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	71%
IMG OID	640485455
Product	hypothetical protein
Protein accession	YP_001170056
Protein GI	146279898
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.446184
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGCATC CGCCGGGGTG GGGCGATCAC CCCCTTTGCG TCGATGGACG CCTCTCCGAT 
GCGAGCCCCT CGCCCTTGAC CTCCGCCAAC ACGTCCGACA CCCGCCTTGC CACCCGTCTC 
GCCTTCTTTG CGGCGGGCTT TGCCATGTCC TGCTGGGCGC CGCTTGTGCC CTTTGCCAAG 
GCGCGTTCTG GCGTGGATGA GGCCCAGCTT GGCCTCCTGC TCCTGTGCCT CGGGATCGGC 
TCGCTGATTG CCATGCCCGT CACCGGCTGG CTCAGCGCGC GCAGCGGCTC GCGCCCGATG 
ATCCTCCTGG GCGGGATCGG GATGGCCCTC TGCCTGCCCG TTCTGGCCGC CGCGGGGCAG 
CCCTGGCTTC TGGCGCTGGC GCTGCTCTTG TTCGGCGCGT CGCTCGGCAC GCTCGACGTG 
GCGATGAACG TGCATGCGGT GGCGGTCGAG CGGGAGTCGG ACCGGCCGCT GATGTCCGGC 
TTTCACGCGC TCTTCAGCGT GGGCGGCTTT GGAGGGGCGG GGCTTGTCAC CCTCATGCTG 
TCACAGGGGC TGTCGCCCCT TGCGGCGGCC GGCGTGGGAA GCGCGGTGGC GCTGGCGGCC 
GTCCTCGGCG CCGCCCCGAG GCTCTTGCGC GCGCAAGGCG GCGAGCCGCC CAAGCTCGCC 
GTGCCCCGGG CGGCGGTCCT CCTGCTCGCC GGGCTTGCCG CCATCACCTT CCTCGTCGAG 
GGCGCGCTTC TGGACTGGGG GGCGCTGCTC CTTGTGGGCC GTGGGCTGGT GGAGCCCGCC 
GGGGGCGGCC TTGGCTACAT GCTCTTCTCG ATCGCGATGA CCGTGGGCCG GTTGACCGGA 
GACCGGATCG TGATGGCCCT GGGCGACCGG CGCGTGCTGG TGCAGGGGGG CCTTCTGACG 
GTGGCAGGCT TTGCCATCCT CCTCTCGTGG GATTGGCAGC CGGGGGCATT GGCAGGCTTC 
GTGCTGATCG GGCTGGGGGC GTCGAACATC GTGCCGGTGC TCTTCAGCCT CGCCGGACGC 
CAGACCGTCA TGCCGCCCGC GCTGGCGATC GCCGCCGTCA CGACCACCGG CTATGCCGGT 
ATCCTGGCCG GGCCGGCCCT GATCGGCTTT GCCTCGCACC TGACCAGCCT GCCCATTGCC 
TTCTGGATGC TGGCCGCCCT CATGGCCTTC ATCCCCGCAA CGGCGAGGAT CGTGGCGGCG 
CGATGA

Protein sequence

MPHPPGWGDH PLCVDGRLSD ASPSPLTSAN TSDTRLATRL AFFAAGFAMS CWAPLVPFAK 
ARSGVDEAQL GLLLLCLGIG SLIAMPVTGW LSARSGSRPM ILLGGIGMAL CLPVLAAAGQ 
PWLLALALLL FGASLGTLDV AMNVHAVAVE RESDRPLMSG FHALFSVGGF GGAGLVTLML 
SQGLSPLAAA GVGSAVALAA VLGAAPRLLR AQGGEPPKLA VPRAAVLLLA GLAAITFLVE 
GALLDWGALL LVGRGLVEPA GGGLGYMLFS IAMTVGRLTG DRIVMALGDR RVLVQGGLLT 
VAGFAILLSW DWQPGALAGF VLIGLGASNI VPVLFSLAGR QTVMPPALAI AAVTTTGYAG 
ILAGPALIGF ASHLTSLPIA FWMLAALMAF IPATARIVAA R