Gene Rsph17025_1466 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_1466
Symbol
ID	5083927
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	1496869
End bp	1497849
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	66%
IMG OID	640483022
Product	ABC-type nitrate/sulfonate/bicarbonate transport systems periplasmic components-like protein
Protein accession	YP_001167665
Protein GI	146277506
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGGAC TTCTGACCGG AGCGGCGCTT CTCGCGCTCG CCGCGGGAAC GGCCTCGGCC 
GAGGATGTGA CGCTGCAGCT GAAATGGGTG ACGCAGGCCC AGTTCGCGGG CTACTACGTC 
GCCAAGGACC AGGGCTTCTA CGAGGAAGAG GGGCTGAACG TCACGATCAA GCCGGGCGGG 
CCCGACATCG CGCCGGTGCA GGTGCTGCTG GGCGGCGGCG CCGACGTGAT GGTGGACTGG 
ATGCCCTCGG CGCTGGCCGC GCGCGAGCAG GGAGCCGACA TCGTCAACAT CGCCCAGCCC 
TTCAAGTCGT CGGGCATGAT GCTGACCTGC CTCAAGGATT CCGGCGTGGC GAGCCCCGAG 
GATTTCAAGG GCAAGACGCT GGGCGTCTGG TTCGGCGGCA ACGAATATCC GTTCCTGAAC 
TGGATGTCGA AGCTGGGCCT GCCCACCGAC GGCTCGCCCG AGGGGGTGAC GGTGCTGAAG 
CAGGGCTTCA ACGTCGATCC GCTCTTGCAG AAGCAGGCGG CCTGCATCTC GACCATGACC 
TACAACGAAT ACTGGCAGGT GATCGACGCG GGCCTCGCGC CCGACGACCT CGTGACCTTC 
AAGTACGAGG ATCAGGGCGT GGCGACGCTC GAGGACGGGC TTTACGTCAT GGCGCCGAAA 
CTGCAGGATC CGGCCTTCGT CGAGACGATG GCCAAGTTCG TTCGCGCCTC GATGAAGGGC 
TGGAAATGGG CCGAGGAGAA CCCCGACGAA GCCGCGATGA TCGTGCTGGA AAATGACGAC 
ACCGGCGCGC AGACCGAAGA GCACCAGAAG CGGATGATGG GCGAGATCGC CAAGCTCACG 
GCGGGCTCGA ACGGCGCGCT GGACGAGGCC GACTACCAGC GCACCGTCGA GGCGCTGCTC 
GGCGGCGGCT CGGACCCGGT GATCTCGAAG GAGCCCGAGG GCGCCTGGAC CCACGAGGTG 
AGCGGCAAGG CGCTGAACTG A

Protein sequence

MKGLLTGAAL LALAAGTASA EDVTLQLKWV TQAQFAGYYV AKDQGFYEEE GLNVTIKPGG 
PDIAPVQVLL GGGADVMVDW MPSALAAREQ GADIVNIAQP FKSSGMMLTC LKDSGVASPE 
DFKGKTLGVW FGGNEYPFLN WMSKLGLPTD GSPEGVTVLK QGFNVDPLLQ KQAACISTMT 
YNEYWQVIDA GLAPDDLVTF KYEDQGVATL EDGLYVMAPK LQDPAFVETM AKFVRASMKG 
WKWAEENPDE AAMIVLENDD TGAQTEEHQK RMMGEIAKLT AGSNGALDEA DYQRTVEALL 
GGGSDPVISK EPEGAWTHEV SGKALN