Gene Rsph17029_1812 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1812
Symbol
ID	4896912
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	1911735
End bp	1912715
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	66%
IMG OID	640112406
Product	ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components TauA
Protein accession	YP_001043691
Protein GI	126462577
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.661868
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.196706
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGGAC TGCTGACCGG AGCCGCGCTT CTCGCGCTCG CCGCCGGCAC GGCTTCGGCC 
GAGGAGGTGA CGCTCCAGCT CAAATGGGTG ACGCAGGCCC AGTTCGCGGG CTACTACGTC 
GCGCTCGATC AGGGCTTCTA CGAGGAGGAG GGGCTCGAGG TCACGATCAA GCCGGGCGGC 
CCCGACGTGG CGCCGGTGCA GGTGCTGCTC GGCGGCGGCG CCGACGTGAT GGTCGACTGG 
CTGCCCTCGG CGCTGGCCGC GCGCGAGCAG GGGGCCGACA TCGTCAACAT CGCCCAGCCC 
TTCAAGAGCT CGGGCATGAT GCTGACCTGC CTGAAGGAAT CGGGCGTTTC GGGCCCCGAG 
GACTTCAAGG GCAAGACGCT GGGCGTCTGG TTCGGCGGCA ACGAATATCC CTTCCTCAAC 
TGGATGTCCA AGCTGGGCCT GCCCACCGAC GGCTCGCCTC AGGGGGTGAC GGTGCTCAAG 
CAGGGCTTCA ACGTCGATCC GCTGCTGCAG AAGCAGGCGG CCTGCATCTC GACCATGACC 
TACAACGAAT ATTGGCAGGT GATCGACGCG GGCCTCTCGC CGGACGACCT CGTGACCTTC 
AAATACGAGG ATCAGGGCGT GGCGACCCTC GAGGACGGTC TCTATGTGAT GGCCGACAAG 
CTGAAGGATC CGGCCTTCGT CGAGACCATG GCCAAGTTCG TGCGGGCCTC GATGAAGGGC 
TGGAAATGGG CCGAGGAGAA CCCCGACGAC GCGGCCATGA TCGTGCTCGA CAATGACGAC 
ACGGGCGCGC AGACCGAGAG CCACCAGAAG CGGATGATGG GCGAGGTGGC TAAGCTGACC 
GCGGGCTCGG ACGGCACGCT CGACGAGGCG GATTACAAGC GCACCGTGGC GACCCTGATG 
GGCGGCGGCT CGGATCCGGT GATCTCGAAG GAGCCTGAGG GCGCCTGGAC CCACGAGGTC 
ACCGACAAGG CGCTGAAGTA A

Protein sequence

MKGLLTGAAL LALAAGTASA EEVTLQLKWV TQAQFAGYYV ALDQGFYEEE GLEVTIKPGG 
PDVAPVQVLL GGGADVMVDW LPSALAAREQ GADIVNIAQP FKSSGMMLTC LKESGVSGPE 
DFKGKTLGVW FGGNEYPFLN WMSKLGLPTD GSPQGVTVLK QGFNVDPLLQ KQAACISTMT 
YNEYWQVIDA GLSPDDLVTF KYEDQGVATL EDGLYVMADK LKDPAFVETM AKFVRASMKG 
WKWAEENPDD AAMIVLDNDD TGAQTESHQK RMMGEVAKLT AGSDGTLDEA DYKRTVATLM 
GGGSDPVISK EPEGAWTHEV TDKALK