Gene Rsph17025_2975 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_2975
Symbol
ID	5085178
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	3040352
End bp	3041362
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	68%
IMG OID	640484546
Product	ABC-type nitrate/sulfonate/bicarbonate transport systems periplasmic components-like protein
Protein accession	YP_001169166
Protein GI	146279007
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.459543
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.113322
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCCGCG CCTCCGCCGC CGCCCTTGCC GCGGCCCTTA CCGTCACTGC CGCCACGGCC 
GGGGCCGAGA CCGCGATGCC CTTCGCGCTC GACTGGAAGT TCGAGGGCCC CGCGGCGCCC 
TACTTCGTGG CCCTCGACGA AGGTCATTTC GCCGCCGAGG ATCTCTCGGT GCAGATCTCC 
GAGGGGGCGG GTTCGCTCGA CGCCATTCCG AAGGTTGCGA CCGGCGCCTT TCCGGTGGGG 
TTTGCCGACA TCAACAGCCT GATGAAGTTC CTCGACCAGA ACCCCGGCGC CCCGGTGATC 
GCCGCCATGA TGATCTATGA CAAGCCCCCC TTCGCGGTGG TGGGGCGCAA GTCGCAGGGG 
ATCGAGGCGC CGAAGGATCT CGAGGGCCGC AAGCTCGGCG CACCTCCGCC CGATGGCGCC 
TGGGCGCAGT TCCCGATCTT TGCCGCCGAA AACGGTCTCG ACATGGCCGC CATCACGGTC 
GAGCCGGTGG GCTTCCCCAC GCGCGAGCCG ATGCTGGCCG AGGGTCAGGT CGATGCGGTG 
ACGGGCTTCT CCTTCTCGTC CACGCTCAAC CTGATCCGGC TGGGCGTGCC CGAGGACGAC 
ATCTCGACCC TGCTGATGGC CGATCATGGC GTGGCGCTCT ATGGCAATGC GATCATCGTC 
AACACCGACT TCGCCGAGGC CAATCCCGAG GCGGTGACCG GCTTCCTGCG CGCCGTGGCC 
AAGGGCTGGA AGGACAGCGT CGCCGATCCC GAGGCCGCCA TCGCCGCGCT GATCCAGCGC 
AACCCGGCGG CCGATGCCGC GCTGGAAGAG CGCCGGCTGC AGATGTCGAT CGCGGACAAT 
GTCGTGACCG ACTGGGTGAA GGCCAACGGC ATGGGCAACA TCGACCCGGA CCGGATGGCG 
CGCGCCATCG AGCAGACGAA ATCCGTCTAT GAGTTCCAGA ACGCGCCCGA TGCCGCGCTC 
TATTTCGATC CGCAGTGGCT GCCCGCCGAC GGCAGCCTGA CCTTCGAGTG A

Protein sequence

MFRASAAALA AALTVTAATA GAETAMPFAL DWKFEGPAAP YFVALDEGHF AAEDLSVQIS 
EGAGSLDAIP KVATGAFPVG FADINSLMKF LDQNPGAPVI AAMMIYDKPP FAVVGRKSQG 
IEAPKDLEGR KLGAPPPDGA WAQFPIFAAE NGLDMAAITV EPVGFPTREP MLAEGQVDAV 
TGFSFSSTLN LIRLGVPEDD ISTLLMADHG VALYGNAIIV NTDFAEANPE AVTGFLRAVA 
KGWKDSVADP EAAIAALIQR NPAADAALEE RRLQMSIADN VVTDWVKANG MGNIDPDRMA 
RAIEQTKSVY EFQNAPDAAL YFDPQWLPAD GSLTFE