Gene Rsph17029_2222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2222
Symbol
ID	4897121
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2352621
End bp	2353676
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	73%
IMG OID	640112816
Product	hypothetical protein
Protein accession	YP_001044097
Protein GI	126462983
COG category	[S] Function unknown
COG ID	[COG3768] Predicted membrane protein
TIGRFAM ID	[TIGR01620] conserved hypothetical protein, TIGR01620

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0622508
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.457104
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGACA AGCCCCCGAA GAAGCCCTTG CTCCTCGACT GGGATACGCG CGAGGAAACG 
GCGGCCGATG CGCCCCGCGC CCGCCGCCAG TCGGCGGCGC CCGAGACCGT CTCGGGGCCC 
ACGCCCGCCG ACGTGCCGCC GGTGCCCGAC CTCGATCTGC CGCAGGGGCA GGCGATGCTG 
GCCGCAAGCC GCATCGCCAC CGTCCGCAGC TCGCGTCTGG GCCGCTTCGC CGGCTGGATC 
TTCGGCACGC TCCTGAGCTT CGTCCTCTCG GTGGCGGCCT GGGACTTCGT GACCTCGCTC 
CTGTCGCGCA ACAGCGTGCT CGGTGCCGCG GCCTTCGTGC TGATCGGGAC GGCGGTCCTC 
ACGGCGCTGG CGCTCGCGCT GCGCGAATGG TGGGCCTATG TGCGGCTCGA GCGGCTCGAC 
AGCCTGCGCG AGGCCGCCAT CGCCGCGCGC GCCACGAACG ATCTCAAGGC CGCACGCCGC 
GTGGTGACCT CCATCGAGAA GATGTATGGC CACCGCGCCG ACCTGCGCTG GGGGAAGGCG 
CGGCTGGCCG AGCGGCAGGC CGAGGTCTTC GATGTCGACG GCCTTCTGGG GCTGGCCGAG 
AACGAGCTTC TGGTGACGCT CGACCAGAGC GCACGACGCG AGATCGAGGC GGCGGCGCGT 
CAGGTGGCGG CGGTCACAGC GCTGGTGCCG CTGGCGCTCG CCGATGTGGC GACGGCGCTC 
TATGCCAACC TCCGCATGGT GCGCCGCATC GCCGAGATCT ACGGCGGGCG CTCGGGCAGC 
TTCGGCAGCG TGCGGCTGCT GCGCCGGGTG TTCTCGTCGC TGATCGCGGC GGGGGCGGTG 
GCCATGACCG ACGATCTGCT CCATTCGGTC GCGGGCGGGG GCGTGCTCTC GAAGGTCTCG 
CGCCGGTTCG GCGAGGGGAT GGTGAACGGC GCCCTCACCG CGCGGGTGGG GGTGGCCGCG 
ATGGAACTCT GCCGCCCGCT GCCCTTCCAC ACCGCGCCGC GCCCGAAGGT CACGAACCTC 
ATCAGCCGCA GCCTCACCGG CCTCTTCGAC CGGTGA

Protein sequence

MSDKPPKKPL LLDWDTREET AADAPRARRQ SAAPETVSGP TPADVPPVPD LDLPQGQAML 
AASRIATVRS SRLGRFAGWI FGTLLSFVLS VAAWDFVTSL LSRNSVLGAA AFVLIGTAVL 
TALALALREW WAYVRLERLD SLREAAIAAR ATNDLKAARR VVTSIEKMYG HRADLRWGKA 
RLAERQAEVF DVDGLLGLAE NELLVTLDQS ARREIEAAAR QVAAVTALVP LALADVATAL 
YANLRMVRRI AEIYGGRSGS FGSVRLLRRV FSSLIAAGAV AMTDDLLHSV AGGGVLSKVS 
RRFGEGMVNG ALTARVGVAA MELCRPLPFH TAPRPKVTNL ISRSLTGLFD R