Gene Rsph17029_3843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3843
Symbol
ID	4898864
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	973842
End bp	974921
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	67%
IMG OID	640114447
Product	hypothetical protein
Protein accession	YP_001045695
Protein GI	126464582
COG category	[S] Function unknown
COG ID	[COG4307] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0394759
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCCGC CCGCCGGTGG GCGCGGTCCT TTCCCAACTC CGGTCGGTCC CGTGCAACGC 
TATCGCTGCC CCTCCTGTCA TCAGGAAATC TTCTTCCGCA ACACGGCCTG CCTGGCCTGC 
GGCATCCAGC TGCTCTTCGA TCCGGACAGG GGCTTCTCGG ACATGGCGGA AACCGGCCAT 
CCCTGCGCCA ACCGCGATCA GATCAACTGC AACTGGTCGG CCGACGAGCC AGGCGCCCTG 
TGTTTGTCCT GCCAGCATAC GACGGTGGTG CCGGACCTGT CGGTTCCCGC CAACATCGAC 
CGGTGGGAGA GGATCGAGAC CGTGAAGCGG CCCCTGATCC TGATGCTGCA CCGGCTGGGC 
CTGCCGCTCT TCGATGAGGC GGGCATGCCC GTCCCCCGGT TCGAACTGAA GGGCGAAACC 
GGAGACGCCA CGGCACCGCG GGTGCTCACC GGCCATGCGG AAGGCACGAT CACCCTCAAT 
ATCGCCGAGG CGGACGATGC CGAGCGCGAG CGCATCCGGG CGGAGATGAA CGAGCCCTAC 
CGCACCCTGA CGGGGCATCT GCGCCACGAG GTGGCCCACC ACTACTGGGA TGTCCTGACC 
GAAGCACGGC CGGACCGGCT CGAGACCCTG CGCGCGATCT TCGGCGACGA CCGGCAGGAT 
TACGGTGCGG CCCTTCAGGC GCATTATGCC GAAGGCGCCC CGCCCGACTG GGCCGAGAGC 
TACATCTCGG CCTATGCGAC GGCCCATCCC TGGGAAGATT TCGCCGAGAC CTGGGCGCAT 
GTCTTCCATC TGCTCGACGG GCTGGAGACG GCGCAGGCCT TCGGGCTGAA GGCACCGCAG 
AATCTGCCGG AGGGGCTGGA GCGCCTTGTG CGCGAACCGA TGCCGCACCT GGCACAGGCC 
TGGGTCGAAC TGACGATCGC GTTGAATGCC GTGAACGAGG CCATGGGCCA TGAGACCTTC 
TACCCGTTCG TTCTGGCCCC GCCTGTGGTC GCCAAGCAGG AGGCCATCCG CAGCCTGATC 
GTCGAGGCAA ACTCCGGCGA CGCTGCGGCG GCGCCTTCCG CAAGCGCCCT GCCGCGGTAA

Protein sequence

MLPPAGGRGP FPTPVGPVQR YRCPSCHQEI FFRNTACLAC GIQLLFDPDR GFSDMAETGH 
PCANRDQINC NWSADEPGAL CLSCQHTTVV PDLSVPANID RWERIETVKR PLILMLHRLG 
LPLFDEAGMP VPRFELKGET GDATAPRVLT GHAEGTITLN IAEADDAERE RIRAEMNEPY 
RTLTGHLRHE VAHHYWDVLT EARPDRLETL RAIFGDDRQD YGAALQAHYA EGAPPDWAES 
YISAYATAHP WEDFAETWAH VFHLLDGLET AQAFGLKAPQ NLPEGLERLV REPMPHLAQA 
WVELTIALNA VNEAMGHETF YPFVLAPPVV AKQEAIRSLI VEANSGDAAA APSASALPR