Gene Rsph17029_2170 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2170
Symbol
ID	4897616
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2300035
End bp	2301135
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	74%
IMG OID	640112764
Product	glycosyl transferase, group 1
Protein accession	YP_001044045
Protein GI	126462931
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0477227
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGGG CGCGGCTGAC CATCCTCATG ACGGTCGATG CCGTGGGCGG CGTCTGGCGC 
TACGCGATGG ACCTCGCGGC CGGGCTGCGG GGGCAGGTGG ATGTGGTCTT CGCGGGCTTC 
GGCCCCGAAC CGTCCGAGGC GCAGCGGCGC GAGGCCGAGG CGCTGGGTCC GCTCGACTGG 
TGCGATGCGC CGCTCGACTG GCTGGTGGGC GGCGAATCCG AGCTTGCCGT GGTGCCGAAG 
ATGATCGCGG GCGTCGCCCG GCGCCATCGG GTGGATCTGA TCCACCTGAA TCTGCCGTCG 
CAGGCGGCGG GTCTGTCGGT GCCGGTGCCG GTGCTGGCGG TCTCGCATTC CTGCGTCGTG 
ACCTGGTTCG CGGCAGTGCG CGACGGCGTA CTGCCCGCGG GGTGGCTGTG GCAGCGGCGG 
CTGAACCGGC AGGGCCTTGC CGCGGCCGAT GTGGTGGTCA CGCCCACCCG CGCGCAGGCC 
GACCTGATGG CGCGGTCCTA CGGGCCGATG CCCGAGGTGC GGGTGGTGGC CAATGCCAGT 
CGCGTCGCGG CCCCCGCGCG GCGGATGGCG CGGCCGATGG TGCTGTCCGC GGGGCGCTGG 
TGGGACGAGG GCAAGAATGC CGCCGTGCTC GACGCGGCGG CCCCGCTGAT CGACTGGCCG 
GTGGTGATGG CCGGCGCTGC CGCCTCGCCA AAGGGACAGG CCGTGGCGAT CCGGGCGGCC 
GAGGCCCGTG GCGAGATCAG CCATGCCGAG ATGCTCGAAC TGATGTGCGA GGCCTCGATC 
TTCGTCTCGC CCTCGCGCTA CGAGCCCTTC GGTCTGGCCG TCCTCGAGGC CGCGCGGGGC 
GGGCTGCCGC TCGTCCTGTC GGACATCCCC ACCTTCCGCG AACTCTGGGA CGGGGCGGCC 
GTCTTCTTTC CGCCCGAGGA TCCGATGGCG CTGGCCGAGG CGGTCAACCG GCTCATCCGC 
GACCCGGCCC GTCGCCGCAG GCTGGGACAG GCCGCGCAGG CCCGCGCCGC CCTCTACACG 
CCCGAGCGGC AGGCGCGCGC CATGGCCGCC ATCTATGCCG AGCTCTGCCC CATTCCCGAA 
ACTCTCCGCG CCGCGAGGTG A

Protein sequence

MSGARLTILM TVDAVGGVWR YAMDLAAGLR GQVDVVFAGF GPEPSEAQRR EAEALGPLDW 
CDAPLDWLVG GESELAVVPK MIAGVARRHR VDLIHLNLPS QAAGLSVPVP VLAVSHSCVV 
TWFAAVRDGV LPAGWLWQRR LNRQGLAAAD VVVTPTRAQA DLMARSYGPM PEVRVVANAS 
RVAAPARRMA RPMVLSAGRW WDEGKNAAVL DAAAPLIDWP VVMAGAAASP KGQAVAIRAA 
EARGEISHAE MLELMCEASI FVSPSRYEPF GLAVLEAARG GLPLVLSDIP TFRELWDGAA 
VFFPPEDPMA LAEAVNRLIR DPARRRRLGQ AAQARAALYT PERQARAMAA IYAELCPIPE 
TLRAAR