Gene Sare_3843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3843
Symbol
ID	5707921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4375713
End bp	4376774
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	75%
IMG OID	641273265
Product	aminoglycoside phosphotransferase
Protein accession	YP_001538627
Protein GI	159039374
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0510] Predicted choline kinase involved in LPS biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.451264
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000808201
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGACCACCC GCCGGCCCGG CTGGTCCGAT CTGCCAGTGG GAATGCGGGC GGCTCTCGCC 
GACCGCCTCG GTGCCCCCGT GGTCGCCACC CGCACCGCAA CCGCCGGTTT CACGCGTGGC 
TTCGCCGGGG TACTGACCGC CGCCGACGGC AGTCGGGCCT TCGTCAAGGC CGCGCCCCAC 
GACTCCCGCC TAGCCAGCTG GTACGGATGG GAGGCGGCGA TCCTCGACCG GCTCCCGTCC 
GGCTTGCCGG CGCCCCGCAC CCGCTGGACG CTGGCCGACT CCAGCTGGTT CGCGATCGCC 
CTCGACGTGG TCGACGGCTA CCCGCCCCGG CGCCCGTGGG AGCCGTCGGA GCTGGCCAGC 
ACCCTGACCG CGTACGCGGG CGTCGCCGCC GCCCTGAACA CCCCGCCGAA CGACCTCGCC 
GCGCTCAACC CGCCCCACCT GGCCGACCTG GCCCAGGCCG ACATCCTCCG TTGGGGCGAT 
GTGGCGGCGG GCCGGGAGCC CGCTCCGCCG TTCCCCGCCG GACTTGAGCA GCGGCTGCCC 
GAGTTGGTCG GGCTCGAGTC CCGACTCCCG GGGTACGTCG CTTCGGCGTC CAGTCTGATC 
CACGGCGACC TACGGCCGGA CAACGTGCTG TTCGGCCCGG ACGGGCAGGT GTGGTTCTGC 
GACTGGACCT GGCTCTGTCG CGGTCCGGCC TGGTTCGACC TGGTGACGCT GCTCCTCGGC 
GGGCACGCCG CCGGCGATCC GGAGGTCACG GTCGGACCAC TGGCCACGAC CGGCGGCACG 
GGGTTGCCTG CCGGCCCGAC GAGGGTGTCC GGCCCGGAGG CCGCCGTCGC ACCAGCGCCC 
GCCGTGACCA CGGACTGGCT GGACGCCGCC TTCGCGGCGC ATCCAGCCGC CGCCAACGCT 
CCCCCAGACG CCCTGGACGT CACGCTGGCG GCGCTGGCCG GCTACTTCCT CACCACCCCG 
ACCCTGGTCC CGGACACCGC GACCGAACAG TTCACGGCCC ACCAGCGCCG CAGCGGCGAG 
TACGCATTCG CCTGGCTCGC CTGCCGTCAG GGCTGGTCCT GA

Protein sequence

MTTRRPGWSD LPVGMRAALA DRLGAPVVAT RTATAGFTRG FAGVLTAADG SRAFVKAAPH 
DSRLASWYGW EAAILDRLPS GLPAPRTRWT LADSSWFAIA LDVVDGYPPR RPWEPSELAS 
TLTAYAGVAA ALNTPPNDLA ALNPPHLADL AQADILRWGD VAAGREPAPP FPAGLEQRLP 
ELVGLESRLP GYVASASSLI HGDLRPDNVL FGPDGQVWFC DWTWLCRGPA WFDLVTLLLG 
GHAAGDPEVT VGPLATTGGT GLPAGPTRVS GPEAAVAPAP AVTTDWLDAA FAAHPAAANA 
PPDALDVTLA ALAGYFLTTP TLVPDTATEQ FTAHQRRSGE YAFAWLACRQ GWS