Gene Strop_2079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_2079
Symbol
ID	5058542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	2352777
End bp	2353886
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	69%
IMG OID	640474342
Product	glycosyl transferase family protein
Protein accession	YP_001158908
Protein GI	145594611
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.377907
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0768803
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACAAGG CCCCACCGGA TACCCGGGCC GGCTTTCCGC TGGCCCGTGA TGAAAAGCCG 
TTATCGATAC GTAGGCGGTA CTTAATGTCG CGTACACCTG ATGTCAGCGT GGTCATCCCG 
ACGTGCGACC GGCCGGCCTT GGTGACTCGG GCGGTCCAGA GCGCCCTCAA TCAGTCCGTC 
ACCACCATCG AGGTCATCGT CGTGGTCGAC GGTGCGGACG CCGGAACGCT CGCCGCGCTC 
GCCGCGCTGC GGGACCCGCG CCTACATGTC CTTCCGCTGA CTGAGCGGGC CGGCGCGCCG 
AACGCGCGCA ACGTCGGCGT CGCGGCGGCC CGCGCCGAGT GGACGGCGTT CCTTGACGAC 
GACGACGAGT GGCTGCCCCA CAAGCTCGAG GTCCAGCTCC GGCTCGCCAG GACCGCCACG 
GTACCCGCGC CGATCGTCGC GAGCCGGCTG GTCAACCGCA CCCCCCGAGC CGAGTTCGTC 
CTGCCACGGC GCCTCCCGGA GCCGGACGAG CCGATCTGCG AGTACCTGAC CGTACGCCGG 
GGCCTCTTTC ACGGCGACGG ATTCATCCAG ACCTCGACGA TCCTGGCTTC GACCGCGTTG 
CTGCGACGCG TGCCGTTCAC GGTGGGCCTC CGCCGTCAGC AGGAGCTGGA CTGGACGCTG 
CGCGCCCTCG CGCACGACGA CGTACGCCTC GTCATGGCCA CTGAGCCACT GGTGCTCTGG 
CACCAGGATG AGGACCGGCC CCGAATCAGC CTCTCCTCCC CGTGGAAGGC ACAGCTCGAC 
TGGTTGCGCT CGATCCGCAC CCTGGTGACC CCTCGGGCGT ACGCGGCGAT CGCGCTCAGT 
ATCATCGGCT CGATGGCGGC CACCACCCGC GATCCGCACG TGTTTCGCAC TGTTCTTGCC 
GATGCTCGGC GACATGGTCG GCCGGGTCTT CTCGACTACC TGACGTACCT GCAGATCTGG 
CTTATCCCAC CCCAGCTTCG GCACACTCTG CGCGACCACA TCCTGGCTCG GCGACGGGTG 
TCGGCGCCCG CCCAGACCCC AGCCGCCGAT ACCGCGCCCA GACCAGCCGA GCCCAACCGG 
ACCGGCGCCG CCGCGTCCCA GAACCCCTGA

Protein sequence

MHKAPPDTRA GFPLARDEKP LSIRRRYLMS RTPDVSVVIP TCDRPALVTR AVQSALNQSV 
TTIEVIVVVD GADAGTLAAL AALRDPRLHV LPLTERAGAP NARNVGVAAA RAEWTAFLDD 
DDEWLPHKLE VQLRLARTAT VPAPIVASRL VNRTPRAEFV LPRRLPEPDE PICEYLTVRR 
GLFHGDGFIQ TSTILASTAL LRRVPFTVGL RRQQELDWTL RALAHDDVRL VMATEPLVLW 
HQDEDRPRIS LSSPWKAQLD WLRSIRTLVT PRAYAAIALS IIGSMAATTR DPHVFRTVLA 
DARRHGRPGL LDYLTYLQIW LIPPQLRHTL RDHILARRRV SAPAQTPAAD TAPRPAEPNR 
TGAAASQNP