Gene Strop_3247 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_3247
Symbol
ID	5059712
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	3722387
End bp	3723514
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	74%
IMG OID	640475495
Product	glycosyl transferase family protein
Protein accession	YP_001160059
Protein GI	145595762
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.14939
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.122558
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCTGT TGCTGGCGGT GCTGGCCGGC GTGGCCGCGC TGACCGCGCA CACCCTGGTC 
AACGCCGGCC GTTGGCTGCG CCGCCCGGCC GGGACGCCGG CAACGGTGAC CGAACCGGTG 
GCGGTGCTGC TGCCGCTGCG CGACGAGGCT GCCCGAGTCA CCCCATGCCT GCGCGCGCTG 
CTGGCCCAGC GCGACGTACC AGAGCTACAG ATCGTGGTGC TCGACGACGG GTCAACCGAC 
GGCACCCGCG AGGTCGTCCG CACGGTCGCC GGCGACGACT CCCGGGTCAC CCTGCTCGAC 
GGCGGCGCTC CACCGCCCGG TTGGCTGGGC AAGCCGCACG CCTGCTGGCA GCTCGCCACC 
CGGGCCGATC CGGCCGCCAC CGTGCTGGTC TTCGTCGACG CCGACGTGGT GCTCGCCCCG 
CACGCCGTGG CCGCGGCGGT CGGCGAGCTA CGCGCCGCGC GGGTGACGCT GCTGTCGCCG 
TACCCCCGAA TCCTGGTCAC GACGGTGGCC GACCGGCTGG TTCAGCCGCT GTTGCAGTGG 
TTGTGGCTGA CGTTCCTGCC ACTGCCCGCG ATGGAACGGT CGGCCCGGCC GTCCCTGGCC 
GCGGCCGGTG GGCAGTTCCT GGTCGTGGAC CGGGTCGGGT ACAACGCCGC CGGTGGACAC 
GCAGCGGTGT CCGACCGGGT TCTGGAGGAT GTCGAGTTGG CCCGGGCGGT CAAACGGTCC 
GGCGGCCAGG TCGCCCTCGC AGACGGCTCG CAGCTGGCCA CCTGCCGGAT GTACGACGAC 
TGGCCGCAGC TACGCGACGG CTACTCGAAG TCGCTGTGGG CCTCGTTCGG TCATCCCTCG 
GCGGCAGCCA CGGTGGTCGC GCTGCTGCTG CTGCTCTACA CCGTCCCCGC GCTGGTCGCC 
GTGGCCGCGC TGGTCGGCGG CGCGCCAGGG GCAGCCGCCG TCGCCGCTGC GGCATACCTG 
CTCGGGGTCG CCGGGCGAGT GGTCAGCGCC CGGGCGACCA GCGGCCGGTG GTGGCCAGAC 
GCGTTGGGGC ATCCCGCGTC GGTAGCGGTC CTCGGTTGGC TGACCCTACG GTCGTACCAT 
CTGCGGAAGC GACGGCGCCT GAGTTGGCGG GGCCGTCCGG TCGTCTAG

Protein sequence

MILLLAVLAG VAALTAHTLV NAGRWLRRPA GTPATVTEPV AVLLPLRDEA ARVTPCLRAL 
LAQRDVPELQ IVVLDDGSTD GTREVVRTVA GDDSRVTLLD GGAPPPGWLG KPHACWQLAT 
RADPAATVLV FVDADVVLAP HAVAAAVGEL RAARVTLLSP YPRILVTTVA DRLVQPLLQW 
LWLTFLPLPA MERSARPSLA AAGGQFLVVD RVGYNAAGGH AAVSDRVLED VELARAVKRS 
GGQVALADGS QLATCRMYDD WPQLRDGYSK SLWASFGHPS AAATVVALLL LLYTVPALVA 
VAALVGGAPG AAAVAAAAYL LGVAGRVVSA RATSGRWWPD ALGHPASVAV LGWLTLRSYH 
LRKRRRLSWR GRPVV