Gene Strop_1584 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_1584
Symbol
ID	5058042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	1802043
End bp	1803161
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	69%
IMG OID	640473857
Product	hypothetical protein
Protein accession	YP_001158428
Protein GI	145594131
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2843] Putative enzyme of poly-gamma-glutamate biosynthesis (capsule formation)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.654532
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.384648
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGTGATG CTGAGGGGTT CGTCGTCGCC GCCGTCGGGG ATCTGCTCAT CGTGCGGGAC 
CGCCCGCACG ACATCTTTCG ACACGCGCGG GAGCAGCTGG CCGGGGCCGA CATCACCTTC 
GGCCAACTGG AGACCGCGTA CGCCGACCAG GGGTCCCGGG GCTCCTCCGG GCCGCGCGGC 
GCCGTCCCCC ACGACGTGGC GAACTATGCC GCCATCCCGC ACGCGGGCTT CGACGTCATC 
TCGATGGCGA GCAACCACAC CGGTGACTGG GGTGCTGACG CGTTGCTCGA CTGCATCGGG 
CGGCTCCGGC GCGATGGCAT CACCGTGGTG GGTGCCGGAG CCGACATCGA CGAGGCCCGG 
CGGCCGGGGA TCATCGAGCG CGATGGCACC CGGGTCGGGT TCCTGGCCTA CTGTTCGGTC 
GCGCCGGAGG GCTACTACGC CGGGCGGGAC AAGCACGGGG TGGCGCCGAT GCGGGCGATG 
ACGCACTACG AACCGTTCGA GTCCGACCAG CCCGGCGGTC CGCCCCTGAT CTCCACTTTC 
ACCAACGACG CCGATTTGGC GGCGCTCACC GCGGACATCT CCCGGCTGCG GGACCAGGTG 
GACGTGCTGC TCGTGTCACT CCACTGGGGC CTGCACTTCC AGCGCGCGAG GCTCGCCGAC 
TATCAGCCGG TGGTGGCCCA TGCCGCGATC GACGCCGGTG CGGACGCGGT GCTCGGGCAC 
CATCCGCACA TCCTCAAACC GGTCGAGGTC TACCAGGGCA AGGTGATCTT CTACAGCCTC 
GGCAACTTCG CCCTCGACCT CAACGATTCC TGGTGGCGGT CATTCAGTCG GGAATGGCTC 
GAAGAAGCCA AGGCGTTCCA CGAGGCGCTC TCCCCCGAAC GGGATCTGAA GGCGGAGGGA 
CGGAACTCGG CGATCGTCCG GCTGCACATC GCCGACGGCG GCGTCAGCCG GGTCGAGATC 
CTGCCCGTGG TGATCAATGA GGAGAACGAG CCGGTGCCGT ACCGGGCGGA CACGCCCGAG 
GGGCGTGCGG TCCGCGACTA CCTGGCGGAG ATCACGGCGG AGGCGGGGAT GAACACCGCC 
TTCGACGTCG TTGACGACAG GGTTCTGGTT CGCATCTGA

Protein sequence

MGDAEGFVVA AVGDLLIVRD RPHDIFRHAR EQLAGADITF GQLETAYADQ GSRGSSGPRG 
AVPHDVANYA AIPHAGFDVI SMASNHTGDW GADALLDCIG RLRRDGITVV GAGADIDEAR 
RPGIIERDGT RVGFLAYCSV APEGYYAGRD KHGVAPMRAM THYEPFESDQ PGGPPLISTF 
TNDADLAALT ADISRLRDQV DVLLVSLHWG LHFQRARLAD YQPVVAHAAI DAGADAVLGH 
HPHILKPVEV YQGKVIFYSL GNFALDLNDS WWRSFSREWL EEAKAFHEAL SPERDLKAEG 
RNSAIVRLHI ADGGVSRVEI LPVVINEENE PVPYRADTPE GRAVRDYLAE ITAEAGMNTA 
FDVVDDRVLV RI