Gene Sare_5044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_5044
Symbol
ID	5707315
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5711135
End bp	5712244
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	75%
IMG OID	641274437
Product	hypothetical protein
Protein accession	YP_001539778
Protein GI	159040525
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0151406
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTCAA CCGACCTACC CCGGCTCTCC GTTCGTTCCT GCGCGGACCT GATCGCCGCC 
GTGCCCTACC TGCTCGGGTT CCACCCGGCC GACAGCGTGG TCGTGGTGGC CATGCATGGG 
ACACGGATCA CCTTCGCCGC GCGGGCGGAC CTCCCAGACC GGGACGGGTC CGCCGATCCG 
AGCGGGTCCG CCCGGCCGAA CACCGAGTCT GCCGACCCGG GTGGATCGGA CGAGCGCGCC 
GCGGCGGCAC GGCACCTGGC GGCGGTGGTC GCGCGGCAGA CGACCGACCG GGCGACCGTG 
CTCGGCTACG GACCCGCGTC CCGGGTCACC TGTGCGGTGG ACGCTGTTCG GCAGGCCCTC 
ACCGAGGCCG GGATCCTGGT GCTCGACGCG CTCCGGGTCA CCGATGGTCG CTACTGGTCG 
TACCTCTGCC AGGCGCCGGC ATGCTGCCCG CCCGACGGCA CTCCCTACGA CTCGGGTACG 
AGCCAGGTGG CCGCCGCCGC GGTTCTCGCC GGTCAGGTCG CCCTGCCCGA CCGGGCCGCC 
CTCGTCGCGC AGGTGGCACC GGCAGGGGGT ACCGAGCAGG TTCGGCTGCA GCGGGCCGCC 
GAGCGGGCGC GGCGGCGGTT CGCCGGACTG GTGACCCCGA GGACCGGGGG CGACGTTCCC 
CGCGGGCGGG CGGTGCGGGC AGCGGGGAAC ACCGCGATCC GGGCCGCGCT GCGCCGATAC 
CGGCGGGGCG AACGGCTCGA CGACGACGAG GTGGCCTGGC TGAGCCTGCT GCTGACCGAC 
CCGACGGTCC GGGATCTCGC CTGGGAACGC ACCGATGGGC GAGACGCCGA CAAAGCTCTC 
TGGGCCGACG TGCTCCGCCG GGCGCAACCG GACCTCATCG CCGCGCCCGG TTGCCTGCTG 
GCATTCGCGA CGTGGCGGGC CGGGCACGGG GCGCTGGCGG TGGTGGCGGT GCAACGGGTG 
CTCGCCCAGC AGCCCGATTA CCCGCTCGCG CTGCTCCTGG ACGACCTGCT TCGGCGTGGC 
GTGCCGCCGA CGCGCCTGGC CGGATGGCCT GCCGTCCAAC TGCCCGGTGC GGTTCGTCCC 
CGCCGTCGAC GCGGGCGCGG TGCCCGCTGA

Protein sequence

MTSTDLPRLS VRSCADLIAA VPYLLGFHPA DSVVVVAMHG TRITFAARAD LPDRDGSADP 
SGSARPNTES ADPGGSDERA AAARHLAAVV ARQTTDRATV LGYGPASRVT CAVDAVRQAL 
TEAGILVLDA LRVTDGRYWS YLCQAPACCP PDGTPYDSGT SQVAAAAVLA GQVALPDRAA 
LVAQVAPAGG TEQVRLQRAA ERARRRFAGL VTPRTGGDVP RGRAVRAAGN TAIRAALRRY 
RRGERLDDDE VAWLSLLLTD PTVRDLAWER TDGRDADKAL WADVLRRAQP DLIAAPGCLL 
AFATWRAGHG ALAVVAVQRV LAQQPDYPLA LLLDDLLRRG VPPTRLAGWP AVQLPGAVRP 
RRRRGRGAR