Gene Sare_2839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2839
Symbol
ID	5708013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3224412
End bp	3225371
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	70%
IMG OID	641272295
Product	hypothetical protein
Protein accession	YP_001537665
Protein GI	159038412
COG category	[R] General function prediction only
COG ID	[COG1545] Predicted nucleic-acid-binding protein containing a Zn-ribbon
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.11529
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0470778
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACCCCG CTCCGGCATC GCCGCTCGCC GCCCCGCTGG ACATCAGCTT CGACTACACC 
CGGTCGCTCG GTCCGGTCCT GGGCCAGTTC ATGACCGGAC TACGCGACCG TCGGGTGCTC 
GGCGCACGCA CCAGCGACGG CCGCGTCCAC GTACCCCCAC TCGAGTACGA TCCGGCGACC 
CACGCCCCGG TGACCGAGCT CGTCCCCGTC CAGCCAACCG GCACCGTGAC CAGCTGGACC 
TGGACTGAGA GGCCGCTGGA CGGGCAGCCA CTGGACCGAC CGTTCGGATG GGCGCTGATC 
CGGCTCGACG GGTCCGACAC ACCGCTGCTA CACGCCGTCG ATGCCGGCCG CGAGTCGATG 
CGGACCGGCA TGCGGGTGCG GATTCGCTGG GCCACCAGGC GATCAGGACA CATCCGCGAC 
ATCGCGTGCT TCGAGCCCGT ACAGGCCCCG GACCCCGGGG TCGATCCAGC CGCCGGCGGC 
GACCCGGTCA CGGTCATGAC GACACCGATC CGACTCTCCT ACACGCACAC CACCTCCGCC 
GAGGAGAGCC GTTACCTCCG CGCGCTGGCC GAGGGGCGGC TACTCGGACA GCGCTGCCCG 
GTCTGCCGCA AGGTCTACGT ACCACCCCGG GTCTGCCCGG CGGACGGCGT GCCGACCGAG 
GACGAGGTGC CGGTGCGCGA TCACGGCACG GTCACCACGT ACTGCGTGGT CAACGTTCCG 
TTCGCCGGCC AACGACTGGA CCCCCCGTAT GTGGTGGCCC AGATCCTGCT GGACGGTGCC 
GACATCCCGA TCCCACATCT GATCCTCGGC CTGCCCACCA GCGAGGTACG GATGGGCATG 
CGGGTGGCCG CGGTGTGGCG GGACCCGGAA ACCTGGTCGA CCACCCCGGA GAACATCGCG 
CACTTCCGCC CCACCGGCGA ACCGGACGCG CCATACGAGT CCTACCAGGA GCACCTGTGA

Protein sequence

MDPAPASPLA APLDISFDYT RSLGPVLGQF MTGLRDRRVL GARTSDGRVH VPPLEYDPAT 
HAPVTELVPV QPTGTVTSWT WTERPLDGQP LDRPFGWALI RLDGSDTPLL HAVDAGRESM 
RTGMRVRIRW ATRRSGHIRD IACFEPVQAP DPGVDPAAGG DPVTVMTTPI RLSYTHTTSA 
EESRYLRALA EGRLLGQRCP VCRKVYVPPR VCPADGVPTE DEVPVRDHGT VTTYCVVNVP 
FAGQRLDPPY VVAQILLDGA DIPIPHLILG LPTSEVRMGM RVAAVWRDPE TWSTTPENIA 
HFRPTGEPDA PYESYQEHL