Gene Sare_3336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3336
Symbol
ID	5708291
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3847618
End bp	3849468
Gene Length	1851 bp
Protein Length	616 aa
Translation table	11
GC content	71%
IMG OID	641272763
Product	ATP-dependent DNA helicase RecQ
Protein accession	YP_001538130
Protein GI	159038877
COG category	[L] Replication, recombination and repair
COG ID	[COG0514] Superfamily II DNA helicase
TIGRFAM ID	[TIGR00614] ATP-dependent DNA helicase, RecQ family [TIGR01389] ATP-dependent DNA helicase RecQ

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00306919
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCCTCCC CCACCGACCA GCGCCCCGCC GCGCTGGAGA CGCTGCGGCG TGTCTTCGGC 
TACGACGCCT TCCGGGGCTT CCAGCAGGAG GTCATCGCAC ACCTGACGGC CGGCGGGGAC 
GCCTTGGTGT TGATGCCCAC CGGTGGCGGC AAGTCGCTGT GCTACCAGAT CCCGGCACTG 
CTGCGGGACG GAGTCGCGGT GGTCGTGTCG CCGTTGATCG CACTGATGCA GGACCAGGTC 
GACGCGCTGA CCGCGGTCGG GGTTCGGGCC GGCTTCCTCA ACTCGACGCT GGACCTCGAC 
GCCCGTCGCG CCGTCGAGCG GGCCTTCGTC GCCGGTGACC TGGACCTGCT CTACCTCGCC 
CCGGAAGCCC TGGGCACCCG GGGCGTGCAG CACCTGCTCG ACCAAGGGAA CATCAGCCTG 
TTCGCGATCG ACGAGGCACA CTGTGTGTCG CAGTGGGGGC ACGACTTCCG CCCGGACTAC 
CTCACCCTGT CGGTGCTGCA CGAGCGTTGG CCCGGGGTGC CCCGCATCGC GTTGACCGCC 
ACCGCGACCA GCGCCACTCG GGCCGAGATC TCGACCCGGC TGCAGCTCAC CTCGGCCCGG 
CACTTTGTCG CCAGCTTCGA CCGCCCCAAC ATCCAGTACC GCATCGTCCC GAAGCGGGAG 
CCGAAGCGGC AGCTGCTGGC CCTGCTGCGG GACGAGCACC CGGGGGATGC CGGAATCGTC 
TACTGCCTGT CCCGGGCCAC CGTGGAAAAG ACAGCGGAGT TCCTGGTCGA CAACGGTATT 
GCCGCACTGC CGTACCACGC CGGCCTGGAC GCGGCCACCC GAGCTCGACA CCAGCAGCGC 
TTCCTGCGGG AGGACGGCCT GGTCATGGTC GCGACGATCG CGTTCGGGAT GGGCATCGAC 
AAGCCTGACG TGCGGTTCGT CGCCCACCTC GACCTGCCGA AGTCGGTGGA GGGCTACTAC 
CAGGAGACCG GCCGCGCCGG GCGGGACGGC CTGCCGTCGA CGGCCTGGCT CGCCTACGGT 
CTGACGGATG TGGTGCAGCA ACGCCGGCTG ATCGACACCT CGGAGGGGGA TCTGGCGCAC 
CGGCGTAACC TCGCCGCCCA CCTGGAGGCG ATGCTCGCGC TCTGCGAAAC GGTCCGCTGT 
CGCCGGGTGC AGCTGCTGGA CTACTTCGGC GAGACCGCCA CCGCCTGCGG CAACTGCGAC 
ACGTGCCTGC AGCCACCCGA GTCGTGGGAC GGCACGATCG CCGCGCAGAA GCTGCTGTCC 
ACGGTGTACC GGCTCGACCG GGAGCGACAC CAGCGGTTCG GCACCGGGCA CTGTGTCGAT 
ATCCTGCTCG GCCGCGCCAC CGACAAGGTC CAGCAGCACC GGCACGACTC CCTGACAGTG 
TTCGGGATCG GCACCGAGCT GAGCGAGGCG GAGTGGCGGG GTGTGGTCCG GCAGCTGCTC 
GCCGAAGGGC TGCTGGCGGT TGAGGGCGAC TACGGCACCC TGGCCCTCAC CGACACCAGC 
GCGGAGGTGC TGGGCCGGCG CCGCACCGTC ATGCTGCGCC GCGAACCGGC CCGGACCGCC 
CGGCCGGCGA AGCCACGCGG CGCGGCCACC ATGGTCGCCG AGCTGGCCCC GGCCGCCGCC 
GAGGTCTTCG AGCGGCTACG CGCCTGGCGG GCCGCCACGG CCAGGGAACA GGGCGTGCCC 
GCCTACGTGA TCTTCCACGA CGCCACGCTG CGGCAGATCG CCAGCGACGC ACCGTCAGCA 
TTGGCTGACC TGGCCCGGGT CAGTGGTGTC GGCGAGGCGA AACTCGCGAA GTACGGCGAG 
CAGGTGCTGG CCGTCCTCGC CGGCGGCGAT GCGGACCCAC ACACCGCCTG A

Protein sequence

MPSPTDQRPA ALETLRRVFG YDAFRGFQQE VIAHLTAGGD ALVLMPTGGG KSLCYQIPAL 
LRDGVAVVVS PLIALMQDQV DALTAVGVRA GFLNSTLDLD ARRAVERAFV AGDLDLLYLA 
PEALGTRGVQ HLLDQGNISL FAIDEAHCVS QWGHDFRPDY LTLSVLHERW PGVPRIALTA 
TATSATRAEI STRLQLTSAR HFVASFDRPN IQYRIVPKRE PKRQLLALLR DEHPGDAGIV 
YCLSRATVEK TAEFLVDNGI AALPYHAGLD AATRARHQQR FLREDGLVMV ATIAFGMGID 
KPDVRFVAHL DLPKSVEGYY QETGRAGRDG LPSTAWLAYG LTDVVQQRRL IDTSEGDLAH 
RRNLAAHLEA MLALCETVRC RRVQLLDYFG ETATACGNCD TCLQPPESWD GTIAAQKLLS 
TVYRLDRERH QRFGTGHCVD ILLGRATDKV QQHRHDSLTV FGIGTELSEA EWRGVVRQLL 
AEGLLAVEGD YGTLALTDTS AEVLGRRRTV MLRREPARTA RPAKPRGAAT MVAELAPAAA 
EVFERLRAWR AATAREQGVP AYVIFHDATL RQIASDAPSA LADLARVSGV GEAKLAKYGE 
QVLAVLAGGD ADPHTA