Gene Sare_4341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4341
Symbol
ID	5708409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4908125
End bp	4909804
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	70%
IMG OID	641273763
Product	helicase domain-containing protein
Protein accession	YP_001539113
Protein GI	159039860
COG category	[K] Transcription [L] Replication, recombination and repair
COG ID	[COG1061] DNA or RNA helicases of superfamily II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTGGTG GACCCCTGAT CGTGCAGTCG GACAAGACCC TCCTCCTGGA GATCGACCAC 
CCCGACTCGC AGGCATGCCG GCTGGCGATC GCACCGTTCG CCGAGTTGGA ACGCTCCCCA 
GAGCACGTGC ACACGTACCG GCTGACCCCC CTGGGGCTGT GGAACGCCCG GGCCGCCGGC 
CACGACGCCG AGGGCGTGGT CAACGCGCTG ATCACCTACA GCCGCTATCC GGTTCCGCAC 
GCCCTGCTGG TCGACGTGGC CGAGACGATG GACCGGTACG GCCGGCTCCA ACTGGTCAAC 
GACCCGGCAC ACGGCCTGGT GCTGCGGGCC CTGGACCGGG TGGTGCTGGT CGAGGTCGCC 
AAGAGCAAGA AGCTCGCCGG GATGCTCGGC ACGAAGCTCG ACGACGACAC GGTCACGGTG 
CATCCGTCCG AGCGCGGACG GCTCAAGCAG GCGCTGCTCA AGCTCGGCTG GCCGGCGGAG 
GACCTGGCCG GCTACGTCAA CGGTGAAGCC CACCCGATCG CGCTGGCCGA GGCCGGCAAG 
GACGGCGGGA AGCCGTGGAC GCTGCGCTCG TACCAGCGGG AGGCGGTGGA GGCGTTCTGG 
GCCGGCGGGT CGGGTGTGGT GGTGCTGCCC TGCGGCGCCG GCAAGACCCT GGTCGGGGCG 
GCGGCGATGG CCGAGGCGAA GGCGACCACG CTGATCCTGG TGACGAACAC CGTCGCGGGC 
CGGCAGTGGA AACGGGAGCT GGTCGCCCGC ACGTCGCTGA CCGAGGCGGA GATCGGCGAA 
TACTCGGGCG AACGCAAGGA GATCCGCCCG GTGACCATCG CCACGTACCA GGTGTTGACG 
TCACGGCGCG GCGGCGCGTT CACCCACCTG GACCTGTTCG GGGCGCGCGA CTGGGGTCTG 
GTCGTCTACG ACGAGGTGCA CCTGCTGCCC GCGCCGATCT TCCGGTTCAC CGCCGACCTT 
CAGGCCCGCC GCCGGCTGGG GCTGACCGCA ACCCTGGTCC GCGAGGACGG CCGGGAGGGG 
GACGTGTTCA GCCTGATCGG CCCGAAGCGG TACGACGCAC CGTGGAAGGA CATCGAACAG 
CAGGGCTGGA TCGCCCCGGC CGAATGCACC GAGGTACGGG TGACACTGAC CGATGCGGAG 
CGCATGGCGT ACGCGACGGC GGAGGCCGAC GAGCGCTACC GGATGGCGGC GACCACGCGT 
ACCAAGTTGC CGGTGGTGAA GGCGCTGCTC GACCGGCACC CGGGGGAGCA GACGCTGGTG 
ATCGGCGGGT ACATCGATCA GCTGCACCAG TTGGGGGAGT ACTTGGACGC GCCGATCGTG 
CAGGGGTCGA CCACGAACAG GGAGCGGGAG CGGCTGTTCG ACGCGTTCCG CTCGGGTGAG 
CTGCAGACCC TGGTGATCTC GAAGGTGGGC AACTTCTCGA TCGATCTGCC GGAGGCGGCG 
GTGGCGGTCC AGGTGTCGGG CACGTTCGGT TCCCGGCAGG AGGAGGCGCA GCGGCTCGGC 
CGGGTGCTCC GGCCGAAGAT CGACGGCCGG CAGGCACACT TCTACACGGT GGTGTCTCGG 
GACACGATCG ACACCGAGTA CGCCGCCCAC CGGCAACGCT TCCTCGCCGA GCAGGGGTAC 
GCCTACACGA TCGTGGACGC CGACCACGTC CTTGGCCCGT CGCTGCCCTC GGTCGACTGA

Protein sequence

MSGGPLIVQS DKTLLLEIDH PDSQACRLAI APFAELERSP EHVHTYRLTP LGLWNARAAG 
HDAEGVVNAL ITYSRYPVPH ALLVDVAETM DRYGRLQLVN DPAHGLVLRA LDRVVLVEVA 
KSKKLAGMLG TKLDDDTVTV HPSERGRLKQ ALLKLGWPAE DLAGYVNGEA HPIALAEAGK 
DGGKPWTLRS YQREAVEAFW AGGSGVVVLP CGAGKTLVGA AAMAEAKATT LILVTNTVAG 
RQWKRELVAR TSLTEAEIGE YSGERKEIRP VTIATYQVLT SRRGGAFTHL DLFGARDWGL 
VVYDEVHLLP APIFRFTADL QARRRLGLTA TLVREDGREG DVFSLIGPKR YDAPWKDIEQ 
QGWIAPAECT EVRVTLTDAE RMAYATAEAD ERYRMAATTR TKLPVVKALL DRHPGEQTLV 
IGGYIDQLHQ LGEYLDAPIV QGSTTNRERE RLFDAFRSGE LQTLVISKVG NFSIDLPEAA 
VAVQVSGTFG SRQEEAQRLG RVLRPKIDGR QAHFYTVVSR DTIDTEYAAH RQRFLAEQGY 
AYTIVDADHV LGPSLPSVD