Gene Sare_4744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4744
Symbol
ID	5704569
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5368527
End bp	5370536
Gene Length	2010 bp
Protein Length	669 aa
Translation table	11
GC content	67%
IMG OID	641274142
Product	ATP-dependent metalloprotease FtsH
Protein accession	YP_001539488
Protein GI	159040235
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0465] ATP-dependent Zn proteases
TIGRFAM ID	[TIGR01241] ATP-dependent metalloprotease FtsH

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000616135
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGAACGTA CGCGTTTCTT CCGCCGACCG GTGGTCTGGA TCATCCTGGT CATCCTCGGC 
GCCGTTGTGC TCAGTCAGAT GTTCACCGGG GGCCCCGACT ACCACCGGGT GGACACTTCC 
GTTGCGCTTG ACCAGCTCAA CAAGGGTGGC ATAAAGAAGG TCGTCTTCGC GGACAAGGAG 
CAGACACTCC AGCTCGACCT GGCCGAGAAG ACCGATTTCG GGGACACGTC CACCGACCGG 
ATCGAGGCGC AGTTCCCGTA CGAGGTCGGC GCCCAGGTCT GGAACGAGGT CCTCGACGCC 
AAGGCGAACA ACCGCGTCAC CGGCCCGGCC GACACCGAGG TCTCGTCCGA CAGCATCTGG 
GTGAGCCTGC TGGTCAATCT GCTCCCCATC GCCCTGTTGG TGCTACTGCT GCTGTTCTTC 
ATGTCGCAGA TGCAGGGTGG CGGCTCGCGG GTGCTCAACT TCGGCAAGTC CAAGGCCAAG 
ATGATCACCA AGGACACGCC GAAGACGACG TTCGCCGACG TGGCGGGGTC CGAGGAGGCC 
GTCGAGGAGC TGCACGAGAT CAAGGACTTC CTGCAGAACC CGGCGAAGTA CCAGGCGCTC 
GGCGCCAAGA TCCCGAAGGG TGTGCTGCTG TTCGGCCCGC CCGGAACCGG TAAGACCCTG 
CTGGCCCGTG CGGTGGCCGG GGAGGCCGGG GTGCCCTTCT ACTCCATCTC CGGCTCGGAC 
TTCGTCGAGA TGTTCGTCGG TGTCGGCGCC AGCCGGGTCC GTGACCTGTT CGAGCAGGCC 
AAGACGAACG CGCCGGCGAT CGTCTTCGTG GACGAGATCG ACGCGGTCGG TCGCCACCGG 
GGTGCCGGCA TGGGCGGCGG TCACGACGAG CGCGAGCAGA CTCTCAACCA GCTTCTCGTC 
GAGATGGACG GCTTCGACAC CAAGGGCGGC GTCATCCTGA TCGCCGCCAC CAACCGGCCG 
GACATCCTCG ACCCGGCGCT ACTGCGGCCG GGCCGCTTCG ACCGGCAGAT CCCGGTGGAC 
GCGCCGGACA TGGAGGGCCG CAAGGCCATC CTGCGGGTGC ACGCCAAGGG TAAGCCGTTC 
ACCCCTGACG TCGATCTCGA CGCGGTGGCG CGGCGGACCC CGGGCTTCAG CGGCGCCGAC 
CTGGCCAACG TGATCAACGA GGCCGCGCTG CTCACGGCCC GCCGGGACAA GCGGGCGATC 
ACCAACGACT CCCTGGAGGA GTCGATCGAC CGAGTGATCG CCGGCCCCCA GCGTCGTACC 
CGGGTGATGA GCGACCAGGA GAAGAAGATC ACGGCGTACC ACGAGGGCGG GCACGCCCTG 
GTGGCCTGGG CGTTGCCGCA CGCCGCTCCG GTGCACAAGG TGACGATCCT GTCCCGGGGG 
CGGTCGCTGG GGCACACCCT GGTCCTGCCG ACCGAGGACA AGTACACCCA GACCCGGGCC 
GAGATGGTGG ACACCCTGGC CTACGCACTG GGTGGCCGGG CAGCAGAGGA ACTGGTGTTC 
CACGAGCCCA CCACCGGCGC CGGGAACGAC ATCGAGAAGG CCACCCAACT CGCCCGCGCA 
ATGATCACCC AGTACGGCAT GAGCTCCAAG CTCGGTGCGA TCAAGTACGG CACCAGCGGT 
GACGAGCCGT TCCTCGGCCG CAACATGGGC AATGAGCGGG GCTACTCCGA CGCTGTGGCC 
GCCGAGATCG ACGCCGAGAT GCGGGCACTG ATCGAGCTGG CTCACGACGA GGCGTGGGAG 
ATCCTGGTCG AGTACCGGGA TGTCCTGGAC AACATCGTGC TAGAGCTGAT GGAGAAGGAA 
ACCCTCTCCA CGGCCGACAT GGCCCGCATC TGTGCCCGGG TGGCGAAGCG TCCGCCGATG 
GCTCCGTACA ACGGGTTCGG CAAGCGCCAG CCCTCCACCG AACCGCCGGT TCGCACCCCG 
GCCGAGAACG AGGCGCTCAA GGCGCAGGCC GAAGCCGATG GCGCGTCCGT CAGCGGTGCC 
CCCTCGAACA ACTCGGACGG TCCGCACTGA

Protein sequence

MERTRFFRRP VVWIILVILG AVVLSQMFTG GPDYHRVDTS VALDQLNKGG IKKVVFADKE 
QTLQLDLAEK TDFGDTSTDR IEAQFPYEVG AQVWNEVLDA KANNRVTGPA DTEVSSDSIW 
VSLLVNLLPI ALLVLLLLFF MSQMQGGGSR VLNFGKSKAK MITKDTPKTT FADVAGSEEA 
VEELHEIKDF LQNPAKYQAL GAKIPKGVLL FGPPGTGKTL LARAVAGEAG VPFYSISGSD 
FVEMFVGVGA SRVRDLFEQA KTNAPAIVFV DEIDAVGRHR GAGMGGGHDE REQTLNQLLV 
EMDGFDTKGG VILIAATNRP DILDPALLRP GRFDRQIPVD APDMEGRKAI LRVHAKGKPF 
TPDVDLDAVA RRTPGFSGAD LANVINEAAL LTARRDKRAI TNDSLEESID RVIAGPQRRT 
RVMSDQEKKI TAYHEGGHAL VAWALPHAAP VHKVTILSRG RSLGHTLVLP TEDKYTQTRA 
EMVDTLAYAL GGRAAEELVF HEPTTGAGND IEKATQLARA MITQYGMSSK LGAIKYGTSG 
DEPFLGRNMG NERGYSDAVA AEIDAEMRAL IELAHDEAWE ILVEYRDVLD NIVLELMEKE 
TLSTADMARI CARVAKRPPM APYNGFGKRQ PSTEPPVRTP AENEALKAQA EADGASVSGA 
PSNNSDGPH