Gene Sare_3244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3244
Symbol
ID	5705395
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3737672
End bp	3738781
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	68%
IMG OID	641272672
Product	band 7 protein
Protein accession	YP_001538039
Protein GI	159038786
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0330] Membrane protease subunits, stomatin/prohibitin homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACTTCC TGTTGCCGGT CCTTTTGATA GCTGTGGCGG TCATCGGCGT GGTGACCCTG 
GCCCAGGCGG TGCGGATCGT GCCGCAGCAG CGCCAGGATG TGGTGGAGCG GCTCGGCCGG 
TACAAGCGCA CCCTGGACCC GGGGCTGAAC GTGCTGGTGC CGTTCATCGA CTCGGTGCGT 
ACCAAGGTCG ACATGCGTGA GCAGGTGGTC AGCTTCCCGC CCCAGCCGGT CATCACCTCG 
GACAACCTGG TCGTCTCGAT CGATACTGTC CTCTATTTCA AGGTTGTGGA CTCGGTTCGC 
GCCACGTACG AGATTTCGCA TTTTCTCCAG GCCATCGAGC AGCTCACGGT GACCACGTTG 
CGTAACGTCA TCGGTTCTCT TGATCTGGAG CGGGCGCTGA CCAGCCGGGA GGAGATCAAC 
CGGCACCTGT CCGGCGTGCT GGACGAGACC ACCGGTAGGT GGGGGATCAA GGTGACCCGG 
GTGGAGATCA AGGCGATCGA GCCGCCGCCG AGCATCCGGG ACTCGATGGA GAAGCAGATG 
CGCGCCGAGC GGGACCGTCG GGCGGCGATC CTCAACGCGG AGGGGCACAA GCAGTCGCAG 
ATCCTGACCG CCGAGGGCGA GAAGCAGGCG GCGGTCCTGC GCGCCGACGG TGACCGGCAG 
GCCCGCATCC TTCAAGCTGA GGGGCAGGCC AAGGCGGTCC GTACCGTCTT CGACGCCATC 
CACCAGGCAA ACCCGAGCCA GAAGGTGCTC GCCTATCAGT ACCTGCAGGC GCTGCCGCAG 
ATCGCCAACG GCTCCGCCAA CAAGGTCTGG ATCGTCCCGG CCGAGCTGAC GAAGGCGTTG 
GAGGGTATGG GCGGTGCGCT CGGGGGTCTG AGCCAGATGG CCGGTGACGC GCCGTCACCG 
GAGGCGTCCG ACGGGGCGAG CCAGGTCGAG CGGGAGGCCG ACGAGGCCGC GCGTGCCGCA 
GCGGATGCCG CGCGGGAGAT CCACGACGAG GTTCGCGTCG CCGAGGCCCA GGCTGCCGGG 
AGCAAGGGGC CGAAGGGGTT GCCCGCACCC GAGCCGGTCT CCCCGGAGAG TCTGCGGACC 
GACACCACCG AGCAGCGCGA GCGGGGCTGA

Protein sequence

MDFLLPVLLI AVAVIGVVTL AQAVRIVPQQ RQDVVERLGR YKRTLDPGLN VLVPFIDSVR 
TKVDMREQVV SFPPQPVITS DNLVVSIDTV LYFKVVDSVR ATYEISHFLQ AIEQLTVTTL 
RNVIGSLDLE RALTSREEIN RHLSGVLDET TGRWGIKVTR VEIKAIEPPP SIRDSMEKQM 
RAERDRRAAI LNAEGHKQSQ ILTAEGEKQA AVLRADGDRQ ARILQAEGQA KAVRTVFDAI 
HQANPSQKVL AYQYLQALPQ IANGSANKVW IVPAELTKAL EGMGGALGGL SQMAGDAPSP 
EASDGASQVE READEAARAA ADAAREIHDE VRVAEAQAAG SKGPKGLPAP EPVSPESLRT 
DTTEQRERG