Gene Sde_3779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_3779
Symbol
ID	3966834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	-
Start bp	4780243
End bp	4781259
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	45%
IMG OID	637922876
Product	arsenical pump membrane protein, putative
Protein accession	YP_529246
Protein GI	90023419
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.567439
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGTTGT TTGAACGTTA CTTAAGTGTT TGGGTAGGCC TGTGCATTGT AGCTGGTGTA 
GGCCTTGGCT ATGTAATGCC GAGTGCGTTT AGCGCAATTG CTCACTTAGA AGTGGCCCAC 
GTAAACATTC CCGTGGCGAT TTTTATTTGG GTAATGATTT ACCCCATGAT GATACAAGTG 
GATTTTGCAT CCATTAAAGA TATTGGCAAA AAACCTAAAG GTTTAGTGTT AACACTATTA 
ATCAATTGGC TTATTAAACC GTTCACAATG GCGGCGTTGG GCTGGTTGTT TTTTAAAATA 
CTGTTTGCCG ATTTAGTCGA CCCCGCCACC GCAAGTGAAT ATATAGCGGG TATGATTTTA 
CTGGGTGTAG CGCCATGTAC CGCTATGGTA TTTGTATGGA GCCAATTAAC CAAAGGCGAT 
GCAAATTATA CGCTGGTACA AGTATCGGTT AACGATGTGA TTATGATTTT TGCCTTTGCG 
CCTTTGGCCG CGTTTTTATT AGGCGTAACC GATATTACTG TGCCGTGGGA AACGTTGCTG 
CTATCGGTTT TACTCTATGT GGTATTGCCA CTGGTTGCAG GCATAGCTAC ACGCAAAGCA 
CTGGATGCAG CAGATAATCA CACTCGCTTA AATAATTTTG TGGGCATGTT AAAGCCATGG 
TCGATTGTGG GCTTGCTCGC AACCGTAGTG TTGCTGTTTG GTTTTCAAGC CAACACTATT 
TTAAGTGAGC CTATGGCAAT AGTGCTTATC GCCATCCCTT TGCTTATTCA AACCTACGGC 
ATTTTTGCAA TCGCTTACGC AGGCGCAAAA TGCTTAAAGC TGCCCCACAA TATTGCCGCA 
CCGGCATGCA TGATTGGTAC ATCTAACTTT TTCGAACTGG CGGTAGCGGT GGCCATTTCA 
TTGTTTGGTT TGCATTCTGG CGCAGCCTTG GCAACGGTAG TGGGCGTATT GGTAGAAGTG 
CCAGTGATGT TAAGCCTGGT TGCTTTTGCC AACCGTACTC GTCATTGGTT TGATTAA

Protein sequence

MGLFERYLSV WVGLCIVAGV GLGYVMPSAF SAIAHLEVAH VNIPVAIFIW VMIYPMMIQV 
DFASIKDIGK KPKGLVLTLL INWLIKPFTM AALGWLFFKI LFADLVDPAT ASEYIAGMIL 
LGVAPCTAMV FVWSQLTKGD ANYTLVQVSV NDVIMIFAFA PLAAFLLGVT DITVPWETLL 
LSVLLYVVLP LVAGIATRKA LDAADNHTRL NNFVGMLKPW SIVGLLATVV LLFGFQANTI 
LSEPMAIVLI AIPLLIQTYG IFAIAYAGAK CLKLPHNIAA PACMIGTSNF FELAVAVAIS 
LFGLHSGAAL ATVVGVLVEV PVMLSLVAFA NRTRHWFD