Gene Sde_2031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_2031
Symbol
ID	3967294
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	2559095
End bp	2560714
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	46%
IMG OID	637921119
Product	ABC transporter ATP-binding protein
Protein accession	YP_527503
Protein GI	90021676
COG category	[R] General function prediction only
COG ID	[COG1123] ATPase components of various ABC-type transport systems, contain duplicated ATPase
TIGRFAM ID	[TIGR02323] phosphonate C-P lyase system protein PhnK

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00115375
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCACC TAATAGTTAA AAATTTAACC ACCCACTTTT ATACACGCGA AGGTTTAACC 
ACCGCTGTAG ATAACGTTAG CTTTACCCTA GAAGCGGGCC AAATACTTGG CATAGTTGGC 
GAATCCGGCT CGGGTAAATC TGTTGCTTGC TACAGTTTGC TAGGTTTAAT TCCTAGCCCA 
CCGGGCAAAG TGGTTAATGG CAGCGCTCTG TTTAACGGCG AAGACCTTCT TACTAAAACA 
GAAGCGGAAT TACGCAGTGT GCGCGGCAGA AAAATTAGCA TGATTTTTCA AGACCCTATG 
ACCTCCCTCA ACCCGCACAT GCGTATAGGT GATCAACTAA TAGAAGCCTA TCGCTTGCAC 
CACAAAAGCA CTAAAAAACA GGCAACCGAA AAGGCGATAC AGCTTCTACA AGAAGTGGGT 
ATTAAAGACG CCGACACACG CATACGTGCC TACCCTCATG AATTTTCTGG CGGTATGCGA 
CAGCGCGCCA TGATCGCCAT GGCTTTGATT ACCGAGCCAG AATTATTAAT AGCCGACGAA 
CCAACAACTG CACTGGACGT AACCGTACAA GCGCAAATTC TACAGTTGAT TAAATCGATC 
CAGCAGAAGC GACACCTAAG TGTCATTTTT ATTTCGCACG ACTTAGCTGT AGTTTCACAA 
ATTGCCGACC AGCTTATCGT TATGAAAGAA GGTAAGGTGG TAGAAAGCGG TGCAACTGCG 
AGCGTTTTTA GCGAGCAAAA GCACCCTTAT ACAAAAAAAT TAATTGCTGC TATTCCCAAT 
AAAGCCAAGC AGGTTAAATA TACCGCTACC GAAACCAACC CTTTGTTAAC GGTTAATAAT 
CTTTCCACCA GCTTCGCGCA AGAAACCACC AGTTGGTTTG GCAAAAAGGC CGCCCGTAAG 
GTAGTGGTAA AAGATATTAG CTTTTCAATT CAGCAAGGCG AAATACTCGG GTTAGTTGGT 
GAGTCTGGCT CGGGTAAATC TACCCTTGGT CGCAGTGTTA TTAAATTAAT TAACGCCGAT 
AACGGCGAAA TAAACATAGA CCAACATTGC ATTCACACCT TGCAAGGTGA CAAGCTAAAA 
CAAGCCCGCA AAGATTTTCA AATGATCTTT CAAGACCCGT ACGCGTCGCT TAACCCAAGG 
TTAACGGTAT TTGACGCGCT GGCAGAACCG CTGCTTTTGC ACGGCATTGC CAACAAAACC 
AATGTGGTGG AGAAAGTTAA CACCTTAATG GATGACGTAG GCCTTGCCCG TAAGTTTGTG 
CGCAAATACC CCCATGAGTT TTCTGGTGGC CAGCGCCAGC GTATAGCCAT AGCTCGCGCC 
TTAGCCCCAC AACCAAAGCT CATAATTGCC GATGAGCCCG TATCGGCGTT GGATGTAACC 
ATCCAAGCAC AAATATTAGA GCTACTGCTT AACCTTACTC AAAAGCACTG CCTCGCTATG 
TTATTTATTT CGCACGATTT AGCCGTTGTG CGCTACCTGT GCGACCGAGT AATGGTTATG 
CACAACGGCA ACCTTGTAGA GCAAGGGCCT ACCGAAGACA TTTATAACCA GCCCACTCAC 
CCTTATACCC AAACGTTAAT TAGCGCGATT CCAACTTTTA TGACACAAAA TATGCACTAA

Protein sequence

MSHLIVKNLT THFYTREGLT TAVDNVSFTL EAGQILGIVG ESGSGKSVAC YSLLGLIPSP 
PGKVVNGSAL FNGEDLLTKT EAELRSVRGR KISMIFQDPM TSLNPHMRIG DQLIEAYRLH 
HKSTKKQATE KAIQLLQEVG IKDADTRIRA YPHEFSGGMR QRAMIAMALI TEPELLIADE 
PTTALDVTVQ AQILQLIKSI QQKRHLSVIF ISHDLAVVSQ IADQLIVMKE GKVVESGATA 
SVFSEQKHPY TKKLIAAIPN KAKQVKYTAT ETNPLLTVNN LSTSFAQETT SWFGKKAARK 
VVVKDISFSI QQGEILGLVG ESGSGKSTLG RSVIKLINAD NGEINIDQHC IHTLQGDKLK 
QARKDFQMIF QDPYASLNPR LTVFDALAEP LLLHGIANKT NVVEKVNTLM DDVGLARKFV 
RKYPHEFSGG QRQRIAIARA LAPQPKLIIA DEPVSALDVT IQAQILELLL NLTQKHCLAM 
LFISHDLAVV RYLCDRVMVM HNGNLVEQGP TEDIYNQPTH PYTQTLISAI PTFMTQNMH