Gene Sde_1014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_1014
Symbol
ID	3967768
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	1295551
End bp	1296969
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	48%
IMG OID	637920081
Product	arabinan endo-1,5-alpha-L-arabinosidase
Protein accession	YP_526488
Protein GI	90020661
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3507] Beta-xylosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000000194163
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCTTT GTCGAAAACT CTATCAACTA GCTACAACAG TAGTACTTCT ATGTATGTGC 
GCATTTGCCA ATGCCCAGTT ATCTAATGGC GTGTACTCCA TTACTTCTAA GTTAAGTGGT 
AAGCCTATAG AAATAACGGG GGCGTCTACG GCGGCTGGCG CAAATGTAAT TCAGTGGGCG 
AATAATGGCG GTGATCATCA AAAATGGATT GTCACTCACG AAGGCAATGG CGACTACTCC 
ATAATTAACT TGTTAAGTGG TATGGCGCTG GAGGTGTTTG ATTTTTCCAC GGCAGATGGC 
GGCAATGTTG TGCAGTATGA TTTTTGGCAT GGCGACCCGC AGTTGTGGAC TTTAAGCAGC 
CAGGGCAATG GCTATTATGC CGTGCTAAAT AAACACAGCG GCAAAGCGTT AGATTTGTAT 
GGTTTTGATA CGTCTAACGG CGCGAATATT GCGCAATGGG CCTTTTGGGG CGGGGACCCG 
CAGCAGTGGC AATTTACCAA AATCGCCAAT GTAGGTGCGC CGCCAGTAGA TACATCTACC 
ACCAACGGTG CAACCAACCA CTGGTCCTTA ACCGGTAATC TAGTGACTCA CGACCCCACA 
ATGGCCTACG AAAACGGCTC ATGGTGGTTG TATCAAACCG GCGAGGGAAT TTACGGTAAG 
TATTCAGCCA ATGGTTTGGC GTGGGATGGC TTACCTTCTG TGTTTCCCAA TGGTTTAAGT 
TGGTGGAAGA CCTATGTACC CGGCCAGTCG AACAACGATG TATGGGCGCC TGATGTACGC 
ACTTATAATG GGCGGGTTTA TTTGTACTAT TCCATCTCTA CTTTTGGCTC GCGTGTATCT 
GCCATTGGTT TGGCGTCGGC ATCGAGTTTG GCTGCGAGTG ATTGGCAGGA CCACGGCTTA 
GTAATTAATA CCACCTCATC TAGCGATTGG AATGCGATCG ACCCAGATTT AGTGGTCGAT 
GAGCATGGCA ACCCTTGGTT AACAATGGGA AGTTGGAACA GCGGTATTAA AGTGATGCGC 
TTGAACCCCA TTACCATGAA GCCAATTGGC ACACTTTATT CTATTGCGCA AAAGGGCGGC 
GGTATTGAAG CGCCTTCTAT TGTGTATCGC CGTGGGTATT ACTATTTATT TGTTTCTATC 
GGCAAATGCT GTGCGGGCGT AGATAGCACC TATCAAATTG CTTACGGGCG CTCTACAAGT 
ATTACCGGCC CTTATTTGGA TAAGAACGGC AACGATATGA TGAGTGGTGG TGGCAGTATT 
TTAGATGCGG GCAACAACGT GTGGGTTGGC CCTGGTGGGC AAGATATTAT TAACACCGAT 
GTCATTGTGC GCCACGCGTA CGATGCCACA GATGCAGGCA CACCTAAGAT GATTATTAGT 
ACCTTGAATT GGGATGCTAA TGGATGGCCG AAATACTAG

Protein sequence

MNLCRKLYQL ATTVVLLCMC AFANAQLSNG VYSITSKLSG KPIEITGAST AAGANVIQWA 
NNGGDHQKWI VTHEGNGDYS IINLLSGMAL EVFDFSTADG GNVVQYDFWH GDPQLWTLSS 
QGNGYYAVLN KHSGKALDLY GFDTSNGANI AQWAFWGGDP QQWQFTKIAN VGAPPVDTST 
TNGATNHWSL TGNLVTHDPT MAYENGSWWL YQTGEGIYGK YSANGLAWDG LPSVFPNGLS 
WWKTYVPGQS NNDVWAPDVR TYNGRVYLYY SISTFGSRVS AIGLASASSL AASDWQDHGL 
VINTTSSSDW NAIDPDLVVD EHGNPWLTMG SWNSGIKVMR LNPITMKPIG TLYSIAQKGG 
GIEAPSIVYR RGYYYLFVSI GKCCAGVDST YQIAYGRSTS ITGPYLDKNG NDMMSGGGSI 
LDAGNNVWVG PGGQDIINTD VIVRHAYDAT DAGTPKMIIS TLNWDANGWP KY