Gene Sde_2308 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_2308
Symbol
ID	3968138
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	2932444
End bp	2933979
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	45%
IMG OID	637921399
Product	hypothetical protein
Protein accession	YP_527780
Protein GI	90021953
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG5297] Cellobiohydrolase A (1,4-beta-cellobiosidase A)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00819182
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTGCGAA TCCCCAAGGC TTGGCTGGCA CTTCCACTTG TACTGGGAAG TACCAATCTA 
TACGCTCAAG TAACTTGCAG TATCTCTAAC ACCAATGTTT GGAATAACGG ATACACCGTT 
AATGTTAATG TAACCAACAC AGGCTCTTCA CAGGTTGGTT CTTGGCAGGT TCCTATTAAT 
TTTTCTGAGC CACCTCAAGT AAGCAGCGGC TGGAATGCAA TATTAAGCAC AAACGGAAAC 
ACCGTAACTG CCGGCAATAT TGGTTGGAAT GGTAATTTAA ATCCCGGCCA AAGCGCCTCC 
TTTGGTTTTC AAGGTGGCCA CGATGGCAGC TTTGTGGAGC CCACCTGCTC GGGCGGAGGC 
TCTAGCACTA GCTCAAGCAG CTCTAGTAGT TCTAGCTCAA CAAGTTCTAC CAGTTCTTCA 
TCCACAAGTT CAAGTAGCTC TTCTAGCTCC GGCGGCTCTG AACTTTTAAT CCAAGAAAAT 
GCATCCGGCT TCTGCCGTGT GGACGGATCG ATAGATAACA ATAACTCAGG CTATACCGGT 
AGTGGCTTTG CCAACACCGA GAACCAAAAC GGTTCCGCAG TTGAATACGC ACTTAACGTT 
CCCTCTAATG GGAATTATCT CCTCGACGCT CGATATGCAA GCGCTACTAC ACGATCGGCT 
AGCGTGGTAG TTAATGGATC TTCAGTAGGC AGCTTTAGTT TTCCATCTAC GGGTTCGTGG 
ACAAGCTGGA CAGTTGACTC CGCCAACGTT CCGTTAAAAG GCGGGAATAA TATTGTTCGA 
ATTGTTGCAA CTAACAGCAG CGGATTACCT AATATTGATT CATTAAAGGT AATAGGCACC 
AACCCGTCAG CCGGCAGTTG TTCAAGCAAC TCGTCATCCA CTAGTTCATC GTCTAGCTCA 
AGTTCATCAA GCAGTAACTC CGGTGGCAAA GGCTCTAGCT GCCGTTCTAC AGGCAGTCAA 
TCTGTTTCCT CTACTATTAA AGTTACTAGC GGGACTTTCG ATGGGAACTG TAAAACGTAT 
AACCCTACAA GTGCCCTTGG CGATGGCAGT CAATCAGAAA GCCAGAAACC GGCATTCCGA 
GTGGAGAACG GCGCAACACT CAAAAACGTG ATTCTAGGCA ACAATGGCGT AGACGGTATT 
CATGTTTATA ACGGCGGCAC CTTGGATAAC ATCCGCTGGA CCAATGTGGG TGAAGATGCA 
ATGACCGTTA AATCTGAAGG AAACGTTACC GTTTCAAATA TTGAGGGTTA TGACGGTTCA 
GATAAATTTA TACAAGTAAA CGCAGTTACC AACCTAAAGG TTTCTAATTG CATTGTAGAT 
AAAATGGGTA AATTTTTACG TCAGAATGGC GGTAAAACTT TCGCTATGTC TGTAACCGTA 
GATAATTGTG ATATCTCAAA TATGGGTGAA GGTGTTTTCC GCTCAGACAG CCCAAATGCA 
ACAGCGAGAA TCACAAATAG CCGATTAAAA AATGCAGGCG ACATTTGTAT TGGTAAGTGG 
AAAAGCTGCA CATCTTCCAA CATTACCAGC TTCTAA

Protein sequence

MLRIPKAWLA LPLVLGSTNL YAQVTCSISN TNVWNNGYTV NVNVTNTGSS QVGSWQVPIN 
FSEPPQVSSG WNAILSTNGN TVTAGNIGWN GNLNPGQSAS FGFQGGHDGS FVEPTCSGGG 
SSTSSSSSSS SSSTSSTSSS STSSSSSSSS GGSELLIQEN ASGFCRVDGS IDNNNSGYTG 
SGFANTENQN GSAVEYALNV PSNGNYLLDA RYASATTRSA SVVVNGSSVG SFSFPSTGSW 
TSWTVDSANV PLKGGNNIVR IVATNSSGLP NIDSLKVIGT NPSAGSCSSN SSSTSSSSSS 
SSSSSNSGGK GSSCRSTGSQ SVSSTIKVTS GTFDGNCKTY NPTSALGDGS QSESQKPAFR 
VENGATLKNV ILGNNGVDGI HVYNGGTLDN IRWTNVGEDA MTVKSEGNVT VSNIEGYDGS 
DKFIQVNAVT NLKVSNCIVD KMGKFLRQNG GKTFAMSVTV DNCDISNMGE GVFRSDSPNA 
TARITNSRLK NAGDICIGKW KSCTSSNITS F