Gene Sde_1806 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_1806
Symbol
ID	3966751
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	2299179
End bp	2300279
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	48%
IMG OID	637920889
Product	hypothetical protein
Protein accession	YP_527278
Protein GI	90021451
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATGG TAAAAAACGC GCTTGCAAAG CCAGTTTGTA TTCAGCGCTC GTGCGTCTTA 
AAACGGTTTA TCCAATTTGT TAGTTGGTTG CTGTTAGGTA TTGGCGTTAT TGCGTGTGAC 
AGTGACAAGC CTAGCGACAA TAATGCCATG CTCGGTGCGC AAGCTCATAT CCAGCAACTA 
CAGTTAAGCA ATCAGATATC AACGTTTACC ATTACACCGC AAATAGGTGG GCGCGGCCTG 
CATTTTGGTT TGGTGGGAGC TGACAATGTA CTTAAGGTAA ACGAGCGGTT GCTGAGTTTA 
CCTGCACCAA AAGTATCATC TAGCTCAGAT AATATTGGCT ATTTAGGGCA CATAAATTGG 
ATTGGGCCGC AGGCTGAGTG GTGGTTGCAT CAAACAGAAA ATCTAGAGCG CCGCCAACAA 
AAGGCAGTAT GGCCGCCAGA TGCCCATACT GTGCTGGCTA GCGCAACGCT AAATGCTATA 
TCAGGCAACG CGGTGACTAT GACTTTGCCC GCAAGCCCAG TTACGGGCTT GAGGTTGGAT 
AAATCCTATG GGTTGCACGA CGATGGCAGC CTGCAATTAG ATGTAACAGC GACTAATACA 
CGGCAAGCCA GTGTGGCGTG GGATATTTGG TTTAACACCC GTCTAAATGC TAATAGCGTG 
TTATACGTAC CTGTTGCTGG GGCCCAAAAT GTGCGTATTG ATACGTTTGG GGAAACTCCA 
TTTAAGCAAT CGGTTGTTGT TGACGAGGGG ATGTTAACCA TCGATTTAAC AGTTGCCGAT 
AGGCTTAAAG GTAAAGCGTT TGTGCAGCCA AGTAAGGGTT GGATGGCCGC ATTCACGGCT 
GATCAATTAT TTGTTATTGA GTTTACGCTT CAGCCACAAG CGGTAATTCA CCCAGCCCAA 
GGGCAGTTGG AATTTTACCT GGATTACAGT GCAAAGAGCG TGGATGCTGG CTTGCTAGAG 
ATGGAGCTGC ATAGCCCTTA CACGCACCTT GAACCGGGGG AGTCGTTCTC AGCACAAGAA 
GTTTGGCGTG TTTATAGCTA CGAAGGGCCA AACGCTGCGC TTTATCACCG CAAGCAGCTA 
GCGTTGCTGG GGTATAAGTA G

Protein sequence

MAMVKNALAK PVCIQRSCVL KRFIQFVSWL LLGIGVIACD SDKPSDNNAM LGAQAHIQQL 
QLSNQISTFT ITPQIGGRGL HFGLVGADNV LKVNERLLSL PAPKVSSSSD NIGYLGHINW 
IGPQAEWWLH QTENLERRQQ KAVWPPDAHT VLASATLNAI SGNAVTMTLP ASPVTGLRLD 
KSYGLHDDGS LQLDVTATNT RQASVAWDIW FNTRLNANSV LYVPVAGAQN VRIDTFGETP 
FKQSVVVDEG MLTIDLTVAD RLKGKAFVQP SKGWMAAFTA DQLFVIEFTL QPQAVIHPAQ 
GQLEFYLDYS AKSVDAGLLE MELHSPYTHL EPGESFSAQE VWRVYSYEGP NAALYHRKQL 
ALLGYK