Gene Sde_3039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_3039
Symbol
ID	3967703
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	3885672
End bp	3886763
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	45%
IMG OID	637922136
Product	hypothetical protein
Protein accession	YP_528508
Protein GI	90022681
COG category	[S] Function unknown
COG ID	[COG4299] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000596347
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCCACAC AACGCTATTT GGCCCTCGAC GTTATGCGCG GGGCAACGCT CGCCATGATG 
ATACTTGTGA ACACCCCCGG CGACTGGGGC TTTGTTTACG CCCCCCTGCT ACATGCAGAT 
TGGCATGGTG TCACCATTAC CGATTTTGTG TTTCCGTTTT TCCTTTTTAT TATTGGTTCG 
GCGTTATTTT TTACTAGCCG TTCTAGCGGG CAGCTAGCCC CAGCAATTAA AGCTAAAAAA 
ATAATTAAGC GTACAGCGCT GCTATTTACT ATTGGCTTAT TGCTGCATGC ATTCCCTTTT 
ACTACGGCGC TTAGTGAGTT ACGCATACTA GGCGTATTGC AACGCATAGC GCTAGCCTAT 
GGCATAGCGG CGTTTATTGT ATGGCTACCC ACCACGCAAC GGCTAATGGC GGCGCTAGGC 
ATATTAGTAG CCTACTGGCT TGTATTTATA CTCACCGATA GCAGTTACCA TTTAGCAGAC 
AATATTGTAA GGCACATAGA TATTACCATT TTAGGCGCAG AACACTTATG GCAAGGTAAA 
GGCTTAGCCT TTGACCCAGA GGGCTTACTT AGCACCTTAC CTGCCGCCGT AAATATATTG 
GCGGGCTTTG AAGCTACACG TTTATTGGTA AGCCAACCAG CTGGCGAGCC AAATAATGCC 
ACCAGCCGCC AATTTAAATT GGCGCTGTAC GCCATGTGCA GTATTACTAT TGCATTAATT 
TGGCACCGCT GGATGCCCAT AAATAAATCG CTTTGGACAA GCAGCTTTGT GCTGCTAACT 
AGCGGCGTGG GTGTGCTAGT GCTTTTATTA TTAGTTAGAT TAGAACCTTA CCGCGCAACT 
GCAGCTATTT ATCGCGCCTT CGCAATTTAT GGCCAAAACC CATTGTTTAT TTATGTATTA 
TCTTCACTTT GGGTGCAGTG CTATTTTCTG TTTCATATAG ACGGCGTAAA TATTTATGCT 
TGGCTGAATA ATCAACTGAA CTCAATTGCC GAACCTTATT TGGCAAGCTT GCTATTTGCT 
CTGGGGCATG TCGCGTTGTT TTGGGGAGTG GCATACGCAT TACATAAAAA GCGTATTGTA 
ATAAGTGTTT AG

Protein sequence

MATQRYLALD VMRGATLAMM ILVNTPGDWG FVYAPLLHAD WHGVTITDFV FPFFLFIIGS 
ALFFTSRSSG QLAPAIKAKK IIKRTALLFT IGLLLHAFPF TTALSELRIL GVLQRIALAY 
GIAAFIVWLP TTQRLMAALG ILVAYWLVFI LTDSSYHLAD NIVRHIDITI LGAEHLWQGK 
GLAFDPEGLL STLPAAVNIL AGFEATRLLV SQPAGEPNNA TSRQFKLALY AMCSITIALI 
WHRWMPINKS LWTSSFVLLT SGVGVLVLLL LVRLEPYRAT AAIYRAFAIY GQNPLFIYVL 
SSLWVQCYFL FHIDGVNIYA WLNNQLNSIA EPYLASLLFA LGHVALFWGV AYALHKKRIV 
ISV