Gene Sde_3961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_3961
Symbol
ID	3967265
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	-
Start bp	4991562
End bp	4992683
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	44%
IMG OID	637923058
Product	hypothetical protein
Protein accession	YP_529428
Protein GI	90023601
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.965049
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.287654
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAAAT TAATAGAGGC ACCGGCTCCT TGGCCAGAAG CATTCGATGG TGAAATTATC 
CATCCAGAAC TTTACCTGTG GGATGCCTGG GGTTTTAGTG TTGCCGACGA GTTGCACTTG 
TACTGTTTAG CTGTGCCTAA AAAAGCGATA GATGGCTCAC CTGTTGCTGC AAGCCAGAGA 
AATAATTATC CCTTTCATGT TCGCCATTTT TATTCAGAAA ATTTAGGCAA AACGTGGTTA 
GATAAAGGCG TTTTTCAACA GCCTAACAAT GCTAGTGACG GACACGATGC TCGCAATGTA 
TGGAGTGGGT CTGTATTGCC CCTTTCTGAT GGTAGACTAG CAGTAGCGTA TACCGGTATA 
CGTGAGCGCG GTAAAGAAAA ACCTTTTGTA CAAAACTTAG CAATTGGAAT TGCAGATAGC 
GCGCAAACAA TGGGGGATAA AAGCGGTAAG GTGTTGTTTT GCCCAGAGTT ACACGAAGCT 
TCTCTACGAG CAGCGGGTTA TTTCTTTGCT GAAAAAGACA AAATCGGTTT GGCTGGTGGC 
GAAAATAATG GCCCAATTAC AGCGTGGCGC GATCCATTTT TAATTGCAGA TACACTCGAT 
GAAAAGCAAC CATATAAACT CGTGTGGGCG GCAAAAAAAT CCGCCACTCA ATGCGCTTTT 
GGTGCTGCGA GTATAAATCT AAGTAACGAA GATATATCGG CAACCCAGTT GTTTGGCCCT 
ACAACATTGC CAGATGATGA CGAGTTTACT CAATTAGAGT TACCGCAAAT CTATGTGGAC 
GAACTAAACA AACGCTATGT TCTCATCGCA GCGACTACTA CGCGAACAAG CGAAGCGCAA 
AGCGAAAGTG AAGTGGATAA ACGTATACGC TTATATACTG CGCCAAGTTT AACTGGCCCT 
TGGCAAAAGG CCGGTACGCA AACTAGCGAA GTGGACGGCT TAGAGAGTTT ATTTGGTATG 
ACTGTTTTAA AAGCGGATTT CGAAAACGAT ACACTCTACT GCATGGCTCC GTACACTGAA 
GCGACAGCCC CCGAGCAGAT ATTATCTTTT GCGCCAATAG TTAAAATAGA TTTGAATGAG 
ATAGGCAGGT TGCAAAAAAT TTCTGCCAAA CCTGTTTACT AA

Protein sequence

MSKLIEAPAP WPEAFDGEII HPELYLWDAW GFSVADELHL YCLAVPKKAI DGSPVAASQR 
NNYPFHVRHF YSENLGKTWL DKGVFQQPNN ASDGHDARNV WSGSVLPLSD GRLAVAYTGI 
RERGKEKPFV QNLAIGIADS AQTMGDKSGK VLFCPELHEA SLRAAGYFFA EKDKIGLAGG 
ENNGPITAWR DPFLIADTLD EKQPYKLVWA AKKSATQCAF GAASINLSNE DISATQLFGP 
TTLPDDDEFT QLELPQIYVD ELNKRYVLIA ATTTRTSEAQ SESEVDKRIR LYTAPSLTGP 
WQKAGTQTSE VDGLESLFGM TVLKADFEND TLYCMAPYTE ATAPEQILSF APIVKIDLNE 
IGRLQKISAK PVY