Gene Sde_3947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_3947
Symbol
ID	3967212
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	4974930
End bp	4976186
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	48%
IMG OID	637923044
Product	hypothetical protein
Protein accession	YP_529414
Protein GI	90023587
COG category	[S] Function unknown
COG ID	[COG4289] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.174675
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAGAC GCGATTTTTT AAACGCCGCT GCATTGGGCG GTGCCGCATA TATGACGGGT 
TTACCGCAAT TTGCCAATGC TAAAACGCTT ACTACCGGTC AACAGGATCA CACCTACTTT 
GCAAATTTAT TAGAGAAAAT TTGTTCGCCT ATTTTGCATT TAATGGCTAA CGAACAATTC 
CATGCAAAGT TCCCATTAGA GGTAGGAGCC AACAGTGATG GACGCGACCA TCGCGTTGCC 
TACCTTGAAT GTTTTGGCCG CACCATTGCT GGCGCTGCAC CTTGGTTAGC ACTTGATACA 
CCCGGCCCAG AAAAAGCCAC ACGCAGCAAG CTAAGAGACC AAGCCATTGC GGCCTATGAA 
AATTCCGTGA ACCCCAAAAG CCCCGATTAC CTCGACTGGC AAGTAGGCCA CGGCCAAATG 
TTGGTGGACT CTGCCTACTA CACCCAAGCA CTTATACGTG CGCCTATTTT GTGGCAAAAG 
CTTACCCGTA AAACTCAGCA GCGTATTGTA AAAGAGATAA AGGCGTTGCG AAAAATTCCA 
CCGCCCTACA CCAATTGGCT GCTATTCGCC GCCATGAACG AAGCATTTTT AATGCAAGTA 
GGGGAAGAGT ACGACCCCAT TCGACTCGAT CTAGCACTGC GAAAATTTTT AGAGTGGTAC 
GTAGGCGACG GATGGTTTGC AGATGGCGAG CACTTCGCGT TTGACTACTA CGGCTCTTAC 
GTTATTCACC CCATGCTGTT AGATATATTA GAAGTGATGG CTGCCCACAA CACCTACTTT 
TGGCACGGGG ACATCAAAGA CGTACTGGCA ACTCATTTAA AACGCAATCA ACGCTTCGCC 
GAACATTTAG AGCGCTTGAT TTCACCTACG GGTACCTACC CACCTATAGG GCGCTCATTT 
ACCTATCGCA CCGCGGCTTT TCAACCACTC GCGCAACTAG CACTAAAACA CAAGCTGCCC 
GATAGCTTAC CGCAAGGCAG AGTGCGCGCA GCAATGCGCG CCGTTCACGA AGCCATTTTC 
AGCAACCCTT CAAACTTTAG CAAAGAGGGG TTTTTAAAAA TTGGTTTTGC AGGCGCCGAC 
CTTTCGCTTG CCGATTGGTA TTCCAACAAT GGCAGCATGT ACATAACAAC CGCAAGCTTT 
TTACCCCTTG GGCTACCACT TAGCGACCCC TACTGGCAGG TACCAGGCGA AGATTGGACA 
CAAAAACTGG CGTTTAGCGG GCAGAAATTT AAGAAGGATT ATTCAGTTTC TTATTAA

Protein sequence

MKRRDFLNAA ALGGAAYMTG LPQFANAKTL TTGQQDHTYF ANLLEKICSP ILHLMANEQF 
HAKFPLEVGA NSDGRDHRVA YLECFGRTIA GAAPWLALDT PGPEKATRSK LRDQAIAAYE 
NSVNPKSPDY LDWQVGHGQM LVDSAYYTQA LIRAPILWQK LTRKTQQRIV KEIKALRKIP 
PPYTNWLLFA AMNEAFLMQV GEEYDPIRLD LALRKFLEWY VGDGWFADGE HFAFDYYGSY 
VIHPMLLDIL EVMAAHNTYF WHGDIKDVLA THLKRNQRFA EHLERLISPT GTYPPIGRSF 
TYRTAAFQPL AQLALKHKLP DSLPQGRVRA AMRAVHEAIF SNPSNFSKEG FLKIGFAGAD 
LSLADWYSNN GSMYITTASF LPLGLPLSDP YWQVPGEDWT QKLAFSGQKF KKDYSVSY