Gene Sde_1139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_1139
Symbol
ID	3968326
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	1475694
End bp	1476914
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	47%
IMG OID	637920210
Product	MSHA biogenesis protein MshG
Protein accession	YP_526613
Protein GI	90020786
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1459] Type II secretory pathway, component PulF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTAAGT TTAAATATTC CGGCCGCTCG AAGCAGGGGC AGGTATTAAC CGGCGAAATG 
GAAGCTGCAA CGGTTGATGC GGTGGCGTCG GCACTTATTG GGCGCGGCAT TACACCAGTA 
AAAATCGAAC CCTTTTCTGC TGCCTCATCG TATATGCGGC AGCTAAATAG CGCGCTGGGT 
GGCGATAAGG TGGGCACTAA CGACCTGATT ATGTTTTGTC GCCAAATGTA CACCATTACC 
AAATCGGGTA TTCCACTAAC CCGAGGTATT CGCGGCTTGG GCGCAAGTAT TCGCCACGAG 
CACTTTAGAG ATGTACTCGG CGATGTAGCT GAACGTTTAG AGGCTGGTGT AGGCTTGTCG 
CAAGCAATGC GTCATCATCC TAAAGTGTTT AATAGTTTAT TTGTAAGCAT GGTTGCTGTG 
GGCGAAACCA GCGGCAACCT CGACGAAATA TTTCGCCAAA TAGGTTTTTA CTTAGAGCGC 
GACGAAGAAA CACGTAAACG TATTAAGCAA GCAACGCGTT ACCCAACGTT TGTAAGCATC 
GCTATTGTGC TGGCAATGGC TGCGGTAAAT ATTTGGGTTG TGCCAGCATT TGCGGATATG 
TTTGCCAAAT TTGATGCAGA CCTGCCAATT GTGACCCGTA TTTTAATTTT TACCTCTAAT 
GCATTTGTAA ATTATTGGTT ACTTATGTTG GTTGTTGTAG GTGGTATGGT AGGTGGTGCT 
TACTATTATT TGAATACGCC AGAGGGAGCG TTGCAGTGGG GTAAAAAGCG GTTAAAAATG 
CCGTTGGTTG GCGAGCTAAT CGAGCGCGCT ACCATGGCCC GTTATGCGCG TAGTTTTGGT 
TTGATGTTGC GCGCAGGTGT TCCGGTGAAC CAGGCCTTGG CTCTGTGCGC AGCAGCAATC 
GACAACCCCT ATATCGCCGC AAAAATACAG CAAATTAGAC AAAGCATTGA GCGCGGTGAA 
AGCTTATTGC GTACTCATCT TCAAGCGGAA ATGTTTACAC CACTGGTTTT GCAAATGATA 
GCCGTAGGCG AAGAGAGCGG CCAAGTAGAG GCGCTGCTCA CCGAAGTAGC GGAATTCTAC 
GAGCGTGAAG TGGACTACGA CTTAAAAACG CTTACCGATC GTATTGAACC TATATTAATT 
ATTGTTATGG CGGCGTTTGT GGCTCTGTTA GCTGTAGGCA TTTTTCTCCC AATGTGGAGC 
ATGTACGAAG TACAGGCGTA A

Protein sequence

MSKFKYSGRS KQGQVLTGEM EAATVDAVAS ALIGRGITPV KIEPFSAASS YMRQLNSALG 
GDKVGTNDLI MFCRQMYTIT KSGIPLTRGI RGLGASIRHE HFRDVLGDVA ERLEAGVGLS 
QAMRHHPKVF NSLFVSMVAV GETSGNLDEI FRQIGFYLER DEETRKRIKQ ATRYPTFVSI 
AIVLAMAAVN IWVVPAFADM FAKFDADLPI VTRILIFTSN AFVNYWLLML VVVGGMVGGA 
YYYLNTPEGA LQWGKKRLKM PLVGELIERA TMARYARSFG LMLRAGVPVN QALALCAAAI 
DNPYIAAKIQ QIRQSIERGE SLLRTHLQAE MFTPLVLQMI AVGEESGQVE ALLTEVAEFY 
EREVDYDLKT LTDRIEPILI IVMAAFVALL AVGIFLPMWS MYEVQA