Gene Sde_1980 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_1980
Symbol
ID	3967223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	-
Start bp	2490601
End bp	2491809
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	43%
IMG OID	637921068
Product	hypothetical protein
Protein accession	YP_527452
Protein GI	90021625
COG category	[R] General function prediction only
COG ID	[COG0523] Putative GTPases (G3E family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0097799
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCAAA AACTACCTGT TACCGTTTTA TCTGGCTTTC TTGGCGCAGG TAAAACTACC 
GTGCTAAACC ATATTTTAAA TAATCGCGAC CATTTACGTG TTGCCGTAAT TGTTAATGAT 
ATGAGTGAAG TAAACATAGA TGCAGCAACA GTTAAAAATG AAGTAACACT CAACCGCAGC 
CAAGAGAAAT TGGTCGAAAT GAGTAATGGC TGTATTTGCT GCACATTGCG AGAAGACTTG 
CTAATTGAGG TAAACAAACT TGCGAAAGAA GGGCGATTTG ATTACCTAGT AATTGAATCC 
ACCGGTATTT CTGAGCCGTT GCCTATCGCT GAAACGTTCA CATTCGCCGA TGAAACAGGT 
GTAAGCCTTT CCGACGTAGC AAGGCTAGAC ACCATGGTAA CTGTTGTGGA TGCCGCTAAC 
TTTCTTAATG ATTATGACGA AGCTAAGTAC CTACAGGAAA CCAGTGAAAG CCTAGGCGAT 
GACGATGAGC GCACGGTTGC AGACTTGCTA GTAGATCAAA TTGAATTTGC CGACGTAATA 
CTCATTTCTA AAAGCGACGT AGTAAGCAAT AAACACTTAG CCCGCACGCA AGCTGTACTA 
CAAACACTTA ACCCCGAAGC AAGTATCCAT ACAATTGCAA ACGGTAAAGT AAACGTAAAG 
ACTGTATTAG CTACAGGAAA ATTCAGCTTT GACAAAGCGC AGCAATCAGC GGGCTGGCTA 
AAAGAAATGC GCGGAGAGCA TATTCCAGAA ACCCAAGAGT ACGGTATTAG CAGCTTTGTT 
TATCAAGCCC GTAAGCCATT TCACCCGCAA AAATTTTATA ATTTTTTGCA CAGCGAACAA 
CTTGCAGGGA AACTCCTGCG TTCAAAAGGT TATTTTTGGC TGGCGACTCG GCCAGAAGCC 
GCTGGGCAGT GGAATCAAGC CGGTGGTATT GCACGGTATG GTTTTGCTGG CATGTTTTGG 
AAAGCAGTAC CCAAAGAAAA TTGGCCCGAT GACGAAGACT ACCTTGCATC TATAAAAAAG 
AGTTGGGAAG AGCCATTTGG AGATATGCGC CAAGAGCTTG TGTTTATTGG TCAAGGCCTA 
GACAAACAGG CTGTAATTGA GGCGCTAGAT AAATGTTTAT TAACGGAAAA AGAATTGCTT 
GCAGGCAAGG ACTATTGGTT AGGTTTAGAT GATCCGTTTC CAGCTTGGAA CGACAAAGAA 
GCCGCTTAG

Protein sequence

MNQKLPVTVL SGFLGAGKTT VLNHILNNRD HLRVAVIVND MSEVNIDAAT VKNEVTLNRS 
QEKLVEMSNG CICCTLREDL LIEVNKLAKE GRFDYLVIES TGISEPLPIA ETFTFADETG 
VSLSDVARLD TMVTVVDAAN FLNDYDEAKY LQETSESLGD DDERTVADLL VDQIEFADVI 
LISKSDVVSN KHLARTQAVL QTLNPEASIH TIANGKVNVK TVLATGKFSF DKAQQSAGWL 
KEMRGEHIPE TQEYGISSFV YQARKPFHPQ KFYNFLHSEQ LAGKLLRSKG YFWLATRPEA 
AGQWNQAGGI ARYGFAGMFW KAVPKENWPD DEDYLASIKK SWEEPFGDMR QELVFIGQGL 
DKQAVIEALD KCLLTEKELL AGKDYWLGLD DPFPAWNDKE AA