Gene Sde_3322 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_3322
Symbol
ID	3965871
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	-
Start bp	4240777
End bp	4242039
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	50%
IMG OID	637922419
Product	RNA polymerase ECF-subfamily sigma-70 factor
Protein accession	YP_528789
Protein GI	90022962
COG category	[K] Transcription
COG ID	[COG4941] Predicted RNA polymerase sigma factor containing a TPR repeat domain
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0000453852
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCATTCTC AAGAAACCTC ATCACCGTTT GAAGATGACC TTCCTGCTTT AATTGACGCC 
ATATATCGCG CGGAGTCTCG CCGTATATAC GCCACGCTTA TTCGGCTAAT AGGAGACATG 
CAATTGGCAG AAGAGGCTAT GCACGACGCC TTTCATGTCG CCTTGAGTCA ATGGCAGGAT 
AAAGGCATAC CGGATAATCC GCGTGCTTGG TTGGTATCTA CCGCCCGCTT TAAGGCTATC 
GACCAGTTGC GGCGGCAAAC TCATTTAGCT GAGACTCTAG AGGCTATTAC GCCCCTTAGC 
GACAGTGAAG CGCTGGATTG GGATGGCGAT ATTATTGAGG ATGATCAACT TCGCTTGATT 
TTTACCTGCT GCCATCCCGC GCTAGACCCC AAGTTACAAA TCCCGCTCAC TTTAAGAGAG 
GTGTGTGGCC TAACCACTGA AGAGATCGCT AGTGCGTATT TAGTAACCCC ATCGACAATG 
GCACAGCGTA TTGTTCGAGG AAAGGCCAAG ATTCGTGATT CAAAACTTCC CTTCGAAATT 
CCTGAACGCT CGCAGTTGGC GCAGCGCTTA GATGCAGTAC TAGCTGTTGT GTATCTTCTG 
TTTAATGAAG GCTACTCGGC CACTAAAGGT GATACTTTGC TTAGAGTGGA GCTGTCATCA 
GAAGCGATTC GATTATCGCG GCAGTTGCTG GAGCTAATGC AAGATAGCGA GATAGAAGGT 
CTGCTTGCAC TTATGCTGCT GCATCAGTCA CGTAGTGCCA GTAGAACAAA TTCTGCTGGT 
GATATTATTT TGCTAGAGGA TCAAGACCGA AGTCTATGGG CGAAAGACTT GATAGATGAG 
GGACGATTTA GAGTCGGCCG CGCTTTCGTT CTCGGGTCGG TGGGGTTCTA TACTTTACAG 
GCGGCTATTT CAGCTTGCCA TGCACAGGCG CCCACTTGGT TGGAAACTGA CTGGCAACAG 
ATTGTTCAGC TGTATGAGGC TCTGTCGCAG GTCGACCCAT CTCCTATCGT GGAGCTCAAC 
AAAGCAGTCG CAGTCTCAAT GCTTGAAGGG GCAGAAGCTG GGTTGAAGAT CATTACACAA 
TTGATCCGCG GTCAAGAGTT GGAGCAGTAT CACTTGCTCC ACGCTGCTCA CGGCGAATTG 
CTGAGCCGAA CTGGGGAACT AATGGGCGCT CGTTCGGCTT TTGAGCGAGC GTTGTCGCTA 
ACGAATCAGG AGGCCGAGCG ACGGGTGTTA AAACTAAAGA TGAGTAGGCT CGACGCCATT 
TAA

Protein sequence

MHSQETSSPF EDDLPALIDA IYRAESRRIY ATLIRLIGDM QLAEEAMHDA FHVALSQWQD 
KGIPDNPRAW LVSTARFKAI DQLRRQTHLA ETLEAITPLS DSEALDWDGD IIEDDQLRLI 
FTCCHPALDP KLQIPLTLRE VCGLTTEEIA SAYLVTPSTM AQRIVRGKAK IRDSKLPFEI 
PERSQLAQRL DAVLAVVYLL FNEGYSATKG DTLLRVELSS EAIRLSRQLL ELMQDSEIEG 
LLALMLLHQS RSASRTNSAG DIILLEDQDR SLWAKDLIDE GRFRVGRAFV LGSVGFYTLQ 
AAISACHAQA PTWLETDWQQ IVQLYEALSQ VDPSPIVELN KAVAVSMLEG AEAGLKIITQ 
LIRGQELEQY HLLHAAHGEL LSRTGELMGA RSAFERALSL TNQEAERRVL KLKMSRLDAI