Gene Sde_3042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_3042
Symbol
ID	3967706
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	-
Start bp	3889329
End bp	3890357
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	49%
IMG OID	637922139
Product	LacI family transcription regulator
Protein accession	YP_528511
Protein GI	90022684
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000688276
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAACCAA CAATTAAAGA TGTAGCTAAG CTCGCAGGGG TATCGTTTAA AACTGTTTCG 
CGCGTAGTAA ACAAAGAGAG TACCGTTGGT GAAGCCCTGC AAGAAAAAGT ATGGAAAGCG 
ATTAACGAGC TTGGTTATAA GCCTAATTTG TCTGCCCGTG GTTTGCGTGG CGCTGCATCG 
TCCATAGGTT TTATTTACGA TAACCCCAAC AGCAACTACG TAATCGATAT GCAGCGCGGT 
ATTCTTAACG AATGCCATAA GCGCGGCTAT GAGCTAGTTA TTCACCCGTG TAATGCATCT 
GGCGAGCACA TTATTGATGA AGTGATCGAA ATGATCGATC GCAGCCGGGT AGGGGGCCTA 
GTGCTCACAC CGCCTATTTC CGAAAACCCC GAAATACTCG CAGCTATTGC TAATAAAAAA 
GTCGAATTCG TACGTATTTT ATCTGGCAGC GCCGCACCAG ATACATTGTC GCCTTGTGTT 
TACATCGATG ACCGCACAGC GGCTTACACA ATTACGCAGC ACTTAATCGA TTTAAACCAC 
AAAGATATCG CCTTTTTGGG CGGTGATGAA GAGCATAAAT CCAGTGGCGA ACGTTTGGAA 
GGCTACCGCT CTGCCTTAGC AGATAACGGC ATCACCCCCC ACGAAAACCA TATATTACCC 
GGTAAATACT CGTTTGAATC TGGAGTGGAG CGCACCCGTG CGTTACTCGA GCTAGATGGC 
CCACGCCCAA CCGCGGTGTT TGCCTGTAAC GATGAAATTG CAGCGGGTAC CTTGTTTGCT 
GCCCGTATTG CGGGTGTAGA TGTACCAAAT CAGCTCTCCA TAGTGGGGTT CGAAGATAGC 
CCCTTTTCGC GCCAAGCCTG GCCAAACCTT ACTACGGCCC AGCAACCCAC TAGCACCATT 
GCGCAGCGTG CCACTGCACT ACTAATTGAC ACCTTAAAGA GCCGCGCTGA AGGCTCGCAA 
GTTGTTGAAA GTGAAGGGTT TTTACCTAAA CTTATTGTGC GCGACTCCTC CCAAACTGCC 
CCAGTATAA

Protein sequence

MKPTIKDVAK LAGVSFKTVS RVVNKESTVG EALQEKVWKA INELGYKPNL SARGLRGAAS 
SIGFIYDNPN SNYVIDMQRG ILNECHKRGY ELVIHPCNAS GEHIIDEVIE MIDRSRVGGL 
VLTPPISENP EILAAIANKK VEFVRILSGS AAPDTLSPCV YIDDRTAAYT ITQHLIDLNH 
KDIAFLGGDE EHKSSGERLE GYRSALADNG ITPHENHILP GKYSFESGVE RTRALLELDG 
PRPTAVFACN DEIAAGTLFA ARIAGVDVPN QLSIVGFEDS PFSRQAWPNL TTAQQPTSTI 
AQRATALLID TLKSRAEGSQ VVESEGFLPK LIVRDSSQTA PV