Gene Ssed_0203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssed_0203
Symbol
ID	5614077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sediminis HAW-EB3
Kingdom	Bacteria
Replicon accession	NC_009831
Strand	-
Start bp	231551
End bp	232576
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	47%
IMG OID	640931029
Product	AraC-type transcriptional regulator
Protein accession	YP_001471944
Protein GI	157373344
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCCGA TGAAATTTAA TACCTCCTTT ATTCGCGTCT GTTATGTGAA ACCCGTTTTT 
GATGGCGTCG AGCAGGTTTA TGGTCTCAAT CACCGGGCCC TGTCAATTCC CGATGCGCTG 
ATGAACGAGC CTATGGCCTT GATCCCTTTT ACCCAGTTTG GTGAATGGTT ATCTGAGTTA 
GCCCTCCTTA CTCAAGACCC CGCTTACATA GTTAAACTAG AACAACAGCT AAACTTCGAC 
CGACTCGATA TCAGCGGCAT CGACCTGTTA TCGACCCCGG ATCTGGCCAT GAGTATACGT 
CGCATCAACT ATGGCATCGT CAGCCTGCAA TCCGGCGGCA GTTACTATGT CAGTATGTCC 
GGAAAGATAA TGAAATGGTG CTATAAAAAT CCCTACGCCT TTAAGCAGGA GAAAAGCTAC 
GACTCTCTCA GGGTCGCCAT CATGCTGCTT AATGCACTGC GTCACTTTCT GGGTGGTAAA 
TATCGCCCGA TTCAGGTACG TATCAGTGGT TCGGCTGTCG CGCAGCGGGA GACGGAACAC 
CTGTTTAAAT GCCCGGTTAT CTGGAATGCT GCGCAAACTG AAATTTGGTT GGAACTTGAT 
GATATGCTGC AGCCTTTGAT AGAGCCGCAG TTAGAAAACA GCCCGGTGAC CATGACACGT 
TCGCTATTTG AAAAGTACCT CAATATGCCG CAACCCCACG ACACCCCGAA GGTGCTTTTC 
GAAATGGTCA ATTATGCAAG ATTTTATGGT TTACCTAAGA TCGAAGATAT TGCCAAACTC 
TTCAATATCT CTAAGCAGCA GCTGCAGAGG CGATTACAGC AGCAAGGTTT CACTTTTTCT 
GCCTTGTGTA GTTACATCTA CAGTAATCAA GCCATCAAAT ATATGCTCGA TGGTAAGAGT 
GTCGCGGAAA TTAGCCCCCT TTTGGGATAT GCGAATCAGC AAAGCTTCAG CCGAGCCTTT 
AAACGACTCA GAAAATGTAC CCCTCAGCAA TATCTCGACA GGCTCAACCA AAACAAGCCT 
GATTAA

Protein sequence

MLPMKFNTSF IRVCYVKPVF DGVEQVYGLN HRALSIPDAL MNEPMALIPF TQFGEWLSEL 
ALLTQDPAYI VKLEQQLNFD RLDISGIDLL STPDLAMSIR RINYGIVSLQ SGGSYYVSMS 
GKIMKWCYKN PYAFKQEKSY DSLRVAIMLL NALRHFLGGK YRPIQVRISG SAVAQRETEH 
LFKCPVIWNA AQTEIWLELD DMLQPLIEPQ LENSPVTMTR SLFEKYLNMP QPHDTPKVLF 
EMVNYARFYG LPKIEDIAKL FNISKQQLQR RLQQQGFTFS ALCSYIYSNQ AIKYMLDGKS 
VAEISPLLGY ANQQSFSRAF KRLRKCTPQQ YLDRLNQNKP D