Gene SbBS512_E1077 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1077
Symbol
ID	6269852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	981793
End bp	983469
Gene Length	1677 bp
Protein Length	558 aa
Translation table	11
GC content	51%
IMG OID	641725217
Product	diguanylate cyclase (GGDEF) domain protein
Protein accession	YP_001879735
Protein GI	187733517
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000000734609
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAACC AGAGCTGGTT GAAAAAAATC GCACGCCGCC TGGGGCCTGG TCATGTCGTT 
AATCTCTGCT TTATCGTGGT ATTGCTTTTT TCCACCTTGC TGACCTGGCG TGAAGTGGTA 
GTGCTGGAAG ATGCCTATAT CTCCAGCCAG CGTAATCATC TGGAAAACGT AGCCAACGCG 
CTCGATAAGC ATTTGCAGTA TAACGTCGAC AAACTGATCT TTTTGCGTAA TGGCATGCGC 
GAAGCTCTCG TAGCGCCACT GGATTTCACT TCACTGCGTA ATGCTGTAAC CGAGTTCGAA 
CAGCATCGCG ACGAGCACGC CTGGCAAATT GAACTCAACC GACGACGCAC CCTGTCAGTC 
AATGGCGTAT CGGATGCATT AGTCAGCGAG GGGAATCTCC TGTCTCGCGA AAATGAAAGC 
CTCGACAATG AAATTACCGC TGCACTGGAA GTTGGTTACT TGCTGCGACT GGCGCACAAC 
ACCTCGTCGA TGGTTGAACA GGCGATGTAT GTCTCGCGTG CCGGATTTTA CGTTTCGACG 
CAGCCGACCT TGTTTACGCG CAATGTACCA ACGCGTTATT ACGGCTATGT CACCCAACCC 
TGGTTTATCG GCCATTCGCA ACGAGAAAAT CGTCACCGCG CGGTACGCTG GTTTACTTCG 
CAACCGGAAC ACGCCAGCAA TACTGAACCG CAGGTTACCG TCAGTGTTCC GGTAGACAGT 
AATAACTACT GGTATGGCGT GCTGGGGATG AGTATTCCCG TGCGTACCAT GCAGCAATTT 
TTAAGAAACG CCATCGATAA AAACCTCGAT GGTGAGTATC AGCTCTATGA CAGTAAGCTG 
AGATTTTTGA CCTCTTCCAA TCCTGACCAT CCAACAGGGA ATATTTTTGA TCCTCGTGAA 
CTGGCCTTGC TGGCGCAGGC GATGGAACAT GACACGCGGG GCGGCATTCG TATGGACAGT 
CGCTATGTTA GCTGGGAACG TCTGGACCAT TTCGACGGTG TGCTGGTGCG CGTCCATACG 
CTAAGCGAAG CCGTGCGCGG CGATTTCGGC AGTATCAGCA TTGCATTAAC CCTGCTGTGG 
GCGCTCTTTA CCACCATGTT ACTCATCTCC TGGTATGTGA TTCGCCGGAT GGTTAGCAAC 
ATGTATGTTC TGCAAAGCTC GTTGCAGTGG CAGGCGTGGC ACGACACCTT AACCCGTTTA 
TATAATCGTG GCGCACTGTT TGAAAAAGCC CGTCCGCTCG CGAAATTGTG TCAGACGCAC 
CAACATCCTT TTTCTGTCAT TCAGGTCGAC CTTGACCATT TTAAAGCGAT TAATGACCGC 
TTTAGTCATC AGGCGGGCGA CCGTGTTCTT TCTCATGCTG CCGGATTAAT TAGCAGTTCC 
TTGCGTGCGC AGGACGTTGC CGGGCGGGTC GGTGGTGAGG AGTTTTGTGT GATTCTGCCA 
GGCGCGAGTC TGACGGAGGC TGCGGAAGTC GCAGAACGTA TTCGCCTGAA GTTAAATGAA 
AAAGAGATGT TGATTGCTAA GAGTACGACG ATACGCATCA GTGCCTCGTT GGGGGTAAGT 
AGCAGCGAGG AAACCGGTGA TTATGATTTT GAACAACTCC AGTCACTGGC TGACCGTCGG 
CTTTATCTCG CTAAACAGGC CGGGCGTAAT CGGGTATGCG CGAGCGATAA CGCTTAA

Protein sequence

MENQSWLKKI ARRLGPGHVV NLCFIVVLLF STLLTWREVV VLEDAYISSQ RNHLENVANA 
LDKHLQYNVD KLIFLRNGMR EALVAPLDFT SLRNAVTEFE QHRDEHAWQI ELNRRRTLSV 
NGVSDALVSE GNLLSRENES LDNEITAALE VGYLLRLAHN TSSMVEQAMY VSRAGFYVST 
QPTLFTRNVP TRYYGYVTQP WFIGHSQREN RHRAVRWFTS QPEHASNTEP QVTVSVPVDS 
NNYWYGVLGM SIPVRTMQQF LRNAIDKNLD GEYQLYDSKL RFLTSSNPDH PTGNIFDPRE 
LALLAQAMEH DTRGGIRMDS RYVSWERLDH FDGVLVRVHT LSEAVRGDFG SISIALTLLW 
ALFTTMLLIS WYVIRRMVSN MYVLQSSLQW QAWHDTLTRL YNRGALFEKA RPLAKLCQTH 
QHPFSVIQVD LDHFKAINDR FSHQAGDRVL SHAAGLISSS LRAQDVAGRV GGEEFCVILP 
GASLTEAAEV AERIRLKLNE KEMLIAKSTT IRISASLGVS SSEETGDYDF EQLQSLADRR 
LYLAKQAGRN RVCASDNA