Gene Sbal223_3687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_3687
Symbol
ID	7089621
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	-
Start bp	4378430
End bp	4380649
Gene Length	2220 bp
Protein Length	739 aa
Translation table	11
GC content	49%
IMG OID	643462567
Product	diguanylate cyclase/phosphodiesterase
Protein accession	YP_002359588
Protein GI	217974837
COG category	[T] Signal transduction mechanisms
COG ID	[COG5001] Predicted signal transduction protein containing a membrane domain, an EAL and a GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAGTAG GTTTAGCAAA TCCACTCCAA CAGGCCTTGG TGAGTATTTT TAGTGAGTCT 
CCGCTAGAAA CCTTAGAGCA AAATGTTGAC CGAGCACTTG AGACCATCAC ATTGCAGCTG 
CATTGTGACG GAGTATTTGT ATTGACCGGC AGCCAGTCTC TGGATCGTTT ACGCACGCGT 
AATTTGTATC TAAAACCCCA ATTTGCCAAA GGCCAACAGA CTCGAGTCTG GCCTTTAGCA 
CGCATGCCAT TCTTTCGCTC CCTTGTCCGC ACCCCGCGAC TATTAAATCT GCCCGATGTG 
AATACCTTGC CCGCCGATGC GCAGGCCGAG CGTGCCCTAT TAAGGGACTG GGACGTGAAG 
AGTCTATTGG TATTGCCACC TGTGGTATTT GGCGAAACGC GTATTGCGCT GGGCGCAGTC 
AATTGCTCCG AGTGTTGCGA ATGGAGCGAA GAGTTTATAA GTGAGTTTAA CCACGCCGCT 
GTGATGATTG GCTCGGCGAT GGAACTGACG CGTATCGCCC TGAGCATGCT CGCCAGTGAG 
CATAAATACT GTGAAGTCTT CAATCAGTTA CCCTTAGCCT GCGCCTTGTT AGATAAATAT 
AATCAATTGA CTATGCTCAA TAAAGTCGCC CTGCAAACGC TGCCAATCCA ACATGGTTAT 
GATTTATTCG ACATGGTGCG TGAGGAAGAA CATGCCATGT TAACTGATAC CTTGCATGTG 
GTACGTGAAG GTGTGCTTGG TCAGGCTTGG TGTGAATTAC CGTTGAAATC TATCCATCAA 
CTGGCTTGGT TGAAACTCAG TTTTAGCCAG ATCAGTGGCG ATAAAGATAC CTTAGTCATG 
ATTGCCGAAG ATGTCAGCGA GAAGTATCGT CTAGCCGATG AGCTGTCGTT CCATGCCAAT 
TATGATGCGC TCACAGGATT GCCCAATCGG TTACATTTCG AAGCCCTATT AGAAAACCTG 
CTGCACGCCC ACGACGATAT GCCTATTTGC GTGGCGTTTC TCGATTTAGA CCAATTCCAA 
GTCATCAACA ATATCAGTGG CCATCAGGCG GGCGATAAGC TGCTTTGCCA AGTGGCATTA 
CGCTTAAAAC AGCTCGTGCG TAAGGGCGAT ATCGTCGCCC GTTTAGGTGG CGATGAGTTT 
GGTATCTTGA TGCATTACTG CAATGTGGAC TCGGCGAAAC AAATCGCAAA ACGTATCTGT 
ACCCAATTGG CGAACCATGA ATTTATTTGG GAAGGCCGCA GTCACAATGT CAGTGTCAGC 
ATGGGGATTG CTAAACTCGA TAAAAAAGCC GCCGACATTT ATACCGTGAT GAGTCAGGCT 
GATGCTGCTT GTCGCTTGGC GAAGGATCAA GGCCGCAATG GCTGGCATTT ATACAGTGCG 
AGCGATCCTA AAATGAACCG TCTCTATACC GAGATGATGG CGTCGGTGGA CATAGTCGGC 
GCACTGGCGT TAAACCAATT TGAGCTTTAT TTTCAAAGCA TAGTGCCATT AAATCGCGAG 
GAGTCTGGTC TGCATTTAGA GATCTTACTG CGTATGGTGC AGGCCAACGG CACTATCGTG 
TCTCCTGCCA TTTTCTTGCC CGCCGCCGAG CGATATAACT TAGCTTCTAA GGTCGACTTA 
TGGGTGATCG ATAACTTGCT CAAGTGGGGC GGTTGCCATT TAGATATCTG GCAGCAATTG 
GATCTCGTGT CGGTGAATTT GTCGGCGACC TCTTTGGGTG ACTTTGAGTT TATGAACTGG 
CTAGAAATGC GTTTGATGGC CGAACCTGAG CTGGTGGACA AGCTTTGCAT CGAGATCACT 
GAAACTGCGG CCGTGAGTCA GCTCGATCAA GCGACAAAGT TACTCGATAT ATTGCGTCCG 
CTCAATTGTA AGTTAGCCCT CGATGACTTT GGGGCTGGCT TTTCTAGCTT TGCCTACCTT 
AAGCGCCTTA ATGTGGACTT TGTGAAGGTG GATGGTCAGT TTGTAGTGAA CATCTGCGAA 
GACAGTGCGG ATCAGGCGAT CGTTAAATCG ATTTGCCAAC TCGGCCAAGA CATGGGCTTT 
GATGTGGTTG CCGAATTTGT CGAATCCCAA GATATTGGCC GGAAACTGCA AACCCTTGGC 
GTCGACTATG CCCAAGGTTA CGCCATCAAT AAACCGATAC GGTTAGCTGA ATTACAGTCT 
GGACTCAGTC AGCCTTGGCT CGAAAAACGT GAGACCTTTG CGGCCTATCC ACAACTCTAG

Protein sequence

MLVGLANPLQ QALVSIFSES PLETLEQNVD RALETITLQL HCDGVFVLTG SQSLDRLRTR 
NLYLKPQFAK GQQTRVWPLA RMPFFRSLVR TPRLLNLPDV NTLPADAQAE RALLRDWDVK 
SLLVLPPVVF GETRIALGAV NCSECCEWSE EFISEFNHAA VMIGSAMELT RIALSMLASE 
HKYCEVFNQL PLACALLDKY NQLTMLNKVA LQTLPIQHGY DLFDMVREEE HAMLTDTLHV 
VREGVLGQAW CELPLKSIHQ LAWLKLSFSQ ISGDKDTLVM IAEDVSEKYR LADELSFHAN 
YDALTGLPNR LHFEALLENL LHAHDDMPIC VAFLDLDQFQ VINNISGHQA GDKLLCQVAL 
RLKQLVRKGD IVARLGGDEF GILMHYCNVD SAKQIAKRIC TQLANHEFIW EGRSHNVSVS 
MGIAKLDKKA ADIYTVMSQA DAACRLAKDQ GRNGWHLYSA SDPKMNRLYT EMMASVDIVG 
ALALNQFELY FQSIVPLNRE ESGLHLEILL RMVQANGTIV SPAIFLPAAE RYNLASKVDL 
WVIDNLLKWG GCHLDIWQQL DLVSVNLSAT SLGDFEFMNW LEMRLMAEPE LVDKLCIEIT 
ETAAVSQLDQ ATKLLDILRP LNCKLALDDF GAGFSSFAYL KRLNVDFVKV DGQFVVNICE 
DSADQAIVKS ICQLGQDMGF DVVAEFVESQ DIGRKLQTLG VDYAQGYAIN KPIRLAELQS 
GLSQPWLEKR ETFAAYPQL