Gene Sama_2001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_2001
Symbol
ID	4604251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	2430742
End bp	2431785
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	55%
IMG OID	639781378
Product	GGDEF family protein
Protein accession	YP_927876
Protein GI	119775136
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0435343
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.378089
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGAAA AGCCACCAGC CACCGCTGAT CTCTTACAAA CAGCTGCCGG GCGGTTGAAA 
AAAGCCGTTC CTTTGATGCT TAAACATCAA ATCCCCACCA CTCCGATAAA CTATGCCCTC 
TGGTACACCT ATGTGGGCGA GCAACAACCC GAGCTCAACA AAGCCCTGGA CGACCTGGTG 
GCCCAGTACC ACACACTGCC ACCAGTCAGC GGCGAGCTCT TGTATCGCGA ACATCTGGCC 
GATCCGGTTG AGCTTGATGT GCGGGATATG CGCCAGAATC TCGAGGCCAT GGCCACCGAG 
CTTGGCAACC AGCTGAAAGA CACCAACCTG GATGCCACCG CATTTCAGCA AAAAATCGAC 
GCTAACTTTT CACGATTGGA ACGCATAGAC AACGAGAGCC TGAGTCTTGA ACAGGTGCTG 
AATCTGGTGC GTACCCTAGT TAAAGAATCC GACGCCATCC GCGAGTCCAC CAGCTACTTC 
ACCGGCCAGC TCGCCAAGGC GCAGCAGGAA ATCGATACAC TCAAACGCCG GCTGGCCGAA 
AGTGAAAAAG ATGTGTTTTT CGATGCACTC ACGGGCTGTC TCAATCGCCG TGCCTTTGAT 
GCCGACCTTG CTGGTCTGCT GGCACTGGCA CCTGAGGGTT GTTGCCTTAT CCTGTGTGAT 
ATCGACCATT TCAAGCACTT TAACGATAAC TATGGCCACC AACTTGGCGA TCAGGTACTG 
AAGCTGGTGG GCAAACGCCT AACCGAAGCC TGCCGGGACG GCGTGAAGTG CTACCGTTAC 
GGCGGTGAGG AGTTTGCCCT GCTGGTCCCA TCAAGCAATC TGCGCATCGC GCGCCAGTTG 
GCGGAAGGCA TTCGCCGCGG CGTAGAAAAG CTGACCCTCA AGGACAGACG CAGGGATGCC 
CGTATCGACA ACATCAGCGC GTCGTTCGGT GTGGCCCAGT GGCAACCCAA AATGACCGCA 
AGAAACCTGA TTGAGCACTC CGACAAGCAG CTTTACGAAG CCAAACGCCT TGGACGCAAC 
AGAGTCATGC CTATCTCAGG CTGA

Protein sequence

MGEKPPATAD LLQTAAGRLK KAVPLMLKHQ IPTTPINYAL WYTYVGEQQP ELNKALDDLV 
AQYHTLPPVS GELLYREHLA DPVELDVRDM RQNLEAMATE LGNQLKDTNL DATAFQQKID 
ANFSRLERID NESLSLEQVL NLVRTLVKES DAIRESTSYF TGQLAKAQQE IDTLKRRLAE 
SEKDVFFDAL TGCLNRRAFD ADLAGLLALA PEGCCLILCD IDHFKHFNDN YGHQLGDQVL 
KLVGKRLTEA CRDGVKCYRY GGEEFALLVP SSNLRIARQL AEGIRRGVEK LTLKDRRRDA 
RIDNISASFG VAQWQPKMTA RNLIEHSDKQ LYEAKRLGRN RVMPISG