Gene SeD_A2073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2073
Symbol
ID	6875654
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	2007208
End bp	2008701
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	45%
IMG OID	642785186
Product	ggdef domain-containing protein
Protein accession	YP_002215852
Protein GI	198244426
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.986087
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.000116677
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATTTGC ATCATAAAGC GCTCAGGCAC TTTATCTCGG CAAGCGTCAT CGTTTTGACA 
TCGTCCTTCC TGATTTACGA ACTTATTGCC AGCGACAGGG CAATGAATGC CTATATGCGT 
TATATCATGG AGAGAGCCGA TTCGTCGTTT TTGTACGATA AGTACCAGAA TCAGAGCATC 
GCCGCACATT TGATGCGAAC TTTTGAAGCG CCGGGAGACC CCGTCACTGC AGAAAAACGC 
CGCGCGTTTT GCGACGCCTT TGAGGCTATT AACGGTACGC ACGGCGTCAA CCTGACCCGG 
CATAATTATC CGGGGCTACA TGGCACCCTG CAAACCGCCG CTACACAGTG TACCGATAAT 
CTTGATGACG CCCTTTTACT GCCTGCATTT GATCAGGCGG TAAGCATCAA CCGTTCGCAG 
GACGACCACA GTCACGGGCT GGGCACACTG GAGCTTAAAT TCCGTTATTA CGTTGATTTA 
AATAAACATT ATGTCTATTT CTATGATTTA ATCAACTCAC GGCGCTTCGC CATGCATCGT 
TGGACTTTTT TACAAAAAGG CACAATGGGT ATTAACAGAA AAGATATAGA TAAACTTTTT 
ACCGGCCGTA CGGTTATTTC AAGTATTTAC ATGGATGATA TTACCCAGGA AAACGTCATG 
AGCTTTTTAA CGCCAGTCTA TCTGGCGGGA ACGTTAAAAG GTATCGTGAT GGTGGATGTT 
AACCAGGATA ATTTAAAAAA TATTTTTTAT ACCCAGGACC GTCCGCTGGT TTGGCGTTAT 
CTTAACGTAA CACTAAAGGA CATGGACTCC GGAAAAGAAA TTATTATTAA TCAAAGCAAA 
AATAATCTGT TTCAATATGT GAATTATAGC CATGATATCC CGGGTGGACT GCGCGTTTCG 
TTGTCCCTTG ATTTAACCTA TTTCCTTGTC TCGTCCTGGA AAGCGCTGGC CTTTTACTTA 
CTGGCAACGG CGCTCCTGCT TAATATGGTA CGGATGCACT TTCGGCTTTA TCGCAACGTC 
ACACGCGAAA ATATTAGCGA TGCCATGACC GGGCTTTACA ACCGTAAAAT ATTAACACCG 
GAGCTGGAAC AGCGACTGCA ACGCCTGGTC AATGCCGGGA CGCCGGTGAC ATTTGTCGCT 
ATTGATTGCG ACAGGTTAAA ACTGATCAAC GATACCCAGG GGCACCAGGA AGGCGACCGA 
ATTATAACCC TGTTGGCGAA AGCGATTAAA ACATCGATTC GTAAAAGCGA TTATGCCATT 
CGCCTCGGCG GCGATGAGTT CTGTATTATT CTTGTTGATT ATGCGGCGGA TTTGGCTATC 
CATCTGCCGG AGCGTATTAT TCGTAACCTG CAAATTATCG CACCGGATAA GACAGTCCAT 
TTTTCCGCCG GGATTTATAA TATGCAGCCC AATGATACGA TTAATGATGC CTACCAGGCT 
TCCGATGCGC AGCTCTATCT GAACAAACAG CAAAAACAAC ATCGTTCATC ATAG

Protein sequence

MNLHHKALRH FISASVIVLT SSFLIYELIA SDRAMNAYMR YIMERADSSF LYDKYQNQSI 
AAHLMRTFEA PGDPVTAEKR RAFCDAFEAI NGTHGVNLTR HNYPGLHGTL QTAATQCTDN 
LDDALLLPAF DQAVSINRSQ DDHSHGLGTL ELKFRYYVDL NKHYVYFYDL INSRRFAMHR 
WTFLQKGTMG INRKDIDKLF TGRTVISSIY MDDITQENVM SFLTPVYLAG TLKGIVMVDV 
NQDNLKNIFY TQDRPLVWRY LNVTLKDMDS GKEIIINQSK NNLFQYVNYS HDIPGGLRVS 
LSLDLTYFLV SSWKALAFYL LATALLLNMV RMHFRLYRNV TRENISDAMT GLYNRKILTP 
ELEQRLQRLV NAGTPVTFVA IDCDRLKLIN DTQGHQEGDR IITLLAKAIK TSIRKSDYAI 
RLGGDEFCII LVDYAADLAI HLPERIIRNL QIIAPDKTVH FSAGIYNMQP NDTINDAYQA 
SDAQLYLNKQ QKQHRSS