Gene Emin_1214 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1214
Symbol
ID	6263453
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1312880
End bp	1314370
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	41%
IMG OID	642611692
Product	diguanylate cyclase with GAF sensor
Protein accession	YP_001876101
Protein GI	187251619
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.302028
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0000035245
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTCGGTT TTAATGACAG GCACAGGCCC AAATTGCAGC TTTACCATTT TCATAAAAGG 
CTGAACCAGA CTTTCCAAAA TACAAGCGCC TTGTTAAACC AGGCTTTGCC TTTTATGCAA 
AAAATTTTGG GGCTGGACCG TATTTACTTT TTTAATTGGG AAAAAAACCG CGAGCTTCTT 
TCACTTACCA TGCTTTGCAA AGACGGCTAC TGCATGGACA TGCAGGAAAC TATTTCCTCA 
ACAGGCAAGC AGGAAATCAT GGCTGATCTT CTAGCGAAAG GGTATTCCTT AAAAAGTGAT 
TTAAGCTACC CCGCGATTTA TGTTTTTTTA CAATGGAAGG CGCCCGCCGC TTACGGTAAA 
AACGGCGGCA ACTCCGCCAT GCAGGAAAAG TTTGGCGTGT TAAGGCTTGA ACGTTTTAAC 
AAATCTAAAA AATTTAGTGA AAAAGAAATC AGGTTAATCA AGGGGCTTGT CAGCGAAATT 
TCCCATAATA TGATTAACAC GGAAATAGAT CAGGACAACT CAGAACGCCT TAGGCTTGCC 
ACCACGTTAA ATGATTTAGC CGCGGTGTTT GCTTCTTCCA TGCGTTTTAA CGACGCTATT 
GAAGTTATTT TGCGCGGCGT GCAAAAAACT TTTAAATTTG ACCGTGTAAG AATGTATTTG 
TTTGATTATG AAGGTGCAAA CATACGCGCC TCTTTAAGCA CTGATATAGC GGGCAATGTT 
TCCAGAAGGG ACGGTAATAT TGACCCCGCC GAAATAAAAA ACGTTTCAAA CATGGAAGAG 
TCTTTCAGCT CGCGCGTACT TAACCTGCCG CTTAATGTGC AGGGGAAAAG GGTGGGTATT 
TTAATTTTTG ACAATCTTCT TTCCCGCCGC GATATTACGT ATTTGGATTT TTTGCATGTT 
AAACAGTTTT CCTCCCAAAT CGCGCTGGCG GTTGATAACG CAGTTTTGTT CGAGCGCGTG 
CAGGACCTTT ATAATTATGA CGAACTTACC AAACTGCCCG TAAGAAGGTA TTTTAATGAA 
AAACTGATAG AGGAAATTTA CCGCTCCGAG CGGTTTGAGC TTACAATGTC GGTTATTATT 
TTAGATATTG ACCATTTTAA AACAATTAAC GATACTTTCG GCCACAGTAC GGGCGATATT 
GTTTTAAAAT CCGTAAGCGA TACTATATTA AAAAGTTTAA GACAGACTGA CTTTCCCTGC 
CGCTACGGCG GCGATGAAAT CATGATTATG CTTCCGCGCA CAAGCGGGCA GGAAGCTAAG 
TATACCGCAA GACGTTTATC TGAGGGTATT AAAAAAATCA AAATACCGGA GCAGTACACC 
AACGGACGGG AGTATATCAT TTCAATTACC CAGGGTATAG CAGTGTACCC TCAGGATTCT 
TCAGACGCTA TTGATTTATT TAATAAAGCG GACAGGGCTT TATATTACGC TAAAAACAAA 
GAACGCGGCA CATACGCTCT TTATAATGAA ATACCTCCCG AAAGTAAATA G

Protein sequence

MFGFNDRHRP KLQLYHFHKR LNQTFQNTSA LLNQALPFMQ KILGLDRIYF FNWEKNRELL 
SLTMLCKDGY CMDMQETISS TGKQEIMADL LAKGYSLKSD LSYPAIYVFL QWKAPAAYGK 
NGGNSAMQEK FGVLRLERFN KSKKFSEKEI RLIKGLVSEI SHNMINTEID QDNSERLRLA 
TTLNDLAAVF ASSMRFNDAI EVILRGVQKT FKFDRVRMYL FDYEGANIRA SLSTDIAGNV 
SRRDGNIDPA EIKNVSNMEE SFSSRVLNLP LNVQGKRVGI LIFDNLLSRR DITYLDFLHV 
KQFSSQIALA VDNAVLFERV QDLYNYDELT KLPVRRYFNE KLIEEIYRSE RFELTMSVII 
LDIDHFKTIN DTFGHSTGDI VLKSVSDTIL KSLRQTDFPC RYGGDEIMIM LPRTSGQEAK 
YTARRLSEGI KKIKIPEQYT NGREYIISIT QGIAVYPQDS SDAIDLFNKA DRALYYAKNK 
ERGTYALYNE IPPESK