Gene B21_02457 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02457
Symbol	yfiN
ID	8113939
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	2608105
End bp	2609331
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	49%
IMG OID	644848657
Product	hypothetical protein
Protein accession	YP_003000230
Protein GI	251785926
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.150678
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGGATA ACGATAATTC TCTTAATAAG CGCCCCACGT TTAAAAGAGC ATTACGCAAC 
ATCAGTATCA CCAGCATATT TATCACTATG ATGCTGATCT GGTTGCTGCT TTCCGTGACC 
TCGGTGCTGA CCCTGAAACA GTACGCGCAA AAAAACCTGG CACTGACAGC AGCAACAATG 
ACTTACAGTC TGGAAGCAGC TGTCGTTTTT GCCGATGGCC CTGCAGCAAC TGAAACACTG 
GCAGCGCTGG GCCAGCAAGG GCAATTTTCA ACTGCAGAAG TACGTGATAA GCAGCAAAAT 
ATTCTGGCGT CCTGGCATTA CACCCGTAAG GATCCAGGCG ATACTTTCAG CAATTTCATA 
AGCCACTGGC TCTTCCCCGC CCCCATCATT CAGCCGATTC GTCACAATGG TGAAACCATT 
GGCGAAGTAC GCTTAACCGC TCGCGACAGT TCAATCAGCC ATTTTATCTG GTTTTCGCTC 
GCCGTACTGA CCGGTTGTAT TCTGCTGGCA TCAGGCATCG CAATTACCCT CACCCGCCAT 
TTGCACAATG GCCTGGTGGA AGCACTGAAA AATATCACCG ATGTCGTACA TGATGTGCGT 
TCCAACCGCA ATTTTTCCCG ACGAGTTTCG GAAGAACGTA TCGCTGAGTT TCACCGCTTC 
GCTCTCGACT TCAACAGTCT GCTGGATGAA ATGGAAGAGT GGCAGCTTCG TTTACAGGCT 
AAAAATGCGC AGCTTCTACG TACCGCGCTA CATGACCCAT TAACCGGGCT GGCTAACCGC 
GCAGCGTTTC GTAGCGGCAT CAACACGTTG ATGAACAATT CCGATGCCCG AAAAACGTCG 
GCGTTACTAT TTCTTGATGG CGATAATTTC AAATACATCA ATGATACCTG GGGTCATGCG 
ACGGGCGATA GAGTCTTGAT TGAAATCGCA AAACGGTTAG CTGAAGTTGG CGGGCTGCGA 
CATAAAGCAT ACCGCCTGGG CGGCGATGAA TTCGCTATGG TGCTCTATGA TGTACAGTCA 
GAATCTGAAG TGCAGCAGAT ATGCTCAGCA CTGACACAAA TCTTTAATCT CCCGTTTGAT 
CTTCATAATG GTCATCAGAC CACCATGACA TTAAGCATTG GTTACGCGAT GACCATTGAG 
CACGCCTCTG CGGAAAAATT ACAAGAGCTT GCCGATCACA ATATGTATCA GGCCAAACAC 
CAGCGTGCCG AAAAGCTGGT GAGATAA

Protein sequence

MMDNDNSLNK RPTFKRALRN ISITSIFITM MLIWLLLSVT SVLTLKQYAQ KNLALTAATM 
TYSLEAAVVF ADGPAATETL AALGQQGQFS TAEVRDKQQN ILASWHYTRK DPGDTFSNFI 
SHWLFPAPII QPIRHNGETI GEVRLTARDS SISHFIWFSL AVLTGCILLA SGIAITLTRH 
LHNGLVEALK NITDVVHDVR SNRNFSRRVS EERIAEFHRF ALDFNSLLDE MEEWQLRLQA 
KNAQLLRTAL HDPLTGLANR AAFRSGINTL MNNSDARKTS ALLFLDGDNF KYINDTWGHA 
TGDRVLIEIA KRLAEVGGLR HKAYRLGGDE FAMVLYDVQS ESEVQQICSA LTQIFNLPFD 
LHNGHQTTMT LSIGYAMTIE HASAEKLQEL ADHNMYQAKH QRAEKLVR