Gene B21_03330 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03330
Symbol	yhjK
ID	8113425
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3544029
End bp	3545978
Gene Length	1950 bp
Protein Length	649 aa
Translation table	11
GC content	53%
IMG OID	644849505
Product	hypothetical protein
Protein accession	YP_003001078
Protein GI	251786774
COG category	[T] Signal transduction mechanisms
COG ID	[COG2200] FOG: EAL domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGGCAG CCGTTGTCCT GGTGTTCGTT TTTATTTTTT GCACCGTTTT GCTGTTCCAT 
CTGGTCCAGC AGAATCGCTA TAACACGGCT ACGCAACTGG AAAGCATTGC TCGCTCTGTC 
CGCGAACCCT TATCTTCAGC TATTTTGAAA GGCGATATTC CCGAAGCGGA AGCTATTCTT 
GCCAGCATTA AACCGGCAGG CGTGGTCAGC CGTGCCGATG TAGTGCTGCC TAACCAGTTC 
CAGGCGCTGC GTAAAAGTTT TATTCCAGAG CGCCCGGTGC CGGTAATGGT TACTCGCCTG 
TTTGAGCTAC CGGTTCAAAT CTCGCTGGGC GTTTACTCGC TCGAACGTCC GGCAAACCCG 
CAGCCAATTG CCTATCTGGT ACTACAGGCG GATTCCTTCC GTATGTATAA GTTCGTGATG 
AGCACCCTCT CAACGTTAGT GACCATTTAC TTACTTTTGT CGCTTATCCT GACCGTCGCC 
ATCAGCTGGT GCATTAACCG CCTGATTTTG CATCCGTTAC GCAATATTGC TCGCGAACTT 
AACGCCATCC CAGCCAAGGA GCTTGTTGGT CACCAACTGG CATTACCGCG TCTGCATCAG 
GACGATGAAA TCGGTATGTT GGTGCGCAGT TACAACCTCA ACCAGCAATT GCTGCAGCGC 
CATTATGAAG AACAGAACGA AAATGCGATG CGCTTCCCGG TGTCGGATTT GCCGAACAAA 
GCCTTGCTGA TGGAGATGCT GGAGCAGGTT GTCGCGCGTA AACAAACCAC CGCGCTGATG 
ATCATCACCT GTGAAACCCT GCGTGATACT GCGGGCGTGC TGAAAGAGGC GCAACGAGAA 
ATTCTGCTGC TGACGCTGGT GGAAAAACTC AAATCGGTAC TGTCGCCACG TATGATCCTC 
GCGCAGATTA GCGGTTATGA CTTTGCTGTC ATTGCCAACG GTGTACAGGA ACCGTGGCAC 
GCAATCACCT TAGGTCAGCA AGTGCTCACT ATCATGAGCG AGCGCCTGCC GATTGAACGT 
ATTCAACTCC GTCCGCACTG TAGCATTGGC GTGGCGATGT TCTACGGCGA TCTCACCGCC 
GAACAGCTTT ACAGTCGCGC TATTTCTGCG GCATTTACCG CTCGCCATAA AGGCAAGAAT 
CAGATTCAGT TCTTTGATCC GCAGCAGATG GAAGCCGCCC AGAAGCGGTT GACGGAAGAG 
AGCGATATCC TTAATGCACT GGAAAATCAT CAGTTTGCTA TTTGGTTACA GCCACAGGTC 
GAGATGACCA GCGGTAAACT GGTCAGTGCG GAAGTGTTAC TGCGTATCCA GCAACCGGAT 
GGCAGTTGGG ACCTGCCGGA TGGCTTAATC GATCGCATTG AGTGCTGTGG GCTGATGGTT 
ACCGTCGGTC ACTGGGTGCT GGAAGAGTCC TGTCGATTGC TTGCAGCCTG GCAAGAGCGC 
GGCATTATGC TGCCCTTGTC GGTAAACCTC TCTGCGCTGC AACTGATGCA CCCGAATATG 
GTGGCGGATA TGCTGGAACT GTTAACCCGC TATCGCATTC AGCCGGGAAC ACTGATTCTG 
GAAGTGACAG AAAGCCGACG TATTGACGAC CCTCATGCTG CGGTGGCAAT CCTCCGTCCG 
CTGCGCAATG CCGGAGTTCG GGTGGCGCTG GATGATTTCG GCATGGGCTA CGCAGGGCTG 
CGTCAGCTGC AGCATATGAA ATCGTTGCCA ATCGACGTAC TGAAAATCGA CAAAATGTTT 
GTTGAAGGCT TGCCGGGAGA TAGCAGCATG ATTGCTGCAA TTATCATGCT GGCGCAGAGC 
CTGAACTTAC AAATGATTGC CGAAGGCGTG GAGACTGAAG CACAACGCGA CTGGCTGGCA 
AAAGCGGGCG TTGGTATTGC CCAGGGCTTC CTTTTTGCTC GCCCACTCCC TATTGAAATC 
TTCGAAGAGA GTTACCTGGA AGAAAAGTAG

Protein sequence

MVAAVVLVFV FIFCTVLLFH LVQQNRYNTA TQLESIARSV REPLSSAILK GDIPEAEAIL 
ASIKPAGVVS RADVVLPNQF QALRKSFIPE RPVPVMVTRL FELPVQISLG VYSLERPANP 
QPIAYLVLQA DSFRMYKFVM STLSTLVTIY LLLSLILTVA ISWCINRLIL HPLRNIAREL 
NAIPAKELVG HQLALPRLHQ DDEIGMLVRS YNLNQQLLQR HYEEQNENAM RFPVSDLPNK 
ALLMEMLEQV VARKQTTALM IITCETLRDT AGVLKEAQRE ILLLTLVEKL KSVLSPRMIL 
AQISGYDFAV IANGVQEPWH AITLGQQVLT IMSERLPIER IQLRPHCSIG VAMFYGDLTA 
EQLYSRAISA AFTARHKGKN QIQFFDPQQM EAAQKRLTEE SDILNALENH QFAIWLQPQV 
EMTSGKLVSA EVLLRIQQPD GSWDLPDGLI DRIECCGLMV TVGHWVLEES CRLLAAWQER 
GIMLPLSVNL SALQLMHPNM VADMLELLTR YRIQPGTLIL EVTESRRIDD PHAAVAILRP 
LRNAGVRVAL DDFGMGYAGL RQLQHMKSLP IDVLKIDKMF VEGLPGDSSM IAAIIMLAQS 
LNLQMIAEGV ETEAQRDWLA KAGVGIAQGF LFARPLPIEI FEESYLEEK