Gene B21_02370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02370
Symbol	yfgA
ID	8115912
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	2505520
End bp	2506533
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	54%
IMG OID	644848572
Product	hypothetical protein
Protein accession	YP_003000145
Protein GI	251785841
COG category	[S] Function unknown
COG ID	[COG1426] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACTG AAGCCACGCA CGACCAAAAT GAAGCACTTA CTACCGGCGC TCGCCTGCGT 
AATGCTCGCG AACAACTAGG ACTTAGTCAG CAGGCCGTTG CCGAGCGACT TTGCCTGAAG 
GTTTCCACGG TACGCGACAT TGAAGAAGAT AAGGCACCCG CCGATCTTGC TTCAACATTC 
CTGCGCGGAT ATATCCGCTC TTATGCGCGT CTGGTACATA TTCCAGAAGA AGAACTGCTG 
CCAGGGCTGG AAAAGCAGGC TCCACTTCGG GCTGCAAAAG TTGCGCCGAT GCAGAGTTTT 
TCCCTCGGTA AACGCCGCAA AAAACGCGAC GGCTGGCTGA TGACCTTCAC TTGGCTGGTG 
TTGTTTGTGG TTATCGGCCT GAGCGGTGCC TGGTGGTGGC AAGACCACAA AGCTCAGCAG 
GAAGAGATCA CCACTATGGC CGATCAATCT TCGGCGGAAC TGAGCAGTAA TAGCGAGCAG 
GGGCAGAGTG TTCCATTAAA TACGTCGACA ACTACAGACC CGGCTACAAC GTCCACGCCG 
CCAGCGTCTG TGGATACTAC CGCAACCAAC ACGCAAACAC CTGCCGTAAC TGCGCCAGCA 
CCAGCTGTTG ATCCGCAACA GAATGCGGTT GTTTCGCCTT CGCAGGCAAA TGTTGATACC 
GCCGCGACCC CGGCACCAAC GGCAGCAACA ACGCCAGATG GTGCTGCGCC GTTGCCAACC 
GATCAGGCTG GCGTGACCAC GCCGGTGGCT GATCCGAATG CGCTGGTGAT GAACTTTACT 
GCCGATTGCT GGCTGGAGGT CACTGATGCT ACCGGTAAAA AATTGTTTAG CGGTATGCAG 
CGTAAAGACG GTAATTTGAA CTTAACCGGC CAGGCACCGT ACAAACTGAA AATTGGTGCG 
CCAGCCGCAG TACAGATCCA GTATCAAGGG AAACCTGTCG ATCTGAGTCG TTTTATCAGA 
ACTAACCAGG TTGCGCGTCT GACCCTCAAT GCCGAACAAT CACCGGCGCA GTAA

Protein sequence

MNTEATHDQN EALTTGARLR NAREQLGLSQ QAVAERLCLK VSTVRDIEED KAPADLASTF 
LRGYIRSYAR LVHIPEEELL PGLEKQAPLR AAKVAPMQSF SLGKRRKKRD GWLMTFTWLV 
LFVVIGLSGA WWWQDHKAQQ EEITTMADQS SAELSSNSEQ GQSVPLNTST TTDPATTSTP 
PASVDTTATN TQTPAVTAPA PAVDPQQNAV VSPSQANVDT AATPAPTAAT TPDGAAPLPT 
DQAGVTTPVA DPNALVMNFT ADCWLEVTDA TGKKLFSGMQ RKDGNLNLTG QAPYKLKIGA 
PAAVQIQYQG KPVDLSRFIR TNQVARLTLN AEQSPAQ